Open Compute Project

Facebook'un 7 Nisan 2011'de duyurduğu Open Compute Project: Prineville veri merkezi, özel sunucu tasarımları, 277V güç dağıtımı, PUE 1.07 iddiası ve hyperscale donanım pazarına etkisi.

Bu yazıyı bugün, 7 Nisan 2011 sabahı yazıyorum. Birkaç saat önce Facebook, Palo Alto’daki merkezinde basın toplantısı düzenledi ve aylardır söylentisi yapılan Open Compute Project’i resmen duyurdu. Mark Zuckerberg ve Jonathan Heiliger sahneye çıktı; Oregon eyaletindeki Prineville veri merkezinin tasarımını, kullandıkları özel sunucu donanımını ve bu donanımın spesifikasyonlarını kamuya açıyoruz dediler. Sektör olarak son birkaç yılda gördüğüm en cesur hamlelerden biri.

Önce Hikâye: Prineville Veri Merkezi

Facebook’un bugüne kadar kullandığı veri merkezleri, başkaları tarafından inşa edilmiş, kiralanmış tesislerdi (Santa Clara, Ashburn vb.). Prineville ise tamamen kendi tasarımları olan ilk veri merkezi. İnşaata 2010 başında başlandı; bugün ilk fazı operasyona aldıklarını duyurdular.

Açıklanan rakamlar şaşırtıcı:

  • PUE (Power Usage Effectiveness): 1.07. Endüstri ortalaması 1.5 civarında. 1.07 demek, BT ekipmanına giden her 1 Watt için soğutma ve dağıtıma yaklaşık 0.07 Watt harcanıyor demek. Google’ın açıkladığı 1.12’lik rakamın bile altında.
  • Su soğutması yok. Prineville iklimi sayesinde dış havayla doğrudan soğutma (free cooling) uygulanmış; sıcak günlerde evaporatif soğutma devreye giriyor.
  • 480V AC dağıtımıyla başlayan güç hattı, sunucu raflarına 277V AC ile geliyor. Geleneksel 208V dağıtıma kıyasla dönüşüm kayıpları belirgin biçimde azaltılmış.

Bu rakamlar tek başına etkileyici, ancak asıl haber bunlar değil. Asıl haber, tüm bu tasarımların açık spesifikasyon olarak yayımlanması.

Açılan Tasarımlar

Bugün opencompute.org üzerinden indirilebilir hale gelen dökümanlar şunları içeriyor:

Sunucu Tasarımı

  • 1.5U şasi: Standart 1U yerine biraz daha yüksek; bu sayede daha büyük ve daha verimli soğutucular kullanılabiliyor, fanlar düşük devirde çalışıp daha az enerji tüketiyor.
  • Vanity-free chassis: Ön panel, plastik kapak, marka logosu, hiçbiri yok. Sadece açık metal şasi. Tasarımdaki tek kıstas: hava akışı ve servis edilebilirlik.
  • İki ayrı anakart varyantı: Bir Intel (Xeon 5500/5600 serisi), bir AMD (Opteron 6100). Her ikisinde de fan sayısı azaltılmış (sadece 4 adet 60mm fan), VRM sayısı düşürülmüş.
  • Güç beslemesi: 277V AC girişli, %94.5 verimliliğe ulaşan özel PSU. Tek 12V çıkışı, gereksiz hatlar kaldırılmış.
  • Batarya yedeklemesi: Geleneksel UPS yerine her rafa entegre 48V DC batarya kabini. UPS dönüşüm kayıpları (AC-DC-AC) ortadan kalkıyor.

Rak ve Triplet Tasarımı

Üç adet 42U raf, bir koridor düzeninde “triplet” olarak konumlandırılıyor. Bataryalar bu üçlünün ortasında konumlanmış. Soğuk koridor / sıcak koridor ayrımı sıkı şekilde uygulanmış.

Neden Önemli?

Donanım dünyası uzun süredir kapalı bir oyun olarak işliyor. Dell, HP ve IBM gibi OEM’ler, Intel ve AMD ile yıllar içinde sıkışmış referans tasarımlar üzerinden ürettikleri sunucuları satıyorlar. Yıllar içinde uniform olmuş bu pazarda her büyük üretici, neredeyse aynı özellikteki kutuları farklı plastik kapaklarla satıyor.

Facebook’un yaptığı şey, hyperscale operatörler arasında zaten yapılan bir şeyi kamuoyuna açmak. Google’ın kendi sunucu ve veri merkezi tasarımı olduğunu yıllardır biliyoruz; ama Google asla bunları yayımlamadı. Amazon’un EC2 altyapısının ne tür donanımdan oluştuğu da büyük ölçüde sır. Facebook bu noktada farklı davranıyor.

Yayımlanan tasarımları herkes kullanabilir, üzerine ekleyebilir, üreticilere bu tasarımlara göre üretim yaptırabilir. Bu, donanım için açık kaynak anlamına geliyor.

Etkiler ve Beklentiler

Geleneksel OEM’ler İçin

Dell, HP ve IBM açısından bu duyuru rahatsız edici. Bilhassa hyperscale müşterilerinin (sosyal medya devleri, büyük hosting sağlayıcılar, telekom operatörleri) artık tedarikçilerine “Open Compute spesifikasyonlarını üretebiliyor musunuz?” demesi an meselesi. Dell’in zaten DCS (Data Center Solutions) birimi var ve özelleşmiş sunucular üretiyor; OCP, bu işin standartlaşmasını hızlandıracak.

HP tarafında ise SL serisinin pazarlaması daha agresifleşecek gibi görünüyor. IBM ise farklı bir noktada, IBM iX, hâlâ büyük markalı sunucu satmaya devam ediyor ama hyperscale tarafından erken bir çıkış yapabilir.

Komponent Üreticileri İçin

Asıl kazananlar Quanta, Wistron, Tyan, Supermicro gibi ODM’ler olabilir. Facebook’un mevcut sunucularını da büyük olasılıkla bu ekosistem üretti. OCP’nin getirdiği standartlaşma, bu üreticilerin doğrudan son müşteriye satış yapmasını kolaylaştıracak.

Veri Merkezi Tasarımcıları İçin

277V dağıtım, UPS yerine raf seviyesinde batarya, sıcak/soğuk koridor disiplini, evaporatif soğutma, bunlar yeni fikirler değil; ama bir bütün halinde, çalıştığı kanıtlanmış bir referans olarak yayımlanmış halleri çok değerli. Türkiye’deki yeni nesil veri merkezi yatırımlarında (Telekom, TTNET, Turkcell tarafında) bu tasarımların etkisi önümüzdeki 12–24 ayda görülmeye başlanır.

Bulut Servis Sağlayıcıları İçin

Rackspace, GoGrid, Joyent gibi sağlayıcılar açısından OCP, marj denkleminin yeniden yazılması demek. Aynı donanım performansını %20–30 daha düşük TCO ile sağlayabiliyorlarsa, public cloud fiyatlamasındaki düşüş trendinin (Amazon’un her birkaç ayda bir yaptığı indirimleri hatırlayın) önümüzdeki dönemde de süreceğini söylemek zor olmayacak.

Birkaç Kritik Soru

Tabii bu duyurunun tartışmalı yönleri de var:

  • Servis ve destek: OCP donanımı satın alan bir kurumsal müşteri, “bu sunucu çalışmıyor” dediğinde kime sahip olacak? Hyperscale müşteriler kendi donanımlarına kendileri bakıyor; ama orta ölçekli bir operatör için bu garantili değil.
  • Uyumluluk: Geleneksel veri merkezi 208V altyapısına 277V sunucular doğrudan takılmıyor. Mevcut yatırımlar için OCP, ancak yeni veri merkezi inşa eden ya da büyük bir yenileme yapan için anlamlı.
  • Topluluk yönetişimi: Açık kaynak yazılım dünyasında topluluk yönetişimi (Apache, Eclipse, Linux Foundation) yıllar içinde olgunlaştı. Donanım tarafında bu daha yeni. OCP’nin Apache benzeri bir vakfa devredilmesi gerekecektir; Facebook tek başına yönetirse projenin uzun vadeli güvenilirliği sorgulanır.

Türkiye’den Görünüş

Türkiye’de hyperscale sınıfı bir operatör henüz yok. Ancak büyük telekomların ve bulut sağlayıcılarının önümüzdeki yıllarda yapacağı yatırımlarda OCP’nin tasarım prensiplerini görmeyi bekliyorum. PUE 1.07 hayal olabilir (iklim koşulları nedeniyle), ama 1.3 altına çekmek için sunucu seviyesinde alınabilecek dersler çok.

Kapanış

Bugün yapılan duyuru, yarının veri merkezlerini bugünkünden çok farklı bir noktaya getirecek. “Donanım için açık kaynak” tartışması artık akademik bir konu değil; çalışan bir referansı ve onu destekleyen büyük bir oyuncusu var. Önümüzdeki aylarda kimin OCP’ye katılacağını izlemek, oyunun gidişatını okumak için en hızlı yol olacak. Ben opencompute.org’u bookmark’ladım ve dökümanları inceleyeceğim, siz de göz atmanızı tavsiye ederim.