全球最大的云計(jì)算實(shí)例:Netflix如何架構(gòu)IT
- 分類(lèi):云計(jì)算
- 發(fā)布于 2013年5月04日
- 作者:Super User
- 點(diǎn)擊數(shù):13811
在線(xiàn)視頻租賃服務(wù)商N(yùn)etflix每月的視頻訪(fǎng)問(wèn)超過(guò)10億次,是全球最大的云計(jì)算實(shí)例。
?
近日在舊金山舉行的Linux基金會(huì)協(xié)作峰會(huì)上,Netflix的云系統(tǒng)架構(gòu)總監(jiān)Cockcroft透露,Netflix的Linux、FreeBSD和各種基于開(kāi)源軟件的服務(wù)都是純粹的“原生云計(jì)算”。
?
Cockcroft之所以這么說(shuō)是因?yàn)殡m然每月的視頻訪(fǎng)問(wèn)量超過(guò)10億次,但Netflix并沒(méi)有自己的數(shù)據(jù)中心,2009年Netflix開(kāi)始使用亞馬遜的AWS云計(jì)算服務(wù),到2012年11月,Netflix把所有IT基礎(chǔ)設(shè)施都轉(zhuǎn)移到了亞馬遜的AWS云端。
?
?
具體來(lái)說(shuō),根據(jù)客戶(hù)需求,Netflix的前端服務(wù)運(yùn)行在500-1000臺(tái)基于Linux的Tomcat JavaServer和NGINX web服務(wù)器上,存儲(chǔ)則采用亞馬遜的S3云存儲(chǔ)和NoSQL Cassandra數(shù)據(jù)庫(kù)服務(wù)器(采用Memcached高性能分布式內(nèi)存對(duì)象緩存系統(tǒng))。所有這些服務(wù)都通過(guò)亞馬遜AWS的三大可用云區(qū)發(fā)布,確保用戶(hù) 無(wú)論使用移動(dòng)設(shè)備還是瀏覽器都能快速瀏覽視頻。
?
Cockcroft透露,如果三個(gè)亞馬遜云區(qū)中的一個(gè)出現(xiàn)故障,Netflix依然可以通過(guò)其余兩個(gè)云區(qū)提供完整的服務(wù)。Cockcroft表示這并不是照搬亞馬遜的廣告詞,而是通過(guò)開(kāi)源軟件Chaos Gorilla對(duì)AWS全局測(cè)試的結(jié)果。
?
實(shí)現(xiàn)云區(qū)間的視頻和服務(wù)的備份并不容易,Netflix目前已經(jīng)有了自己的CDN——Open Connect,并且在本地ISP節(jié)點(diǎn)部署了大量服務(wù)器。但真正困難的問(wèn)題在于當(dāng)一個(gè)云區(qū)出現(xiàn)故障時(shí),如何讓DNS系統(tǒng)將流量及時(shí)指向可用的云區(qū)?眾所周 知,DNS與API有很大的不同,DNS的設(shè)計(jì)原理更多依賴(lài)工程師手動(dòng)配置,因此實(shí)現(xiàn)自動(dòng)化的難度很大。目前Netflix內(nèi)部有一個(gè)技術(shù)計(jì)劃,目標(biāo)不是 如何杜絕云計(jì)算宕機(jī),而是對(duì)云計(jì)算的宕機(jī)過(guò)程變得更加平緩,而不是像斷電一樣突然之間癱瘓,這可以為后繼手段爭(zhēng)取時(shí)間。
?
需要指出的是,Netflix的云計(jì)算架構(gòu)依然存在風(fēng)險(xiǎn),例如2012年12月亞馬遜AWS東岸數(shù)據(jù)中心的負(fù)載均衡故障導(dǎo)致圣誕節(jié)期間Netflix的服務(wù)不可用。
?
雖然Netflix的云計(jì)算架構(gòu)并不完美,但是通過(guò)將IT基礎(chǔ)設(shè)施全部轉(zhuǎn)移至云端,Netflix實(shí)現(xiàn)了IT架構(gòu)的高度敏捷性和可用性:新功能代碼 能在數(shù)天內(nèi)發(fā)布而不是過(guò)去的數(shù)月,在數(shù)分鐘內(nèi)配置并啟用新的硬件而不是過(guò)去的數(shù)周,Netflix在公有云上構(gòu)建了互聯(lián)網(wǎng)上占用帶寬最多的媒體發(fā)布平臺(tái), 并快速成長(zhǎng)為能夠顛覆傳統(tǒng)電視行業(yè)的互聯(lián)網(wǎng)巨頭,這一切,都離不開(kāi)其云計(jì)算架構(gòu)的成功。