全球最大的云計算實例:Netflix如何架構IT
- 分類:云計算
- 發(fā)布于 2013年5月04日 星期六 01:33
- 作者:Super User
- 點擊數:13811
在線視頻租賃服務商Netflix每月的視頻訪問超過10億次,是全球最大的云計算實例。
?
近日在舊金山舉行的Linux基金會協(xié)作峰會上,Netflix的云系統(tǒng)架構總監(jiān)Cockcroft透露,Netflix的Linux、FreeBSD和各種基于開源軟件的服務都是純粹的“原生云計算”。
?
Cockcroft之所以這么說是因為雖然每月的視頻訪問量超過10億次,但Netflix并沒有自己的數據中心,2009年Netflix開始使用亞馬遜的AWS云計算服務,到2012年11月,Netflix把所有IT基礎設施都轉移到了亞馬遜的AWS云端。
?
?
具體來說,根據客戶需求,Netflix的前端服務運行在500-1000臺基于Linux的Tomcat JavaServer和NGINX web服務器上,存儲則采用亞馬遜的S3云存儲和NoSQL Cassandra數據庫服務器(采用Memcached高性能分布式內存對象緩存系統(tǒng))。所有這些服務都通過亞馬遜AWS的三大可用云區(qū)發(fā)布,確保用戶 無論使用移動設備還是瀏覽器都能快速瀏覽視頻。
?
Cockcroft透露,如果三個亞馬遜云區(qū)中的一個出現故障,Netflix依然可以通過其余兩個云區(qū)提供完整的服務。Cockcroft表示這并不是照搬亞馬遜的廣告詞,而是通過開源軟件Chaos Gorilla對AWS全局測試的結果。
?
實現云區(qū)間的視頻和服務的備份并不容易,Netflix目前已經有了自己的CDN——Open Connect,并且在本地ISP節(jié)點部署了大量服務器。但真正困難的問題在于當一個云區(qū)出現故障時,如何讓DNS系統(tǒng)將流量及時指向可用的云區(qū)?眾所周 知,DNS與API有很大的不同,DNS的設計原理更多依賴工程師手動配置,因此實現自動化的難度很大。目前Netflix內部有一個技術計劃,目標不是 如何杜絕云計算宕機,而是對云計算的宕機過程變得更加平緩,而不是像斷電一樣突然之間癱瘓,這可以為后繼手段爭取時間。
?
需要指出的是,Netflix的云計算架構依然存在風險,例如2012年12月亞馬遜AWS東岸數據中心的負載均衡故障導致圣誕節(jié)期間Netflix的服務不可用。
?
雖然Netflix的云計算架構并不完美,但是通過將IT基礎設施全部轉移至云端,Netflix實現了IT架構的高度敏捷性和可用性:新功能代碼 能在數天內發(fā)布而不是過去的數月,在數分鐘內配置并啟用新的硬件而不是過去的數周,Netflix在公有云上構建了互聯網上占用帶寬最多的媒體發(fā)布平臺, 并快速成長為能夠顛覆傳統(tǒng)電視行業(yè)的互聯網巨頭,這一切,都離不開其云計算架構的成功。