1. 程式人生 > >彈性計算平臺技術:雲服務器“安全”“穩定”“彈性”的基石

彈性計算平臺技術:雲服務器“安全”“穩定”“彈性”的基石

blog 分享 每天 梳理 復制 阿裏雲 log 硬件 ofo

摘要: 2018杭州雲棲大會,彈性計算平臺技術專場精彩回顧

9月19日上午9點,杭州雲棲小鎮E1-3會場,2018年杭州雲棲大會彈性計算平臺技術專場拉開帷幕。
技術分享圖片

彈性計算系列產品是雲時代的基石產品之一,一直備受外界關註。作為彈性計算團隊在本屆雲棲大會的開場大戲,平臺技術專場吸引了超過200位與會嘉賓,現場座無虛席。為了讓更多的朋友快速了解這場技術盛宴,小編現在帶你快速回顧一下專場的精彩片段。

全場景覆蓋,面向未來的彈性計算

首先,阿裏雲研究員,彈性計算負責人余鋒,做了精彩的開場演講。余鋒說,阿裏雲彈性計算團隊的服務能力正在從中小企業客戶到大型企業全計算場景覆蓋的方向演進,不但覆蓋通用CPU場景,也有GPU,FPGA等等異構場景,另外彈性計算團隊也在存儲,網絡等方面不斷擴展能力邊界。

技術分享圖片

此外,團隊正在持續打磨產品的穩定性和服務質量,在企業生態配接上做出努力。彈性計算團隊正在通過強化對於硬件服務器的管控能力,對操作系統的定制能力,和對故障隔離能力等等多個維度提升客戶對穩定性的體驗,宕機率大大降低,在業界遙遙領先。

另外,彈性計算團隊也正在通過彈性容器實例,為用戶提供更輕,更快,秒級計費,同時兼顧安全和生態的全新服務,為更多的客戶量身打造更高性價比,更合適的計算服務。

深入合作,一起探討雲計算的未來

來自英特爾開源技術中心的網絡與存儲研發經理王慶先生首先帶來議題:關於當代雲計算的方向展望。將雲計算和通信,人工智能,邊緣計算等等熱點領域的關系進行了深入梳理,並挖掘了相關的技術方向。

技術分享圖片

明星產品,重磅發布

隨後,阿裏雲高級產品專家倪波,代表彈性計算團隊帶來了最新的產品更新。在塊存儲產品領域,倪波宣布IOPS達到百萬級的全新一代超高性能雲盤ESSD即將全面商業化。

同時,作為新一代異構計算的代表產品,最新的GN6V和F3實例正在全面商業化推進中。GN6V實例搭載NVIDIA Volta架構的Tesla V100計算卡,相對於上一代產品可以提供12倍的運算能力提升。而基於阿裏雲FaaS(FPGA as a service)舜天平臺的F3實例對比上一代產品,邏輯容量增加4倍,DSP能力提升8倍。

技術分享圖片

議題還介紹了無限制T5實例,該實例可以在傳統T5實例積分耗完後,讓用戶能夠繼續按需使用付費,從而保持計算性能的持續性。

該議題的最後,彈性計算團隊重磅發布了彈性容器實例ECI (Elastic Container Instance)。ECI作為彈性計算在Severless領域的創新產品,具備以下四大特點:極速交付,極小資源,全面兼容K8S,用戶只需專註業務。

保持和學術界的無縫對接

彈性計算團隊一直和學術界保持無縫對接,對於新技術,新理論一直高度關註。論壇也邀請了華南理工大學的林偉偉教授,詳細分享了“面向異構雲服務器的能耗模型和能耗測算系統研究”的議題。

技術分享圖片

該技術在應用後,可以作為雲服務器的功耗測算工具,為新服務器功耗模型提供評測功能,也可以為服務器能耗優化調度提供技術支撐和基礎平臺。同時,基於功耗模型可以給出峰值能效感知的虛擬機調度策略,並以此作為調度的參考信息之一,可以實現對雲數據中心更為有效的節能調度。

雲服務器測試怎麽做到有意義?

阿裏雲高級技術專家錢超,分享了“怎樣有意義地測試雲服務器性能”。

技術分享圖片

錢超從多個角度和指標來闡述了性能測試。錢超指出性能,穩定,時延是互相影響的,脫離另兩個只講其一是不全面的。同時在測試時,需要結合客觀條件來對比結果(比如CPU是否PIN住,操作系統的影響等等)。議題客觀,實用,現場觀眾反應熱烈。

彈性計算的極致穩定

接著性能測試的議題,阿裏雲高級技術專家鄭旭東分享了關於產品穩定性的議題:“數據,智能,驅動ECS極致穩定”。議題從智能異常調度,健康巡檢,強大的分析和預測系統等角度,全面立體地呈現了彈性計算團隊在達到極致穩定性上所做的努力。
技術分享圖片

彈性計算團隊借助阿裏巴巴強大的基礎設施,重構建立了覆蓋全生命周期,全鏈路,全類型的4大類,11小類,同時具有上千項監控細節的監控系統,每天光監控數據都有幾十TB。另外,利用人工智能技術做出精準預測,幫助快速發現業務異常和系統隱患。彈性計算正在利用數據,智能,異常調度,客戶側運維形成強大的閉環,隨著閉環上數據的積累,可以真正將穩定性做到極致。

首次揭秘:彈性計算調度系統 - 後羿

隨後,彈性計算首席架構師,阿裏雲資深技術專家蔡俊傑,和阿裏雲高級技術專家徐海弘共同為來賓解密了彈性計算的幕後英雄 – 後羿調度系統。
技術分享圖片

議題指出,彈性計算調度系統正在從穩定性,性能,成本,和彈性四個方面影響產品。彈性計算調度系統需要管理全球50多個區域的資源,單可用區可以在3分鐘內創建一千個以上的虛擬機,每天需要管理的虛擬機數量是在百萬級別的。另外,調度系統不僅僅是虛擬機的調度,甚至還包括服務器的采購,機房規劃,資源的使用分配都會被納入閉環,端到端地實現產業優化。
技術分享圖片

議題還揭秘了彈性計算調度系統的三大層次,和四大核心組件,並且從場景角度切入進行了詳細立體的剖析。

主動運維:賦能業務永續

阿裏雲高級產品專家張鵬程帶來了關於主動運維的議題。
技術分享圖片

議題強調,基於ECS主動運維能力,用戶從高可用架構設計開始,將主動運維的思想貫穿於各個基礎運維環節。借助雲助手、彈性伸縮、系統事件等服務和功能實現開放、彈性、透明體驗,建立適合自身業務規模和技術路線的主動運維體系,賦能業務永續運行。

資源編排,彈性伸縮,帶來高可用和低成本

最後,阿裏雲資深技術專家田濤濤帶來議題:基於資源編排和彈性伸縮構建高可用低成本的應用。

技術分享圖片
田濤濤詳細介紹了資源編排的使用場景。使用資源編排,實現自動化復制和交付,可以讓基礎設施更加高可用。結合彈性伸縮,自動保障業務的永續性和可靠性。另外結合搶占式實例和停機不收費模式,切實實現成本和彈性需求的完美結合。

阿裏雲彈性計算團隊,讓計算無處不在。

原文鏈接

本文為雲棲社區原創內容,未經允許不得轉載。

彈性計算平臺技術:雲服務器“安全”“穩定”“彈性”的基石