4月9日,騰訊云宣布成立“星星海實驗室”,這是騰訊歷史上首個硬件工程實驗室。官方稱,成立星星海實驗室是騰訊云面向產業互聯網加速技術自研的重要戰略,也是騰訊在自研之路上邁出的堅實一步,代表著騰訊對外技術輸出進入新階段。
星星海取名自青海省果洛藏族自治州瑪多星星海,以水為名,寓意靈動與智慧。老子有云,“水利萬物而不爭”。騰訊云所希望實現的,正是借助于在云原生的先天條件,發揮軟硬件一體化的技術優勢,廣泛聯合服務器產業生態伙伴,為客戶提供更適配云計算場景的服務器方案。
有人可能會好奇,騰訊云為什么會想到自研服務器?自研服務器與市場銷售的工業標準服務器有哪些不同?對于使用云的用戶來說,這種自研服務器的優勢在何處?在解答這些問題之前,我們來看看傳統服務器市場的狀況。
從采購到自研:互聯網大廠服務器需求的變遷
x86服務器成為市場主流也不過就是2000年之后的事情,在此之前的服務器市場更多是小型機的天下,性能高、售價貴、運維成本高也是小型機的典型問題。不過隨著x86服務器在性能和通用性上的逐步提升,市場越來越多成為了通用服務器的天下。
不過那時候的服務器更多是采用了服務器廠商官方標準設計,尤其是許多品牌淪為了標準服務器的“中間商”,靠著賺差價實現盈利,因此這種行為也被形象的稱為“搬箱子”。
當然這并非是行業常態。在搬過一段箱子之后,勤勞聰慧的中國人更可以從其中摸索出自己的生存之道。所以從2005年開始,許多國產服務器廠商也就開始走向了自研之路,從最初的外觀、散熱設計到后來的布局走線與局部模塊化,最終也實現了服務器的自主設計。
但是這種設計依然是基于工業標準服務器所存在的,也是行業“萬金油”。在任何行業、任何應用領域當中,主流的2U2P服務器都充當了“開路先鋒”的作用,也在客觀上推動了服務器市場進一步發展。
但是這種推動力并不是無窮無盡的。
慢慢大家發現,雖然這種服務器具備廣泛的適應性,但是業務發展瞬息萬變的云計算時代,顯得過于“笨重”。因此,最先云化、使用服務器數量最多的互聯網行業率先提出了服務器定制化的思路,并從外觀到配置提供了專門化的需求。但是對于服務器廠商來說,這種變化是致命的,無論是昂貴的前期開模費還是后續的運維成本,都是對硬實力的考驗,因此能夠響應這種需求的廠商屈指可數。
由此也催動了互聯網用戶自主研發服務器的進程。大約從2012年開始,以BAT為代表的多家互聯網大廠也開始著手研發適合自身業務需求與發展的服務器。說到底,這些企業選擇自研服務器,無非就是基于兩大理由——性能與靈活性。
咱們先來說性能。對于普通用戶來說,可能十幾上百臺服務器就是應用的極限了,但是互聯網大廠的服務器動輒就是上萬甚至幾十萬臺,因此每臺性能的略微降低累積起來都是一個不得了的數字。更重要的是,由于互聯網應用的特殊性,相當一部分新采購的服務器都要進行針對性的優化,或者需要進行部分配件的調整與革新,也就需要投入大量的人力、精力和財力,造成資源的浪費。
在上個月發布的騰訊財報中,騰訊云2019年全年營收超過170億元,付費客戶數突破100萬。面對如此巨大的業務量和用戶規模,自研服務器毫無疑問可以讓騰訊云降低計算力的單位成本,并進而將這種成本紅利釋放給數百萬的云上用戶。
靈活性更是大廠們所看重的。我們經常會看到某個上架App下載火爆,緊急擴容的新聞,這背后則代表了成千上萬臺服務器的投入。但是往往這個時候,傳統的服務器廠商需要漫長的響應時間和制造流程,難以快速滿足需求。同時,面對瞬息萬變的市場需求,服務器自身也需要進行針對性的設計,而這自然并非是傳統企業的特長。
基于上述考慮,互聯網大廠們更愿意結合自身需求,開發有針對性的服務器——那些需要性能的業務,就定制高規格的處理器和加速卡;那些負載高的數據庫應用,就選擇大容量內存;那些視頻業務流,則需要對網絡的進一步優化……用特性的服務器滿足特殊應用,不知不覺就成為了互聯網大廠們在長期實踐中得出的共識。
騰訊云發力自研服務器:云原生與軟硬一體化
自研服務器的路沒有錯,但是如何判定自研服務器的核心差異所在?是更低的成本、更適合的應用環境還是更靈活的升級潛力?都不是。至少在騰訊云看來,這些特性或許都很重要,但是面對云計算時代,自研服務器首先應該具備的,是基于云原生的軟硬一體化能力。
在互聯網高度發展的今天,你可以隨時隨地掏出手機與家人們微信視頻聊天,分享生活的點點滴滴;也可以在閑暇時分邀三五位好友云端開黑,玩一盤《王者榮耀》;甚至你餓了叫外賣、出行訂酒店等等日常行為,背后都有騰訊云在支持。
這些你意識不到的行為每天也產生和海量的數據,更對后端數據中心提出了巨大的數據處理和存儲壓力,也就必然需要強大服務器的支持。而這種強大所代表的,不僅僅是面向應用的優化或者針對業務的加速,而是基于云原生環境的“天生強大”。
騰訊公司副總裁、騰訊云總裁邱躍鵬
這種“強大”在騰訊云看來,關鍵詞就是云原生和軟硬一體化。在去年的騰訊開發者大會上,騰訊公司副總裁、騰訊云總裁邱躍鵬就詳述闡述過“軟硬件一體化”的優勢。在他看來,軟硬件一體化技術能夠為開發者提供更強壯的基礎設施平臺,提升云計算的性能、提高資源利用率,最終為開發者提供穩定、更具性價比的服務。
為什么軟硬件一體化如此重要?這還要從服務器本身的設計說起。一直以來,服務器都只是一個硬件設備,它必須借助于操作系統和軟件才能夠實現,而為了能夠運行更多的軟件,許多客戶在購買服務器的時候還需要關注它的支持列表,不在列表范圍內的設備不能夠支持。很顯然,這是已經不能滿足當下云服務的需求。
也正是在騰訊開發者大會上,騰訊云發布了首款深度自研的服務器。作為迎合云計算場景的服務器產品,這款服務器自帶的“云原生”屬性就是針對虛擬化和容器等應用的高度適應性,這也恰恰是當下最主流的云平臺基礎。不僅如此,星星海服務器還在計算資源管理、云監控、熱遷移等方面進行了軟硬件一體化自動管理,使得管理者在運維方面不必再耗費更多的時間與精力。
在性能上,這款服務器也可以實現對應云服務實例星星海SA2云服務器綜合性能提升35%,其中視頻處理速度提升40%,圖形轉碼得分提升35%,Web服務頁面QPS提升高達152%。先進的熱虹吸管散熱技術實現最大負載能效對比業界可提高50%。同時,服務器具備的多CPU核心、超大緩存的特性,能夠支持超大規格云主機實例,單臺云主機性能峰值能夠達到百萬級QPS。
軟硬一體化優勢盡顯。
星星海SA2云服務器,從自研業務適配到逐步開放
得益于云原生業務的特性,騰訊云首款自研服務器能夠有效滿足騰訊云98%應用場景需求。而自發布以來,星星海SA2云服務器已經經歷了半年的內部業務應用。
年初,突如其來的新冠疫情席卷全球,也讓在家辦公成為了許多企業的必然選擇,由此也推動了協同辦公的增長。
騰訊會議的應用需求也激增,系統面臨滿載的風險。為此,從1月29日開始到2月6日,騰訊會議日均擴容云主機接近1.5萬臺,8天總共擴容超過10萬臺云主機,共涉及超百萬核的計算資源投入。鮮為人知的是,本次騰訊會議擴容的100萬核服務器資源全部由騰訊云星星海SA2云服務器提供支撐。
由于在軟硬件系統上進行了自主研發設計外,還在芯片等關鍵部件上與供應鏈企業進行了深度定制,有效提升了在硬件質量驗收、云化適配和故障檢測修復等環節的效率,進而也提升了騰訊云大規模計算資源的調度效率。由此,騰訊會議能夠實現單日高達五十萬核計算資源的快速擴容。
這也是自去年發布以來,星星海SA2云服務器首次承擔如此大規模的計算資源保障任務。雖然初出茅廬,但很顯然星星海SA2云服務器完全應對了考驗,并交出了令人滿意的答卷。
事實上不僅僅是騰訊會議,包括大家熟悉的微信、QQ等核心業務,也包括視頻轉碼、廣告檢索等多個模塊中,星星海SA2云服務器都發揮了關鍵性的作用,也表現出了亮眼的性能。
基于微信業務的測試顯示,采用星星海SA2云服務器能使其業務吞吐能力提升230%以上;在視頻轉碼性能測試中,其性能也提升了200%;廣告檢索業務中使用星星海SA2云服務器也可明顯降低檢索延時。除了騰訊會議,在騰訊教育的遠程課堂業務中,騰訊云也采用了星星海SA2云服務器,支撐了全國數千萬師生的在線教學。
如果說當初走上自研服務器之路是騰訊基于業務進行業務決策,那么現在騰訊云采用星星海SA2云服務器進行服務則是將多年來騰訊在產品、技術上的積累特別是對互聯網應用的理解釋放出來,助力更多騰訊云的客戶,讓更多的人體驗到云時代帶來的便利與高效,加速客戶業務發展和數字化轉型。
后記:2018年,我參觀了騰訊位于天津濱海的數據中心,這也是騰訊在北方區最大的數據中心,單數據中心服務器容量突破了十萬臺。其實作為與我們生活最密切的互聯網廠商,騰訊軟件、騰訊游戲我們每個人都在用,但是我們不知道的是在這個背后,騰訊云為了保障我們應用的流暢性、穩定性,也進行了無數的自研工作。
自研服務器只是騰訊云自研的冰山一角。從自研服務器到自研數據中心,再到自研云端軟件,騰訊云已經在云計算技術自研領域進行了廣泛布局。在數字化時代,IT技術特別是計算力已經成為了推動社會發展的源動力,而騰訊云所實現的,自然也是加速社會計算力的應用和普及,從而讓每個人都感受到云計算時代的便捷與幸福。