經過近十年發展,云原生的火熱不只停留在概念上,而是已成為數字基建的必需品。Gartner的一份報告顯示:到 2025 年,云原生平臺將成為超過 95% 的新數字計劃的基礎——高于 2021 年的不到 40%。這說明,云原生正在引領全球技術趨勢,而KubeSphere已成為云原生的基石!
為什么說KubeSphere是云原生基石?
問題是,什么是云原生?云原生要經歷哪些關鍵階段?當前,企業的云原生發展到了何種程度?青云QingCloud容器平臺資深產品經理于爽,在QKCP3.2產品升級發布之際,進行了詳細解讀。
大概從2013年開始,“云原生”這三個字被首次提出,要求企業的應用從設計之初就要考慮到云的環境,應用程序要運行在云中,而不是傳統的數據中心,要能夠充分利用和發揮云的彈性。說白了,真正的云原生要生于云、長于云、用于云。
云原生,為企業業務帶來了更大的彈性,但也存在諸多挑戰。如果,我們打開CNCF官網看全景圖,就會發現云原生正面臨和安卓手機一樣的問題——碎片化。比如:只在監控和日志領域,就有很多解決方案和工具,IT團隊可能沒有足夠精力按需運維,而KubeSphere從底層統一了架構標準,具有與生俱來的業務封裝性,可以自然屏蔽應用的碎片化問題。
至于KubeSphere和QKCP到底是怎樣一種關系?于爽給出了一個形象的比喻!在他看來,就像在家里自己做火鍋,想吃什么就買什么食材,想怎么吃就怎么吃,KubeSphere能靈活地把各種業務組裝在一個產品里,讓用戶直接忽視底層資源的復雜性問題,滿足用戶需求。但是,很多企業用戶會認為很麻煩,想一步到位,獲得類似于“海底撈”式服務,那么QKCP就能在各個環節提供可靠服務。
此種背景下,青云推出了QKCP 3.2版本升級,最根本目的是希望通過更多加強、進化的功能,助力用戶全面擁抱云原生。也許一個DBA不懂K8s,但是有了QKCP,他可以基于他熟悉的MySQL管理環境進行操作,剩下的底層問題,都由QKCP平臺本身來解決。
青云云原生團隊產品開發的初衷是,將云原生能力借助一個產品化的形態給到終端客戶。最開始,青云以公有云形式上線了 K8s 服務,逐漸發現不同用戶使用 K8s 集群遇到的問題都大同小異,比如:K8s 之上怎么做監控、怎么做 DevOps 等,于是開始從總結、收集、解決問題的角度入手,打造更具競爭力的產品。2018年,為了實現在Kubernetes 之上構建面向云原生應用的分布式操作系統,KubeSphere橫空出世。
KubeSphere沒有改變底層的 K8s,任何 K8s 社區用戶都可以無縫接入到KubeSphere。開源的KubeSphere憑借原生性確保了其與社區相連的緊密性,被很多團隊參考、學習甚至直接拿去使用。KubeSphere 為整個開源社區的累積貢獻數量達到240多個,很多志愿者現在依然活躍在社區里。青云容器在很多企業的關注度和使用量一下大幅上升,有近千家企業在使用KubeSphere構建 K8s 集群,支撐與管理其核心業務,有大約7.5萬個集群及其生態環境是由KubeSphere做支撐。
站在企業用戶的角度,KubeSphere已經很好,但青云并不滿足于此,盡管很多社區用戶能輕松玩轉KubeSphere,但對于很多傳統企業來說,其實并不知道如何擁抱云原生路線,并且不同行業有不同訴求,而云原生只是一個手段,還有太多可提升空間。
而QKCP就是KubeSphere的“伴生物”,她像“sidecar”一樣伴隨著KubeSphere,和KubeSphere成為互為最重要的能量來源之一。QKCP在能力上完全復刻了 KubeSphere 既有的各種功能,同時結合很多業務場景、青云的其他產品,以及各個領域合作伙伴進行延展與拓寬,為企業提供滿足不同場景、不同行業所需的能力和方案,包括青云售前團隊、售后團隊提供的軟能力,也都融合在QKCP里。
比如:從戰略規劃的角度看,云原生的第一步該怎么走?企業客戶面臨的最真實訴求是,不單純把一個打包好的KubeSphere丟給企業就可以了,青云必須進入到企業,了解其真實業務,然后再借助容器產品以及青云的其他能力,一步步給出相應的規劃。拿DevOps來說,市場上有很多工具與實現方法,哪些更適合企業業務現狀?微服務、函數計算及代碼,都不能只拿出一套理論,或者給一套工具就能解決,青云希望借助QKCP以及更多能力,針對不同的行業、不同企業給出一套適合的云原生實踐規劃。
尤其,對于一些創業公司來說,前期需要快速迭代,業務急需上線,QKCP不僅能夠全面滿足需求,降低硬件采購成本,還免去了人力成本,省去了學習過程。同時,QKCP也適用一些大企業,這類企業一般組織關系錯綜復雜,團隊業務比較多,并且每條業務線都有自己的一套理論與標準,每個團隊又都有自己的業務訴求和技術主張,讓所有人都通過一個技術棧使用一套技術標準,也不太現實,而QKCP能從業務角度考慮問題,全面實現業務價值的提升。
QKCP 相比 KubeSphere 還有一些功能上的提升。比如:會有基于新形態、新架構的芯片支持,國產化操作系統的支持等等。社區版本的KubeSphere僅提供了核心組件的項目,客戶可以基于 ARM 架構安裝KubeSphere,但如果想用DevOps組件、微服務組件等,其實無法通過社區版的KubeSphere產品獲得這個能力,需要自己打包代碼,兼容 ARM 芯片和國產芯片。但在 QKCP 里,青云可提供全程全量的支持。
另外,QKCP還有多集群管理能力。不管用戶把K8s 集群放在不同的云上,QKCP 都可以在一個控制平面上統一管理,實現整個平臺的調度,包括可以實現GPU層面的管理調度。
值得一提的是,QKCP 不僅單純地把K8s 管理起來,還實現了與青云更多產品的整合,包括數據庫、中間件、低代碼平臺、云管平臺等。為什么要把數據庫和中間件統一納管起來?其實也是和企業業務訴求相關!云原生客戶不僅關心K8s本身能力如何,還要能滿足數據庫、中間件業務對接需求,如何讓這些應用在K8s環境中跑起來,并穩定、強大、靈活地管理起來,都是用戶選型的關鍵點。
QKCP 3.2版帶來哪些核心能力?
問題是,在QKCP 3.2新版里,青云到底提供了什么樣的管理能力呢?
總結下來,QKCP 3.2版本有三大主要更新。
第一, 更易用的GPU管理。原生的開源平臺KubeSphere 提供了自定義監控面板,如果用戶想拿到GPU數據,需要先部署GPU模板,然后自己配想要的監控頁面。雖然比較靈活,可以按訴求自配,但其實企業客戶不需要這么靈活。QKCP 優化過后,在集群監控數據里就可以看到 GPU 使用大屏,即在首頁就可以看到使用情況。
第二, 更強大的通知管理。在通知配置里,QKCP 支持不同的通知媒介,比如釘釘、郵件、微信等,底下有一個菜單叫“通知歷史”。如果配置好了微信或者釘釘之后,可以看站在平臺視角統一管理發出去的所有通知。
第三, 深入到云原生 DBaaS領域給DBA提供強大的管理功能。新版QKCP集成了三個數據庫:MySQL、PostgreSQL 和 ClickHouse。以MySQL為例,用戶進入界面可以直接點擊、部署,然后通過可視化的方式配置 MySQL 的各種數據庫特性的指標。部署完以后,用戶可以直接在 QKCP 界面里管理自己的數據庫業務。通過MySQL專有的監控指標,可以快速創建 MySQL 的賬戶并授予相應的權限,這是DBA非常喜歡的一個功能。不用跳出QKCP子平臺,就可以更改各種MySQL的參數。
QKCP 將在更多場景上持續優化。比如,提供跨基礎設施的、統一視角的多集群監控大屏,業界也有些人叫駕駛艙。具體到業務層面,比如:跑一個應用,可以直接創建相應的 GPU 工作負載,就可以跑一些類似 TensorFlow 這種 AI 類、大數據類的任務,然后調用業務,直接可以看到相應的資源使用情況,也可以管理這些資源。比如:在某個 GPU 節點上,用戶可以在監控里直接看到 GPU 的顯存用量、溫度、用電功率等。
如前文所述,盡管QKCP平臺變得越來越強大,但并不代表青云只簡單提供一款產品,而是圍繞云原生路線,基于用戶的業務架構,配合行業解決方案,提供專屬的云原生套餐。其中,既包括QKCP,也可能會有混合云方案、IaaS、PaaS、存儲、云管、低代碼、數據庫等,最終目標是以用戶業務為核心,提供全生命周期的服務保障。