9月28日,信服云托管云運(yùn)維專家Jason在信服云《云集技術(shù)學(xué)社》系列直播課上進(jìn)行了《云運(yùn)維概況與注意事項(xiàng)》的分享,詳細(xì)介紹了在云化大趨勢背景下云運(yùn)維分工、職責(zé)和核心點(diǎn)。以下是他的分享內(nèi)容摘要,想要了解更多可以關(guān)注“深信服科技”公眾號觀看回放。
看點(diǎn)一 云的演進(jìn)為運(yùn)維帶來了哪些挑戰(zhàn)?
隨著信息技術(shù)的不斷發(fā)展,云演進(jìn)經(jīng)歷了硬件化、虛擬化、超融合和云四個(gè)歷程。數(shù)據(jù)中心也從傳統(tǒng)數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心、軟件定義數(shù)據(jù)中心到云化數(shù)據(jù)中心。企業(yè)對信息系統(tǒng)的需求定位也在不斷變化,信息系統(tǒng)從成本驅(qū)動、成本和效率驅(qū)動、管理驅(qū)動、管理和效率驅(qū)動最后到業(yè)務(wù)創(chuàng)新驅(qū)動。
隨著企業(yè)業(yè)務(wù)規(guī)模不斷擴(kuò)大,信息系統(tǒng)基礎(chǔ)架構(gòu)也從超融合、多資源池軟件定義數(shù)據(jù)中心、私有云、同架構(gòu)混合云再到現(xiàn)在的多云中臺。信息系統(tǒng)和云服務(wù)復(fù)雜化的趨勢越來越明顯,平臺的安全和運(yùn)維可靠性成為了云計(jì)算的關(guān)注重點(diǎn)之一,對云安全和云運(yùn)維的要求在不斷提高。
云的演進(jìn)給運(yùn)維帶來了多重挑戰(zhàn):
一是管理復(fù)雜。節(jié)點(diǎn)數(shù)量成千上萬,存儲、計(jì)算、網(wǎng)絡(luò)、PaaS、SaaS各種類型業(yè)務(wù)復(fù)雜。如何管理這么多的資源、平臺和業(yè)務(wù)對運(yùn)維而言是一項(xiàng)挑戰(zhàn)。
二是自動化要求高。在如此大的業(yè)務(wù)規(guī)模和服務(wù)場景下,自動化程度是運(yùn)維效率的關(guān)鍵。
三是穩(wěn)定性要求高。云作為一個(gè)服務(wù)主體,直接承載不同用戶業(yè)務(wù),對穩(wěn)定性要求極高。
四是變更頻繁。云作為客戶服務(wù)載體,需要經(jīng)常根據(jù)用戶所需開發(fā)云產(chǎn)品或新功能,由此帶來頻繁的升級事項(xiàng)。
五是排查問題難度增加。復(fù)雜的技術(shù)棧、復(fù)雜的業(yè)務(wù)場景,對于問題排查要求增加。
看點(diǎn)二 云化趨勢下運(yùn)維工作如何分層?職責(zé)邊界是什么?
關(guān)于云運(yùn)維,信服云對整個(gè)運(yùn)維體系做了梳理,將運(yùn)維分成了IDC、云平臺、云資源、應(yīng)用層四個(gè)層級,每一個(gè)層級都會有對應(yīng)的運(yùn)維人員進(jìn)行維護(hù)。
應(yīng)用層包括應(yīng)用系統(tǒng)和Guest OS的運(yùn)維;云資源層級運(yùn)維包括日常響應(yīng)和專家服務(wù)。對于信服云而言,云資源層級是用戶服務(wù)目錄的保障。日常響應(yīng)包含了PaaS、SaaS等多項(xiàng)服務(wù),專家服務(wù)包含了安全服務(wù)、DBA服務(wù)、遷移服務(wù)等。
云平臺層級運(yùn)維包括持續(xù)運(yùn)維、IT設(shè)備安裝部署、IT設(shè)備運(yùn)維三部分內(nèi)容;IDC運(yùn)維主要是基礎(chǔ)設(shè)施的維護(hù),包括對供配電系統(tǒng)、空調(diào)與制冷系統(tǒng)、制冷自控系統(tǒng)、動環(huán)監(jiān)控系統(tǒng)等多方面的維護(hù),日常會對機(jī)房進(jìn)行定期巡檢。一般來說,T3及以上的機(jī)房都有非常完整的服務(wù)保障。
看點(diǎn)三 如何擺脫“救火式運(yùn)維”的困境?
業(yè)界對運(yùn)維人員一直有個(gè)戲稱是“背鍋俠”,這個(gè)戲稱也反映了目前運(yùn)維人員面臨的“救火式運(yùn)維”困境。“救火式運(yùn)維”困境即當(dāng)事件已經(jīng)發(fā)生并造成業(yè)務(wù)影響時(shí),運(yùn)維人員才能發(fā)現(xiàn)和著手處理。如何化被動為主動,突破困境?讓主動運(yùn)維、持續(xù)運(yùn)維成為常態(tài),就需要詳細(xì)拆解云運(yùn)維核心體系,厘清運(yùn)維重點(diǎn),尋求技術(shù)突破,跳出運(yùn)維管理怪圈。
站在管理的角度,運(yùn)維的核心主要是人員、流程、技術(shù)、數(shù)據(jù)四個(gè)方面。人員是運(yùn)維操作的執(zhí)行者,流程是運(yùn)維操作的既定范圍與邊界,技術(shù)是運(yùn)維的武器,數(shù)據(jù)能夠更好地賦能運(yùn)維。
在人員層面,任何公司做好運(yùn)維的第一步是擁有一個(gè)負(fù)責(zé)運(yùn)維職責(zé)的團(tuán)隊(duì)。運(yùn)維體系組織構(gòu)成主要有技術(shù)支持中心、專家支撐中心、平臺運(yùn)維中心和職能組。以平臺運(yùn)維中心為例,人員組成有IDC物理環(huán)境維護(hù)、基礎(chǔ)設(shè)施維護(hù)、網(wǎng)絡(luò)運(yùn)維工程師、平臺運(yùn)維工程師和工具開發(fā)組。這些人員保障著云平臺的日常運(yùn)行。
在流程層面,隨著云時(shí)代場景下的系統(tǒng)規(guī)模不斷擴(kuò)大、目錄日趨復(fù)雜、運(yùn)維管理的無序工作狀態(tài)日益加劇,這對運(yùn)維管理水平也提出了更高的挑戰(zhàn)。運(yùn)維管理流程建設(shè)完備程度成為了運(yùn)維效率的重要決定因素。運(yùn)維流程管理設(shè)計(jì)遵循國際ITIL標(biāo)準(zhǔn),整體流程從設(shè)計(jì)、 轉(zhuǎn)換、 運(yùn)營等角度出發(fā),對日常運(yùn)維工作中的目錄管理、可用性管理、容量管理、變更管理等等進(jìn)行規(guī)范和定義。
在技術(shù)層面,包括CMDB、監(jiān)控指標(biāo)項(xiàng)及模型、告警平臺這幾類運(yùn)維工具和運(yùn)維自動化、持續(xù)運(yùn)維等技術(shù)。他們推動著運(yùn)維的發(fā)展,幫助運(yùn)維人員從簡單重復(fù)的運(yùn)維問題中解放出來,讓運(yùn)維人員能夠更快處理重要問題。
在數(shù)據(jù)層面,數(shù)據(jù)是運(yùn)維很關(guān)鍵的部分。它包含的不只是運(yùn)營的工單流程或者是事件告警,還包含了知識庫、平臺所有的監(jiān)控?cái)?shù)據(jù)。很多公司或者說很多運(yùn)營人員并不是很重視數(shù)據(jù),實(shí)際上,數(shù)據(jù)在發(fā)現(xiàn)問題、解決問題和優(yōu)化方案的時(shí)候起了非常大的作用。
看點(diǎn)四 云運(yùn)維的實(shí)際過程中有哪些注意事項(xiàng)?
本次直播課上,Jason根據(jù)信服云深耕云計(jì)算多年的經(jīng)驗(yàn),給出了四點(diǎn)建議:
(1)傳統(tǒng)運(yùn)維的自動化轉(zhuǎn)型
企業(yè)數(shù)字化轉(zhuǎn)型的前提是企業(yè)需要有IT基礎(chǔ)信息化建設(shè)以及IT基礎(chǔ)信息的保障。在云化的大趨勢下,中小企業(yè)更應(yīng)該專注自身發(fā)展和數(shù)字化轉(zhuǎn)型。在運(yùn)維層面,可以通過服務(wù)化采購,托管式云服務(wù)的方式將平臺運(yùn)維交由云服務(wù)商來做。大型企業(yè)則應(yīng)加強(qiáng)投入,組建高質(zhì)量運(yùn)維團(tuán)隊(duì),建立完備流程、分工職責(zé),利用技術(shù)和工具實(shí)行主動運(yùn)維,向自動化演進(jìn)。
(2)落地和執(zhí)行
在落地的執(zhí)行階段,應(yīng)以人員為根本,流程為基線,CMDB、監(jiān)控、告警為三大基石,堅(jiān)定不移走自動化戰(zhàn)略。同時(shí)給予更多資源讓運(yùn)維有發(fā)展的空間。
(3)數(shù)據(jù)安全
企業(yè)要敬畏生產(chǎn)環(huán)境,流程設(shè)計(jì)一定要規(guī)避低級錯(cuò)誤,而且要保證數(shù)據(jù)的一致性,數(shù)據(jù)的防篡改等。
(4)擁抱風(fēng)險(xiǎn)
任何產(chǎn)品都會存在問題,擁抱風(fēng)險(xiǎn)。企業(yè)可以跨部門、跨體系建立一條快速解決通道以及自動化高效修復(fù)作業(yè)程序,保障運(yùn)維安全。
以上就是本次直播的主要內(nèi)容,還想學(xué)習(xí)云計(jì)算的更多“門道”嗎?敬請鎖定“深信服科技”公眾號或者官網(wǎng),云集技術(shù)學(xué)社還將邀請更多的專家,分享他們對云計(jì)算技術(shù)的理解和實(shí)踐經(jīng)驗(yàn)。