欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

像谷歌一樣打理IT:新一代云計(jì)算PaaS平臺管理體系詳解

近年來,隨著企業(yè)的業(yè)務(wù)形態(tài)從線下走到線上,企業(yè)的傳統(tǒng)業(yè)務(wù)逐漸向互聯(lián)網(wǎng)方向轉(zhuǎn)型,對IT系統(tǒng)提出了新的要求,企業(yè)級客戶紛紛采用云計(jì)算作為新一代的IT架構(gòu)?;ヂ?lián)網(wǎng)公司的飛速發(fā)展,已經(jīng)印證了云計(jì)算可以對互聯(lián)網(wǎng)業(yè)務(wù)提供有力支撐。因此,企業(yè)級客戶借鑒互聯(lián)網(wǎng)公司的經(jīng)驗(yàn),逐步建立新一代云計(jì)算IT架構(gòu),以更好地支撐互聯(lián)網(wǎng)相關(guān)新業(yè)務(wù)。
 
Google作為IT行業(yè)的標(biāo)桿,是云計(jì)算領(lǐng)域公認(rèn)的領(lǐng)頭羊之一。Google打造了一套高效的云計(jì)算IT架構(gòu)體系,有力地支撐了Google的互聯(lián)網(wǎng)業(yè)務(wù),使得其搜索、廣告、視頻、郵箱等業(yè)務(wù)都極具競爭力。
 
在Google的云計(jì)算IT架構(gòu)體系中,PaaS平臺最為強(qiáng)大,Google的PaaS平臺管理了內(nèi)部數(shù)十億應(yīng)用程序,并運(yùn)行在上百萬臺服務(wù)器上。具體來說,Google的PaaS平臺相關(guān)的IT架構(gòu)體系包含兩個部分:一部分是工具層,即數(shù)據(jù)中心操作系統(tǒng),包括應(yīng)用調(diào)度、日志檢索、監(jiān)控報警、測試打包、應(yīng)用發(fā)布、鏡像倉庫等等。Google數(shù)據(jù)中心操作系統(tǒng)的核心是調(diào)度器Borg,Google內(nèi)部所有的業(yè)務(wù)應(yīng)用程序都被Borg統(tǒng)一調(diào)度統(tǒng)一運(yùn)行在Google所有的數(shù)據(jù)中心里,并實(shí)現(xiàn)應(yīng)用的全生命周期管理。另一部分是管理運(yùn)維層,即Site Reliability Engineering (SRE)體系,SRE體系強(qiáng)調(diào)開發(fā)和運(yùn)維的有機(jī)結(jié)合,是Google對DevOps的一種實(shí)踐。SRE體系最大的特點(diǎn)是對IT人員(包括開發(fā)和運(yùn)維)的管理,諸如各種制度、規(guī)范等,最終都落實(shí)到了工具的層面,而不只是紙面,切實(shí)加強(qiáng)了對IT人員的規(guī)約,保證了業(yè)務(wù)應(yīng)用的快速交付和穩(wěn)定運(yùn)維。
 
像谷歌一樣打理IT:新一代云計(jì)算PaaS平臺管理體系詳解-DVBCN
 
Google SRE體系的本質(zhì)是提升IT效率
 
IT行業(yè)雖然發(fā)展多年,各種高新技術(shù)層出不窮,但是IT行業(yè)自身的效率仍然不高。從面向?qū)ο缶幊?、UML、SOA、瀑布式開發(fā)到近些年流行的DevOps、微服務(wù)、敏捷開發(fā)等等,這些軟件工程方法都是為了提升IT行業(yè)軟件開發(fā)的效率。跟制造業(yè)的工業(yè)化程度相比,IT行業(yè)的工業(yè)化程度還非常弱。但是IT行業(yè)的軟件開發(fā)、交付、運(yùn)維,無不需要大量的人力工作,因此,IT公司的技術(shù)水平嚴(yán)重依賴軟件工程師的水平。
 
SRE體系跟制造業(yè)的工業(yè)化程度有異曲同工之處,它們的目的都在于提升效率。一般來說,工業(yè)化程度有四層:工業(yè)化1.0是機(jī)械化和動力化;工業(yè)化2.0是自動化和流程化(過程中伴隨著標(biāo)準(zhǔn)化);工業(yè)化3.0是信息化;工業(yè)化4.0是智能化。由于IT行業(yè)特殊性,軟件開發(fā)需要腦力勞動,不存在機(jī)械化這一維度。Google的SRE體系分為三個層面,分別對應(yīng)工業(yè)化2.0、3.0和4.0:
 
自動化、服務(wù)化、標(biāo)準(zhǔn)化,這個層面注重提升IT效率,尤其是業(yè)務(wù)應(yīng)用的交付、運(yùn)維效率,對應(yīng)工業(yè)化2.0;
信息化,這個層面強(qiáng)調(diào)數(shù)據(jù)化的IT管理,對業(yè)務(wù)決策提供數(shù)據(jù)支持,對應(yīng)工業(yè)化3.0;
智能化,這個層面是IT行業(yè)的革命性改變,對IT管理的方方面面都要智能化管理,對應(yīng)工業(yè)化4.0。
 
下面以Google的SRE為例,著重介紹如何有序分步建立高效的PaaS平臺管理體系,從而有效提升IT效率,更好地支撐業(yè)務(wù)需求。
 
第一步,應(yīng)用管理
 
SRE體系第一步是實(shí)現(xiàn)應(yīng)用管理,把應(yīng)用全生命周期涉及的各個環(huán)節(jié)都盡量做到自動化、服務(wù)化、標(biāo)準(zhǔn)化,進(jìn)而提升開發(fā)效率、縮短交付周期、加速業(yè)務(wù)應(yīng)用迭代,這一步跟工業(yè)化2.0相對應(yīng)。應(yīng)用的全生命周期包括開發(fā)、測試、發(fā)布以及線上運(yùn)維管理等環(huán)節(jié),SRE在應(yīng)用管理方面分別有相應(yīng)的方法和工具提升這幾個環(huán)節(jié)的效率。
 
首先,微服務(wù)是SRE采用的一種有利于分工協(xié)作的敏捷開發(fā)方式。微服務(wù),可以類比工業(yè)化大生產(chǎn)提倡的分工協(xié)作,它提升了團(tuán)隊(duì)協(xié)作效率。每個微服務(wù)由一個小團(tuán)隊(duì)負(fù)責(zé)開發(fā)實(shí)現(xiàn),小團(tuán)隊(duì)的人數(shù)不多,降低了團(tuán)隊(duì)內(nèi)的溝通成本。微服務(wù)之間用開放的API進(jìn)行互聯(lián),通過API來封裝每個微服務(wù)的內(nèi)部系統(tǒng)復(fù)雜性。更進(jìn)一步,API采用RESTful風(fēng)格,使得API的操作符合HTTP標(biāo)準(zhǔn),更方便理解API操作的語義,便于團(tuán)隊(duì)合作。
 
其次,容器是SRE采用的標(biāo)準(zhǔn)化應(yīng)用封裝、分發(fā)的方式。容器,可以類比集裝箱,它提供了標(biāo)準(zhǔn)化的應(yīng)用交付方式,有效降低了環(huán)境異構(gòu)帶來的應(yīng)用交付復(fù)雜度,極大地提升了應(yīng)用交付的效率。Google采用的容器技術(shù),雖然不是流行的Docker技術(shù),但是理念完全類似。通過把應(yīng)用程序和所依賴的各種library都打包在一起,形成一個二進(jìn)制文件,使得該二進(jìn)制文件在運(yùn)行時對外部的依賴降到最低,僅依賴Linux內(nèi)核。這樣一來,Google內(nèi)部的所有二進(jìn)制可執(zhí)行文件(不管程序是用C++寫的還是用Java寫的)都能夠在任何一臺Google的數(shù)據(jù)中心服務(wù)器上運(yùn)行,進(jìn)而極大地方便了Google的數(shù)據(jù)中心操作系統(tǒng)來調(diào)度運(yùn)行各種內(nèi)部應(yīng)用程序。當(dāng)Google的數(shù)據(jù)中心操作系統(tǒng)調(diào)度運(yùn)行內(nèi)部應(yīng)用時,從調(diào)度器Borg的角度看,所有的應(yīng)用都是標(biāo)準(zhǔn)化的容器應(yīng)用,容器應(yīng)用需要的資源都是標(biāo)準(zhǔn)的CPU、內(nèi)存、網(wǎng)絡(luò)、硬盤等資源。當(dāng)應(yīng)用都變成標(biāo)準(zhǔn)化的容器應(yīng)用時,PaaS平臺管理的不再是形形色色的應(yīng)用程序,也不再考慮應(yīng)用程序?qū)\(yùn)行環(huán)境的各種不同依賴,只需要處理應(yīng)用的標(biāo)準(zhǔn)化需求,這使得數(shù)據(jù)中心的管理復(fù)雜度大為降低。
 
DevOps是SRE采用的變更發(fā)布、運(yùn)維管理的方式。DevOps,可以類比供應(yīng)鏈管理,它提升了應(yīng)用交付效率、縮短了更新迭代周期。Google內(nèi)部采用數(shù)據(jù)中心操作系統(tǒng)來落地DevOps,把很多IT能力變得自動化或是自助服務(wù)化。在自動化方面,數(shù)據(jù)中心操作系統(tǒng)提供了自動化的構(gòu)建、測試、運(yùn)維能力。特別的在自動化運(yùn)維方面,數(shù)據(jù)中心操作系統(tǒng)可以實(shí)現(xiàn)故障自愈、彈性伸縮、流量遷移等自動化運(yùn)維功能,有效地降低運(yùn)維復(fù)雜度,提升運(yùn)維效率。在自助服務(wù)化方面,數(shù)據(jù)中心操作系統(tǒng)提供了應(yīng)用一鍵部署、滾動更新、灰度發(fā)布能力,并提供自助的監(jiān)控、報警、日志服務(wù)。有了這些自助服務(wù)能力,Google開發(fā)人員可以自行發(fā)布應(yīng)用并管理運(yùn)行中的應(yīng)用,無須依賴運(yùn)維,有效地提升了交付效率。
 
Google內(nèi)部已經(jīng)落地了應(yīng)用全生命周期管理,并完全實(shí)現(xiàn)了IT管理自動化、標(biāo)準(zhǔn)化、服務(wù)化。
 
第二步,數(shù)據(jù)管理
 
SRE體系第二步是要實(shí)現(xiàn)數(shù)據(jù)管理,把業(yè)務(wù)應(yīng)用在運(yùn)行時產(chǎn)生的各種數(shù)據(jù)進(jìn)行采集并提供大數(shù)據(jù)處理能力,用于后續(xù)對業(yè)務(wù)進(jìn)行分析,這一步跟工業(yè)化3.0相對應(yīng)。
 
Google的數(shù)據(jù)中心操作系統(tǒng)會采集各個IT環(huán)節(jié)的數(shù)據(jù),不僅包括監(jiān)控?cái)?shù)據(jù)、報警數(shù)據(jù)、日志數(shù)據(jù)等應(yīng)用運(yùn)行時產(chǎn)生的數(shù)據(jù),還包括開發(fā)測試階段的數(shù)據(jù)。Google利用各環(huán)節(jié)產(chǎn)生的數(shù)據(jù)進(jìn)行各種分析:SRE部門利用監(jiān)控?cái)?shù)據(jù)分析應(yīng)用的資源使用情況,Google的監(jiān)控系統(tǒng)可以很方便地查詢線上應(yīng)用系統(tǒng)過去一兩年的監(jiān)控?cái)?shù)據(jù),很容易看出業(yè)務(wù)對資源消耗的需求,進(jìn)而有效地進(jìn)行資源規(guī)劃,防止資源浪費(fèi)提升資源利用率;Google利用日志數(shù)據(jù)分析業(yè)務(wù)的運(yùn)行情況,比如Google的廣告系統(tǒng)利用日志數(shù)據(jù)分析廣告點(diǎn)擊情況,進(jìn)而提升廣告點(diǎn)擊率;SRE部門利用報警數(shù)據(jù)來評估業(yè)務(wù)系統(tǒng)的穩(wěn)定性,Google的SRE部門對重要業(yè)務(wù)系統(tǒng)每個季度的報警次數(shù)有嚴(yán)格要求,不滿足穩(wěn)定性要求的業(yè)務(wù)系統(tǒng)則不允許上線;Google利用測試數(shù)據(jù)來評估測試用例的質(zhì)量,如果某個單元測試用例失敗次數(shù)過多,該測試用例會被標(biāo)記為不穩(wěn)定,并要求編寫該用例的工程師進(jìn)行改進(jìn);Google會采集代碼提交、代碼審查數(shù)據(jù),工程師在升職報告里可以附上自己的代碼提交和代碼審查數(shù)據(jù),用于側(cè)面印證自己的工作量。
 
Google內(nèi)部已經(jīng)落地了數(shù)據(jù)管理,并基本實(shí)現(xiàn)了IT管理信息化。
 
第三步,智能管理
 
SRE體系第三步是要實(shí)現(xiàn)智能管理,利用上一步采集的各種數(shù)據(jù)進(jìn)行分析,然后智能地管理各個IT環(huán)節(jié),這一步跟工業(yè)化4.0相對應(yīng)。Google已經(jīng)實(shí)現(xiàn)了部分IT環(huán)節(jié)的智能管理。Google的數(shù)據(jù)中心操作系統(tǒng)在運(yùn)行某些應(yīng)用時,可以不用人為指定應(yīng)用運(yùn)行時需要的資源使用量,調(diào)度器Borg自動按需給應(yīng)用分配資源。Google數(shù)據(jù)中心冷卻系統(tǒng)的功率會自動根據(jù)數(shù)據(jù)中心的負(fù)載情況進(jìn)行調(diào)節(jié),數(shù)據(jù)中心部門會依據(jù)歷史數(shù)據(jù)對數(shù)據(jù)中心的負(fù)載進(jìn)行預(yù)測,當(dāng)負(fù)載高峰時增大數(shù)據(jù)中心冷卻系統(tǒng)的功率,當(dāng)負(fù)載低谷時減小數(shù)據(jù)中心冷卻系統(tǒng)的功率,從而節(jié)省數(shù)據(jù)中心電力開銷。Google的負(fù)載均衡系統(tǒng)會根據(jù)業(yè)務(wù)系統(tǒng)的負(fù)載變化,自動進(jìn)行流量調(diào)節(jié),防止業(yè)務(wù)系統(tǒng)過載,保證業(yè)務(wù)穩(wěn)定性。
 
Google內(nèi)部正逐步實(shí)現(xiàn)各IT環(huán)節(jié)的智能管理。
 
云計(jì)算已經(jīng)成為下一代企業(yè)級IT的事實(shí)標(biāo)準(zhǔn)?,F(xiàn)階段,IaaS平臺相對成熟,而PaaS平臺還相對早期,企業(yè)級客戶對如何搭建、使用、管理PaaS平臺尚有很多困惑。SRE是Google采用的一套行之有效的云計(jì)算IT管理體系,我們相信SRE的理念可以被企業(yè)級客戶借鑒并應(yīng)用于PaaS平臺的管理,進(jìn)而有力地支撐企業(yè)級客戶的互聯(lián)網(wǎng)新業(yè)務(wù)。
相關(guān)文章
Sling TV添加到谷歌纖維捆綁選項(xiàng)
Sling TV添加到谷歌纖維捆綁選項(xiàng)
Philo可通過谷歌Chromecast使用
Philo可通過谷歌Chromecast使用
Ovum觀察:電視“超級聚合”的下一步是什么?
Ovum觀察:電視“超級聚合”的下一步是什…
Google為云游戲時代開發(fā)新手柄
Google為云游戲時代開發(fā)新手柄
Google Photo分享至Android TV功能臨時禁用:調(diào)查隱私BUG
Google Photo分享至Android TV功能臨時…
Google:亞洲首宗再生能源交易,數(shù)據(jù)中心用電邁向無碳
Google:亞洲首宗再生能源交易,數(shù)據(jù)中…
我還沒有學(xué)會寫個人說明!