運維一般是指對大型組織已經(jīng)建立好的網(wǎng)絡(luò)軟硬件的維護,其中傳統(tǒng)的運維是指信息技術(shù)運維,負責維護并確保整個服務(wù)的高可用性。下面是小編整理的一些關(guān)于運維行業(yè)的文章,希望對你有所幫助。
運維發(fā)展分析
運維中關(guān)鍵技術(shù)點解剖:1 大量高并發(fā)網(wǎng)站的設(shè)計方案 ;2 高可靠、高可伸縮性網(wǎng)絡(luò)架構(gòu)設(shè)計;3 網(wǎng)站安全問題,如何避免被黑?4 南北互聯(lián)問題,動態(tài)CDN解決方案;5 海量數(shù)據(jù)存儲架構(gòu)
一、什么是大型網(wǎng)站運維?
首先明確一下,全文所講的”運維“是指:大型網(wǎng)站運維,與其它運維的區(qū)別還是蠻大的;然后我們再對大型網(wǎng)站與小型網(wǎng)站進行范圍定義,此定義主要從運維復雜性角度考慮,如網(wǎng)站規(guī)范、知名度、服務(wù)器 量級、pv量等考慮,其它因素不是重點;因此,我們先定義服務(wù)器規(guī)模大于1000臺,pv每天至少上億(至少國內(nèi)排名前10),如sina、baidu、 QQ,http://51.com等等;其它小型網(wǎng)站可能沒有真正意義上的運維工程師,這與網(wǎng)站規(guī)范不夠和成本因素有關(guān),更多的是集合網(wǎng)絡(luò)、系統(tǒng) 、開發(fā)工作于一身的“復合性人才”,就如有些公司把一些合同采購都納入了運維職責范圍,還有如IDC網(wǎng)絡(luò)規(guī)劃也納入運維職責。所以,非常重要一定需要明白:運維對其它關(guān)聯(lián)工種必須非常了解熟悉:網(wǎng)絡(luò)、系統(tǒng)、系統(tǒng)開發(fā)、存儲,安全,DB等;我在這里所講的運維工程師就是指專職運維工程師。
我們再來說說一般產(chǎn)品的“出生”流程:
1、首先公司管理層給出指導思想,PM定位市場需求(或copy成熟應用)進行調(diào)研、分析、最終給出詳細設(shè)計。
2、架構(gòu)師根據(jù)產(chǎn)品設(shè)計的需求,如pv大小預估、服務(wù)器規(guī)模、應用架構(gòu)等因素完成網(wǎng)絡(luò)規(guī)劃,架構(gòu)設(shè)計等(基本上對網(wǎng)絡(luò)變動不大,除非大項目)
3、開發(fā)工程師將設(shè)計code實現(xiàn)出來、測試工程師對應用進行測試。
4、好,到運維工程師出馬了,首先明確一點不是說前三步就與運維工作無關(guān)了,恰恰相反,前三步與運維關(guān)系很大:應用的前期架構(gòu)設(shè)計、軟/硬件資源評估申請采購、應用設(shè)計性能隱患及評估、IDC、服務(wù)性能安全調(diào)優(yōu)、服務(wù)器系統(tǒng)級優(yōu)化(與特定應用有關(guān))等都需運維全程參與,并主導整個應用上線項目;運維工程師負責產(chǎn)品服務(wù)器上架準備工作,服務(wù)器系統(tǒng)安裝、網(wǎng)絡(luò)、IP、通用工具集安裝。運維工程師還需要對上線的應用系統(tǒng)架構(gòu)是否合理、是否具備可擴展性、及安全隱患等因素負責,并負責最后將產(chǎn)品(程序)、網(wǎng)絡(luò)、系統(tǒng)三者進行拼接并最優(yōu)化的組合在一起,最終完成產(chǎn)品上線提供用戶使用,并周而復使:需求->開發(fā)(升級)->測試->上線(性能、安全問題等之前預估外的問題隨之慢慢就全出來了)在這里提一點:網(wǎng)站開發(fā)模式與傳統(tǒng)軟件開發(fā)完全不一樣,網(wǎng)站一天開發(fā)上線1~5個升級版本是家常便飯,用戶體驗為王嘛,如果某個線上問題像M$ 需要1年解決,用戶早跑光了;應用上線后,運維工作才剛開始,具體工作可能包括:升級版本上線工作、服務(wù)監(jiān)控、應用狀態(tài)統(tǒng)計、日常服務(wù)狀態(tài)巡檢、突發(fā)故障處理、服務(wù)日常變更調(diào)整、集群管理、服務(wù)性能評估優(yōu)化、數(shù)據(jù)庫管理優(yōu)化、隨著應用PV增減進行應用架構(gòu)的伸縮、安全、運維開發(fā)工作:
a 、盡量將日常機械性手工工作通過工具實現(xiàn)(如服務(wù)監(jiān)控、應用狀態(tài)統(tǒng)計、服務(wù)上線等等),提高效率。
b、解決現(xiàn)實中服務(wù)存在的問題,如高可靠性、可擴展性問題等。
c、大規(guī)模集群管理工具的開發(fā),如1萬臺機器如何在1分鐘內(nèi)完成密碼修改、或運行指定任務(wù)?2000臺服務(wù)器如何快速安裝操作系統(tǒng)?各分布式IDC、存儲集群中數(shù)PT級的數(shù)據(jù)如何快速的存儲、共享、分析?等一系列挑戰(zhàn)都需運維工程師的努力。
在此說明一下其它配合工種情況,在整個項目中,前端應用對于網(wǎng)絡(luò)/系統(tǒng)工程師來說是黑匣子,同時開發(fā)工程師職責只是負責完成應用的功能性開發(fā),并對應用本身性能、安全性等應用本身負責,它不負責或關(guān)心網(wǎng)絡(luò)/系統(tǒng)架構(gòu)方面事宜,當然軟/硬件采購人員等事業(yè)部其它同事也不會關(guān)心這些問題,各司其職,但項目的核心是運維工程師~!所有其它部門的橋梁。
上面說了很多,我想大家應該對運維有一些概念了,在此打個比方吧,如果我們是一輛高速行駛在高速公路上的汽車,那運維工程師就是司機兼維修工,這個司機不簡單,有時需要在高速行駛過程中換輪胎、并根據(jù)道路情況換檔位、當汽車速度越來越快,汽車本身不能滿足高速度時對汽車性能調(diào)優(yōu)或零件升級、高速行進中解決汽車故障及性能問題、時刻關(guān)注前方安全問題,并先知先覺的采取規(guī)避手段。這就是運維工作~!
最后說一下運維工程師的職責:”確保線上穩(wěn)定“,看似簡單,但實屬不容易,運維工程師必須在諸多不利因素中進行權(quán)衡:新產(chǎn)品模式對現(xiàn)有架構(gòu)及技術(shù)的沖擊、產(chǎn)品高頻度的升級帶來的線上BUG隱患、運維自動化管理承度不高導致的人為失誤、IT行業(yè)追求的高效率導致流程執(zhí)行上的缺失、用戶增漲帶來的性能及架構(gòu)上的壓力、IT行業(yè)寬松的技術(shù)管理文化、創(chuàng)新風險、互聯(lián)網(wǎng)安全性問題等因素,都會是網(wǎng)站穩(wěn)定的大敵,運維工程師必須把控好這最后一關(guān),需具體高度的責任感、原則性及協(xié)調(diào)能力,如果能做到各因素的最佳平衡,那就是一名優(yōu)秀的運維工程師了。
另外在此聊點題外話,我在這里看到有很多人要sina、QQ、baidu,http://51.com等聊自已的運維方面的經(jīng)驗,其實這對于它們有點免為其難:
a、各公司自已網(wǎng)絡(luò)架構(gòu)、規(guī)模、或多或少還算是公司的核心秘密,要保密,另外,對于大家所熟知的通用軟件、架構(gòu),由于很多公司會根據(jù)自已實際業(yè)務(wù)需要,同時因為原版性能、安全性、已知bug、功能等原因,進行過二次開發(fā)(如apache,php,mysql ),操作系統(tǒng)內(nèi)核也會根據(jù)不同業(yè)務(wù)類型進行定制的,如某些應用屬于運算型、某些是高IO型、或大存儲大內(nèi)存型。根據(jù)這些特點進行內(nèi)核優(yōu)化定制,如sina就在 memcache上進行過二次開發(fā),搞出了一個MemcacheDB,具體做得如何我們不談,但開源了,是值得稱贊的,國內(nèi)公司對于開源基本上是索取,沒有貢獻;另外,服務(wù)器也不是大家所熟知的型號,根據(jù)業(yè)務(wù)特點,大部份都是找DELL/HP/ibm進行過定制;另外,在分布式儲存方面都有自已解決方案,要不就是使用現(xiàn)成開源hadoop等解決方案,或自已開發(fā)。但90%都是借鑒google GFS的思想:分布式存儲、計算、大表。
b、各公司業(yè)務(wù)方向不一樣,會導致運維模式或方法都不一樣,如http://51.com和baidu運維肯定區(qū)別很大,因為他們業(yè)務(wù)模式?jīng)Q定了其架構(gòu)、服務(wù)器量級、 IDC分布、網(wǎng)絡(luò)結(jié)構(gòu)、通用技術(shù)都會不一樣,主打新聞門戶的sina與主打sns的http://51.com運維模式差異就非常大,甚至職責都不大一樣;但有一點,通用技術(shù)及大致架構(gòu)上都大同小異,大家不要太神化,更多的公司只是玩壘積木的游戲罷了,沒什么技術(shù)含量。
c、如上面所講,目前大型網(wǎng)站運維還處于幼年時期理念和經(jīng)驗都比較零散,沒有成熟的知識體系,可能具體什么是運維,大家都要先思索一番,或壓根沒想過,真正討論也只是運維工作的冰山一角,局限于具體技術(shù)細節(jié),或某某著名網(wǎng)站大的框架,真正運維體系化東西沒有,這也許是目前網(wǎng)上運維相關(guān)資料 比較少的原故吧?;蛘咭彩菄鴥?nèi)運維人員比較難招,比較牛的運維工程師比較少見的原因之一吧。
二、運維工作師需要什么樣的技能及素質(zhì)
做為一名運維工程師需要什么樣的技能及素質(zhì)呢,首先說說技能吧,如大家上面所看到,運維是一個集多IT工種技能與一身的崗位,對系統(tǒng)->網(wǎng)絡(luò) ->存儲->協(xié)議->需求->開發(fā)->測試->安全等各環(huán)節(jié)都需要了解一些,但對于某些環(huán)節(jié)需熟悉甚至精通,如系統(tǒng) (基本操作系統(tǒng)的熟悉使用,-nix,windows ..)、協(xié)議、系統(tǒng)開發(fā)(日常很重要的工作是自動運維化相關(guān)開發(fā)、大規(guī)模集群工具開發(fā)、管理)、通用應用(如lvs、ha、web server 、db、中間件、存儲等)、網(wǎng)絡(luò),IDC拓樸架構(gòu);
技能方面總結(jié)以下幾點:
1、開發(fā)能力,這點非常重要,因為運維工具都需要自已開發(fā),開發(fā)語言:perl、python、php(其中之一)、shell(awk,sed,expect….等),需要有過實際項目開發(fā)經(jīng)驗,否則工作會非常痛苦。
2、通用應用方面需要了解:操作系統(tǒng)(目前國內(nèi)主要是linux、bsd)、webserver相關(guān) (nginx,apahe,php,lighttpd,java。。。)、數(shù)據(jù)庫(mysql,oralce)、其它雜七八拉的東東;系統(tǒng)優(yōu)化,高可靠性;這些只是加分項,不需必備,可以邊工作邊慢慢學,這些東西都不難。當然在運維中,有些是有分工偏重點不一樣。
3、系統(tǒng)、網(wǎng)絡(luò)、安全,存儲,CDN,DB等需要相當了解,知道其相關(guān)原理。
個人素質(zhì)方面:
1、溝通能力、團隊協(xié)作:運維工作跨部門、跨工種工作很多,需善于溝通、并且團隊協(xié)作能力要強;這應該是現(xiàn)代企業(yè)的基本素質(zhì)要求了,不多說。
2、工作中需膽大心細:膽大才能創(chuàng)新、不走尋常路,特別對于運維這種新的工種,更需創(chuàng)新才能促進發(fā)展;心細,運維工程師是網(wǎng)站admin,最高線上權(quán)限者,一不小心就會遺憾終生或打入十八層地獄。
3、主動性、執(zhí)行力、精力旺盛、抗壓能力強:由于IT行業(yè)的特性,變化快;往往計劃趕不上變化,運維工作就更突出了,比如國內(nèi)各大公司服務(wù)器往往是全國各地,哪里便宜性價比高,就那往搬,進行大規(guī)模服務(wù)遷移(牽扯的服務(wù)器成百上千臺),這是一個非常頭痛的問題;往往時間 非常緊迫,如限1周內(nèi)完成,這種情況下,運維工程師的主動性及執(zhí)行力就有很高的要求了:計劃、方案、服務(wù)無縫遷移、機器搬遷上架、環(huán)境準備、安全評估、性能評估、基建、各關(guān)聯(lián)部門扯皮,7X24小緊急事故響應等。
4、其它就是一些基本素質(zhì)了:頭腦要靈光、邏輯思維能力強、為人謙虛穩(wěn)重、親和力、樂于助人、有大局觀。
5、最后一點,做網(wǎng)站運維需要有探索創(chuàng)新精神,通過創(chuàng)新型思維解決現(xiàn)實中的問題,因為這是一個處于幼年的職業(yè)(國外也一樣,但比國內(nèi)起步早點),沒有成熟體系或方法論可以借鑒,只能靠大家自已摸索努力。
三、怎樣才算是一個合格的運維工程師
1、保證服務(wù)達到要求的線上標準,如99.9%;保證線上穩(wěn)定,這是運維工程師的基本責職所在。
2、不斷的提升應用的可靠性與健壯性、性能優(yōu)化、安全提升;這方面非常考驗主動性和創(chuàng)新思維。
3、網(wǎng)站各層面監(jiān)控、統(tǒng)計的覆蓋度,軟件、硬件、運行狀態(tài),能監(jiān)控的都需要監(jiān)控統(tǒng)計,避免監(jiān)控死角、并能實時了解應用的運轉(zhuǎn)情況。
4、通過創(chuàng)新思維解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預,需要盡可能的解放雙手。
5、運維知識的積累與沉淀、文檔的完備性,運維是一個經(jīng)驗性非常強的崗位,好的經(jīng)驗與陷阱都需積累下來,避免重復性范錯。
6、計劃性和執(zhí)行力;工作有計劃,計劃后想法設(shè)法達到目標,不找借口。
7、自動化運維;能對日常機械化工作進行提煉、設(shè)計并開發(fā)成工具、系統(tǒng),能讓系統(tǒng)自動完成的盡量依靠系統(tǒng);讓大家更多的時間用于思考、創(chuàng)新思維、做自已喜歡的事情。
以上只是技術(shù)上的一些層面,當然個人意識也是很重要的。
四、運維職業(yè)的迷惘、現(xiàn)狀與發(fā)展前景
運維崗位不像其它崗位,如研發(fā)工程師、測試工程師等,有非常明確的職責定位及職業(yè)規(guī)劃,比較有職業(yè)認同感與成就感;而運維工作可能給人的感覺是哪方面都了解一些,但又都比上專職工程師更精通、感覺平時被關(guān)注度比較低(除非線上出現(xiàn)故障),慢慢的大家就會迷惘,對職業(yè)發(fā)展產(chǎn)生困惑,為什么會有這種現(xiàn)象呢?除了職業(yè)本身特點外,主要還是因為對運維了解不深入、做得不深入導致;其實這個問題其它崗位也會出現(xiàn),但我發(fā)現(xiàn)運維更典型,更容易出現(xiàn)這個問題;
針對這個問題我談一下網(wǎng)站運維的現(xiàn)狀及發(fā)展前景(也在思考中,可能不太深入全面,也請大家斧正補充)
運維現(xiàn)狀:
1、處于剛起步的初級階段,各大公司有此專職,但重視或重要程度不高,可替代性強;小公司更多是由其它崗位來兼顧做這一塊工作,沒有專職,也不可能做得深入。
2、技術(shù)層次比較低;主要處于技術(shù)探索、積累階段,沒有型成體系化的理念、技術(shù)。
3、體力勞動偏大;這個問題主要與第二點有關(guān)系,很多事情還是依靠人力進行,沒有完成好的提練,對于大規(guī)模集群沒有成熟的自動化管理方法,在此說明一下,大規(guī)模集群與運維工作是息息相關(guān)的如果只是百十來臺機器,那就沒有運維太大的生存空間了。
4、優(yōu)秀運維人才的極度缺乏;目前各大公司基本上都靠自已培養(yǎng),這個現(xiàn)狀導致行業(yè)內(nèi)運維人才的流動性非常低,非常多好的技術(shù)都局限在各大公司內(nèi)部,如 google 50萬臺機器科學的管理,或者國內(nèi)互聯(lián)公司top 10 的一些運維經(jīng)驗,這些經(jīng)驗是非常有價值的東西并決定了一個公司的核心競爭力;這些問題進而導致業(yè)內(nèi)先進運維技術(shù)的流通、貫通、與借簽,并最終將限制了運維發(fā)展。
5、很多優(yōu)秀的運維經(jīng)驗都掌握在大公司手中;這不在于公司的技術(shù)實力,而在于大公司的技術(shù)規(guī)模、海量PV、硬件規(guī)模足夠大,如baidu可怕的流量、 http://51.com海量數(shù)據(jù)~~~~這些因素決定了他們遇到的問題都是其它中/小公司還沒有遇到的,或即將遇到。但大公司可能已有很好的解決方案或系統(tǒng)。
發(fā)展前景:
1、從行業(yè)角度來看,隨著中國互聯(lián)網(wǎng)的高速發(fā)展(目前中國網(wǎng)民已躍升為全球第一)、網(wǎng)站規(guī)模越來越來大、架構(gòu)越來越復雜;對專職網(wǎng)站運維工程師、網(wǎng)站架構(gòu)師的要求會越來越急迫,特別是對有經(jīng)驗的優(yōu)秀運維人才需求量大,而且是越老越值錢;目前國內(nèi)基本上都是選擇畢業(yè)生培養(yǎng)(限于大公司),培養(yǎng)成本高,而且沒有經(jīng)驗人才加入會導致公司技術(shù)更新緩慢、影響公司的技術(shù)發(fā)展;當然,畢業(yè)生也有好處:白紙一張,可塑性強,比較認同并容易融入企業(yè)文化。
2、從個人角度,運維工程師技術(shù)含量及要求會越來越高,同時也是對公司應用、架構(gòu)最了解最熟悉的人、越來越得到重視。
3、網(wǎng)站運維將成為一個融合多學科(網(wǎng)絡(luò)、系統(tǒng)、開發(fā)、安全、應用架構(gòu)、存儲等)的綜合性技術(shù)崗位,給大家提供一個很好的個人能力與技術(shù)廣度的發(fā)展空間。
4、運維工作的相關(guān)經(jīng)驗將會變得非常重要,而且也將成為個人的核心競爭力,具備很好的各層面問題的解決能力及方案提供、全局思考能力等。
5、特長發(fā)揮和興趣的培養(yǎng);由于運維崗位所接觸的知識面非常廣闊,更容易培養(yǎng)或發(fā)揮出個人某些方面的特長或愛好,如內(nèi)核、網(wǎng)絡(luò)、開發(fā)、數(shù)據(jù)庫等方面,可以做得非常深入精通、成為這方面的專家。
6、如果真要以后不想做運維了,轉(zhuǎn)到其它崗位也比較容易,不會有太大的局限性。當然了,你得真正用心去做。
7、技術(shù)發(fā)展方向:網(wǎng)站/系統(tǒng)架構(gòu)師。
五、運維關(guān)鍵技術(shù)點解剖
1、 大規(guī)模集群管理問題
首先我們先要明確集群的概念,集群不是泛指各功能服務(wù)器的總合,而是指為了達到某一目的或功能的服務(wù)器、硬盤 資源的整合(機器數(shù)大于兩臺),對于應用來說它就是一個整體,目前常規(guī)集群可分為:高可用性集群(HA),負載均衡集群(如lvs),分布式儲、計算存儲集群(DFS,如google gfs ,yahoo hadoop),特定應用集群(某一特定功能服務(wù)器組合、如db、cache層等),目前互聯(lián)網(wǎng)行業(yè)主要基于這四種類型;對于前兩種類似,如果業(yè)務(wù)簡單、應用上post操作比較少,可以簡單的采用四層交換機 解決(如f5),達到服務(wù)高可用/負責均衡的作用,對于資源緊張的公司也有一些開源解決辦法如lvs+ha,非常靈活;對于后兩種,那就考驗公司技術(shù)實力及應用特點了,第三種DFS主要應用于海量數(shù)據(jù)應用上,如郵件、搜索等應用,特別是搜索要求就更高了,除了簡單海量存儲,還包括數(shù)據(jù)挖掘、用戶行為分析;如 google、yahoo就能保存分析近一年的用戶記錄數(shù)據(jù),而baidu應該少于30天、soguo就更少了。。。這些對于搜索準備性、及用戶體驗是至關(guān)重要的。
接下來,我們再談?wù)勅绾慰茖W的管理集群,有以下關(guān)鍵幾點:
I、監(jiān)控
主要包括故障監(jiān)控和性能、流量、負載等狀態(tài)監(jiān)控,這些監(jiān)控關(guān)系到集群的健康運行,及潛在問題的及時發(fā)現(xiàn)與干預;
a、服務(wù)故障、狀態(tài)監(jiān)控:主要是對服務(wù)器自身、上層應用、關(guān)聯(lián)服務(wù)數(shù)據(jù)交互監(jiān)控;例如針對前端web server,我們就可以有很多種類型的監(jiān)控,包括應用端口 狀態(tài)監(jiān)控,便于及時發(fā)現(xiàn)服務(wù)器或應用本身是否crash、通過icmp包探測服務(wù)器健康狀態(tài),更上層可能還包括應用各頻道業(yè)務(wù)的監(jiān)控,常用方法是采用面業(yè)特征碼進行判斷,或?qū)χ攸c頁面進行簽名,以網(wǎng)站被黑篡改(報警、并自動恢復被篡改數(shù)據(jù))等等,這些只是一部份,還有N多監(jiān)控方式,依應用特點而定,還有一些問題需解決,如集群過大,如何高性能的進行監(jiān)控也是一個現(xiàn)實問題。
b、其它就是集群狀態(tài)類的監(jiān)控或統(tǒng)計,為我們合理管理調(diào)優(yōu)集群提供數(shù)據(jù)參考、包括服務(wù)瓶頸、性能問題、異常流量、攻擊等問題。
II、故障管理
a、硬件故障問題;對于成百上千或上萬機器的N多集群,服務(wù)器死機、硬件故障概率是非常大的,幾乎每時每刻都有服務(wù)硬件問題,死機、硬盤損壞、電源、內(nèi)存、交換機。針對這種情況,我們在設(shè)計網(wǎng)站架構(gòu)時需要充分考慮到這些問題,并將其視為常態(tài);更多的依靠應用的冗余機制來規(guī)避這種風險,但給系統(tǒng)工程師足夠?qū)捲5奶幚頃r間。(如google不是號稱同時死800臺機器,服務(wù)不會受到任何影響嗎);這就是考驗運維工程師及網(wǎng)站架構(gòu)師功能的地方了,好的設(shè)計能達到google所描述自恢復能力,如gfs,糟糕的設(shè)計那就是一臺服務(wù)器的死機可能會造成大面積服務(wù)的連鎖故障反映,直接對用戶拒絕響應。
b、應用故障問題;可能是某一bug被觸發(fā)、或某一性能閥值被超越、攻擊等情況不一而定,但重要的一點,是要有對這些問題的預防性措施,不能想當然,它不會出問題,如真出問題了,如何應對?這需要運維工程師平時做足功夫,包括應急響應速度、故障處理的科學性、備用方案的有效等。
III、自動化
自動化:簡而言之,就是將我們?nèi)粘J謩舆M行的一些工作通過工具,系統(tǒng)自動來完成,解放我們的雙手及枯燥的重復性勞動,例如:沒有工具前,我們安裝系統(tǒng)需要一臺一臺裸機安裝,如2000臺,可能需要10人/10天,搞爛N張光盤,人力成本更大。。。而現(xiàn)在通過自動化工具,只需幾個簡單命令 就能搞定、還有如機器人類程序,自動完成以往每天人工干預的工作,使其自動完成、匯報結(jié)果,并具備一定的專家系統(tǒng)能力,能做一些簡單的是/非判斷、優(yōu)化選擇等。。。這些好處非常明顯不再多說。。。應該說,自動化運維是運維工程師職業(yè)化的一個追求,利已利公,雖然這是一個異常艱巨的任務(wù):不斷變更的業(yè)務(wù)、不規(guī)范化的應用設(shè)計、開發(fā)模式、網(wǎng)絡(luò)架構(gòu)變更、IDC變更、規(guī)范變動等因素,都可能會對現(xiàn)有自動化系統(tǒng)產(chǎn)生影響,所以需要模塊化、接口化、變因參數(shù)化等因此,自動化相關(guān)工作,是運維工程師的核心重點工作之一,也是價值的體現(xiàn)。
2020年IT運維市場前景分析
2019年10月29日,第一財經(jīng)刊發(fā)了關(guān)于《工信部:加強5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型基礎(chǔ)設(shè)施建設(shè)》一文,其中指出,推動新型IT基礎(chǔ)設(shè)施建設(shè)。加強5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型IT基礎(chǔ)設(shè)施建設(shè),擴大高速率、大容量、低延時網(wǎng)絡(luò)覆蓋范圍,鼓勵企業(yè)通過內(nèi)網(wǎng)改造升級實現(xiàn)人、機、物互聯(lián),為企業(yè)提供有力的信息網(wǎng)絡(luò)支撐,讓企業(yè)IT基礎(chǔ)設(shè)施成為企業(yè)發(fā)展之路上的護航者。由此可以看出,國家對企業(yè)IT基礎(chǔ)設(shè)施建設(shè)的重視之深,而我們IT運維人員將是這次IT基礎(chǔ)設(shè)施建設(shè)的主力軍。
IT運維是企業(yè)項目開發(fā)后保證業(yè)務(wù)系統(tǒng)正常運行的必備工作之一,如何滿足企業(yè)對在線業(yè)務(wù)系統(tǒng)高可靠、低延時、大容量、零故障等要求或在終端用戶無感知情況下處理運維過程中存在的各種各樣的突發(fā)性問題,是IT運維人員必會的技能,但是如此優(yōu)秀的IT運維人員幾乎一將難求。
既然,IT運維人員對于國家相關(guān)部門大力支持的IT基礎(chǔ)設(shè)施建議那么重要,那么我們IT運維人員都需要擁有哪些能力或IT運維工作內(nèi)容有哪些呢?
1、IT基礎(chǔ)設(shè)施運維自動化
由于企業(yè)要求IT基礎(chǔ)設(shè)施能夠做到高可靠、低延時、大容量、零故障等,那就需要IT運維人員對底層硬件設(shè)備進行用心維護,硬件不出故障才能保證上層業(yè)務(wù)系統(tǒng)的穩(wěn)定、高效地運行。
2、IT基礎(chǔ)設(shè)施之上在線業(yè)務(wù)系統(tǒng)上線
企業(yè)在線業(yè)務(wù)系統(tǒng)是企業(yè)對內(nèi)或?qū)ν馓峁┓?wù)的重要途徑,IT運維人員在業(yè)務(wù)系統(tǒng)開發(fā)后,能夠準確及時上線業(yè)務(wù)系統(tǒng)是對其業(yè)務(wù)能力的重要考核標準之一。
3、IT基礎(chǔ)設(shè)施及在線業(yè)務(wù)系統(tǒng)監(jiān)控自動化
對企業(yè)IT基礎(chǔ)設(shè)施及在線業(yè)務(wù)系統(tǒng)進行有效監(jiān)控,能夠IT運維人員及時獲知硬件或業(yè)務(wù)系統(tǒng)狀態(tài),以此判斷硬件或業(yè)務(wù)系統(tǒng)有效服務(wù)能力,對硬件或業(yè)務(wù)系統(tǒng)故障做到即時反饋,即時處理,不影響企業(yè)對內(nèi)或?qū)ν馓峁┓?wù)。
4、IT基礎(chǔ)設(shè)施及在線業(yè)務(wù)系統(tǒng)日志處理自動化
對企業(yè)IT基礎(chǔ)設(shè)施及IT在線業(yè)務(wù)系統(tǒng)進行日志處理(收集、分析、監(jiān)控、趨勢圖展示等),獲知硬件使用或業(yè)務(wù)系統(tǒng)中用戶行為,以此預測下一周期內(nèi)硬件或業(yè)務(wù)系統(tǒng)資源可用情況,及時應對用戶訪問波峰。
5、在線業(yè)務(wù)系統(tǒng)發(fā)布自動化
使用業(yè)界先進工具實現(xiàn)在線業(yè)務(wù)系統(tǒng)代碼發(fā)布自動化,打破傳統(tǒng)IT運維 "領(lǐng)域隔離",實現(xiàn)真正的一鍵式發(fā)布業(yè)務(wù)系統(tǒng),加快系統(tǒng)部署速度,實現(xiàn)用戶無感知升級或回滾操作等。
6、IT基礎(chǔ)設(shè)施平臺升級
傳統(tǒng)的企業(yè)IT基礎(chǔ)設(shè)施平臺對企業(yè)在線業(yè)務(wù)系統(tǒng)需要底層硬件平臺的高響應、高可靠、大容量等能力反應不及時或不徹底的情況時有發(fā)生,這就需要我們IT運維人員能夠?qū)鹘y(tǒng)的企業(yè)IT基礎(chǔ)設(shè)施平臺進行升級,把傳統(tǒng)的企業(yè)IT基礎(chǔ)設(shè)施平臺升級為云平臺,由云平臺的高響應、高速度、低延時、大容量等能力為業(yè)務(wù)系統(tǒng)穩(wěn)定運維保駕護航。
7、在線業(yè)務(wù)系統(tǒng)遷移至云平臺
傳統(tǒng)的企業(yè)IT基礎(chǔ)設(shè)施平臺升級為云平臺后,需要IT運維人員能夠把運行在傳統(tǒng)的企業(yè)IT基礎(chǔ)設(shè)施平臺之上的業(yè)務(wù)系統(tǒng)遷移至云平臺。
8、云平臺運行維護(升級)
云平臺運行過程中,需要IT運維人才時刻進行監(jiān)控、對于云平臺突發(fā)情況進行處理。
9、IT運維自動化系統(tǒng)開發(fā)
由于企業(yè)IT基礎(chǔ)設(shè)施運維過程中,涉及多業(yè)務(wù)、多場景、多平臺等,IT運維人員在運維過程中亟需一套本企業(yè)的IT運維管理系統(tǒng),但是由于每家企業(yè)的IT基礎(chǔ)設(shè)施異樣性,導致市場上無法采購標準化系統(tǒng)進行應用,大多數(shù)情況下由本企業(yè)IT運維人員根據(jù)企業(yè)自身情況進行開發(fā)。
10、業(yè)務(wù)系統(tǒng)海量數(shù)據(jù)分析及展示
企業(yè)在運營過程中產(chǎn)生大量的業(yè)務(wù)類數(shù)據(jù),并且此類數(shù)據(jù)對于生產(chǎn)、運營等有利于決策,因此IT運維人員需要對企業(yè)內(nèi)部或行業(yè)內(nèi)的數(shù)據(jù)進行收集、分析、展示等,最終為企業(yè)運營提供決策參考依據(jù)。
以上為我們?yōu)榱_列的IT運維人員能力要求或工作內(nèi)容,下面我們再來了解一下2020年IT運維市場規(guī)模,2020年有越來越多的企業(yè)開始擁抱互聯(lián)網(wǎng),借助互聯(lián)網(wǎng)開展"無接觸"式業(yè)務(wù),特別是在2020年初"新冠"疫情的影響下,公司為了生存開啟了全員在線辦公及業(yè)務(wù)全天侯在線處理等,這也就為企業(yè)打開了企業(yè)在線常態(tài)化;讓更多的工作借助互聯(lián)網(wǎng)完成,據(jù)權(quán)威機構(gòu)公布稱:"這一切將產(chǎn)生約100萬相關(guān)技術(shù)開發(fā)崗位及約10萬IT運維崗位,至2024年,IT運維行業(yè)市場容量將呈現(xiàn)出逐年增長態(tài)勢,到2024年IT運維管理行業(yè)市場規(guī)模將達到3832.8億元。"
2020年IT運維行業(yè)技術(shù)展望
企業(yè)對于IT運維人員要求越來越"T型"化,其中包含更深層次的專業(yè)化,自動化以及智能化,因此在2020年全球大多數(shù)的企業(yè)都在以行業(yè)標桿(例如:谷歌、亞馬遜、阿里等)為榜樣,著力發(fā)展企業(yè)自身的如下方向:
1、云計算
云服務(wù)器是由云服務(wù)廠商提供的性能卓越、穩(wěn)定可靠、彈性擴展的IaaS(Infrastructure as a Service)級別云計算服務(wù)。云服務(wù)器免去了采購IT硬件的前期準備,讓企業(yè)像使用水、電、天然氣等公共資源一樣便捷、高效地使用服務(wù)器,實現(xiàn)計算資源的即開即用和彈性伸縮。
2、DevOps
DevOps使企業(yè)項目開發(fā)者與企業(yè)項目開發(fā)后IT運維人員、測試人員、產(chǎn)品經(jīng)理、客戶等直接發(fā)生了連接關(guān)系,讓項目各方能夠進行更好地結(jié)合,把以住只關(guān)注自身業(yè)務(wù)轉(zhuǎn)移到整個交付過程,甚至關(guān)注到最終服務(wù)上,DevOps已經(jīng)成熟,其在2020年將成為每一位IT運維人員必備技能之一。
3、AIOps
IT運維內(nèi)容沒有變,但是IT運維方式在發(fā)生改變,AIOps將為我們IT運維人員"解放"雙手,讓我們可以花費更少的時間在IT基礎(chǔ)設(shè)施及IT業(yè)務(wù)系統(tǒng)監(jiān)控、日志、安全等工作上,把業(yè)務(wù)重心投放到企業(yè)IT基礎(chǔ)設(shè)施及IT業(yè)務(wù)系統(tǒng)發(fā)展、運營、服務(wù)決策上。
4、SaaS
SaaS(Software-as-a-Service)是企業(yè)提供應用、開發(fā)、IT運維等全套服務(wù)的一種形式,由于其不再需要用戶有任何IT基礎(chǔ)設(shè)施的投入,可以大大降低企業(yè)IT成本,獲得更優(yōu)質(zhì)的服務(wù)。
5、邊緣計算
隨著5G技術(shù)大面積應用,更多的邊緣設(shè)備需要對接到云平臺,并享受近十年云計算行業(yè)發(fā)展的紅利,但是如果生硬地把物聯(lián)網(wǎng)設(shè)備與云計算平臺對接,將會為云計算平臺帶來非常大的數(shù)據(jù)量的同時,也會影響到物聯(lián)網(wǎng)邊緣設(shè)備的數(shù)據(jù)處理能力,因此我們可以考慮把云計算技術(shù)向邊緣設(shè)備進行延伸,這就是我們所說的邊緣計算,IT運維人員將主導邊緣計算的成云能力。
6、Serverless
ServerLess,為一種無服務(wù)模式,目的讓企業(yè)不再關(guān)注IT基礎(chǔ)設(shè)施,由IT運維人員提供IT基礎(chǔ)設(shè)施后,多企業(yè)可以共享同一IT基礎(chǔ)設(shè)施平臺,企業(yè)可以攤銷更多IT基礎(chǔ)設(shè)施成本。
數(shù)字化時代,運維行業(yè)如何乘風破浪?
2020年,隨著新基建的大舉布局,能源行業(yè)將催生新一輪發(fā)展的新動能,特高壓投資規(guī)模大、產(chǎn)業(yè)鏈長、帶動能力強,將有效帶動上下游產(chǎn)業(yè)發(fā)展,拉動社會投資;以光伏、風電為代表的可再生能源產(chǎn)業(yè)將迎來機遇期。能源企業(yè)將在新業(yè)態(tài)、新產(chǎn)業(yè)、新服務(wù)的轉(zhuǎn)型發(fā)展中,謀求新路徑,促進行業(yè)本身和經(jīng)濟社會的雙重進步。
以大數(shù)據(jù)為重要特征的新基建,將為電力行業(yè)的生產(chǎn)、經(jīng)營、服務(wù)等領(lǐng)域帶來一片新的“藍?!?。僅從電力市場的角度考察,新基建項目不僅會帶來可觀的電力新需求,還將會衍生出新的市場。
平價時代的運維管理
2020年可以說是平價的元年,取消國家補貼之后,電站投資者對于發(fā)電量的要求更為苛刻,許多業(yè)主已經(jīng)把發(fā)電量作為電站評價的硬性指標。電站安全及發(fā)電量的高低,直接影響到電站資產(chǎn)收益。
平價上網(wǎng)的核心是度電成本,要做到全生命周期度電成本最優(yōu)設(shè)計,需要做到“四高”,即高質(zhì)量的設(shè)備、高質(zhì)量的設(shè)計、高質(zhì)量的施工和高質(zhì)量的運維。專業(yè)科學的運維可以保證電站的安全、故障預測及追蹤,確保降本增效。
全球領(lǐng)先的第三方資產(chǎn)運營管理服務(wù)商——甘肅上航電力運維有限公司認為,光伏電站專業(yè)化投資者始終是光伏行業(yè)發(fā)展的主力軍。在提質(zhì)增效的產(chǎn)業(yè)發(fā)展趨勢下,業(yè)主和投資商對電站的PR和投資收益回報越來越來關(guān)注,也越來越重視光伏電站的科學運維管理。
目前市場上的運維企業(yè)以五大四小電力公司、第三方運維公司、EPC、組件與逆變器企業(yè)、輸配電、電力工程企業(yè)等。從2017年開始,運維市場的競爭更激烈,有低價競爭的趨勢,隨著行業(yè)不斷發(fā)展,業(yè)主逐漸理解運維企業(yè)的報價“內(nèi)涵”,更看重他們的專業(yè)能力,價格趨于穩(wěn)定與合理。
“資產(chǎn)安全、發(fā)電量、可靠性、專業(yè)性,敬業(yè)程度、價格合理性這幾方面因素都是目前業(yè)主選擇優(yōu)秀運維公司所考量的標準,未來運維行業(yè)也會像組件產(chǎn)業(yè)一樣開始經(jīng)歷洗牌,上航電力隸屬于中國航天科技集團,作為央企,上航電力始終立足長遠考慮,口碑很重要?!鄙虾诫娏χ赋?。
除了低價競爭的亂象外,組件尺寸的多樣化趨勢也為下游運維帶來很多挑戰(zhàn)。組件尺寸越來越多,不僅導致光伏玻璃價格上漲,在后期運維時也很難找到外形尺寸、安裝孔位置統(tǒng)一的組件產(chǎn)品。上航電力呼吁,行業(yè)協(xié)會和生產(chǎn)企業(yè)應共同制定有關(guān)標準,在上游技術(shù)發(fā)展的同時兼顧下游應用延續(xù)性。
數(shù)字化時代電站大數(shù)據(jù)應用
隨著光伏平價上網(wǎng)時代的日益臨近,成功的數(shù)字化轉(zhuǎn)型對于電站建設(shè)提質(zhì)增效和提高發(fā)電量將是至關(guān)重要的。光伏大數(shù)據(jù)為電站運營企業(yè)提供解決運維管理、提產(chǎn)增效、資產(chǎn)評估、金融增信等問題所涉的數(shù)據(jù)支持。光伏大數(shù)據(jù)之“大”,一方面是指光伏數(shù)據(jù)所涉及的層面較廣,另一方面是指光伏數(shù)據(jù)所涉及的數(shù)量之多。
狹義的光伏數(shù)據(jù)是指通過數(shù)據(jù)采集器所獲取的光伏電站實時運行的監(jiān)測數(shù)據(jù)。廣義的光伏數(shù)據(jù)是指光伏電站全生命周期中相關(guān)的所有數(shù)據(jù),不僅包括光伏電站實時運行的監(jiān)測數(shù)據(jù),還應包括包括輻射數(shù)據(jù)、氣象數(shù)據(jù)和地理數(shù)據(jù),以及一些政策信息、銀行貸款利率和購電協(xié)議等。
“針對光伏電站產(chǎn)生的大數(shù)據(jù),需要進行各種提煉和挖掘,賦予數(shù)據(jù)生命力。”上航電力認為,“光伏電站監(jiān)測數(shù)據(jù)的價值在于對隱性故障的分析與判斷,可以隨時發(fā)現(xiàn)直流電流偏低與為零、逆變器的出力不足等情況。其次是對能耗的分析,包括方陣的夜間能耗、升壓站的能耗等,通過數(shù)據(jù)分析把能耗降低?!?/p>
作為國內(nèi)成立最早的第三方運維企業(yè)之一,上航電力依托自主創(chuàng)新研發(fā)的航天級光伏電站運維服務(wù)平臺——eHorus智慧云平臺,以全覆蓋交流側(cè)、直流側(cè)的光伏系統(tǒng)戶外檢測平臺為技術(shù)支撐,以O(shè)2O協(xié)同運維體系為指引,以兩級檢修體系和檢測評估能力為技術(shù)雙翼,構(gòu)建了完全符合電站運維管理特點和經(jīng)營需求的“航天運維”體系。
運維行業(yè)分析相關(guān)文章:
★ 最新運維述職報告范文5篇
★ 2021總監(jiān)試用期個人工作總結(jié)
雜糧行業(yè)分析介紹
上一篇:運維行業(yè)分析介紹
下一篇:再生資源行業(yè)分析