當(dāng)前位置:首頁 > 公眾號(hào)精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]“監(jiān)控”是微服務(wù)治理的一個(gè)重要環(huán)節(jié),監(jiān)控系統(tǒng)的完善程度直接影響到我們微服務(wù)質(zhì)量的好壞,我們的微服務(wù)在線上運(yùn)行時(shí),有沒有一套完善的監(jiān)控體系能去了解到它的健康情況,這對(duì)整個(gè)系統(tǒng)的可靠性和穩(wěn)定性非常重要。

來源:掘金

juejin.cn/post/6844903846192349191#heading-6


-     前言     -


“監(jiān)控”是微服務(wù)治理的一個(gè)重要環(huán)節(jié),監(jiān)控系統(tǒng)的完善程度直接影響到我們微服務(wù)質(zhì)量的好壞,我們的微服務(wù)在線上運(yùn)行時(shí),有沒有一套完善的監(jiān)控體系能去了解到它的健康情況,這對(duì)整個(gè)系統(tǒng)的可靠性和穩(wěn)定性非常重要。


- 微服務(wù)監(jiān)控體系的層級(jí)架構(gòu) -


1、五個(gè)層級(jí)的監(jiān)控

一個(gè)比較完善的微服務(wù)監(jiān)控體系需要涉及到哪些層級(jí)?如下圖所示,大致可以劃分為五個(gè)層級(jí)的監(jiān)控:


全面解析微服務(wù)系統(tǒng)監(jiān)控分層,啃透服務(wù)治理核心!


2、最底層基礎(chǔ)設(shè)施監(jiān)控

這層一般由運(yùn)維人員負(fù)責(zé),涉及到的方面比較接近硬件體系,例如網(wǎng)絡(luò),交換機(jī),路由器等低層設(shè)備,這些設(shè)備的可靠性穩(wěn)定性就直接影響到上層服務(wù)應(yīng)用的穩(wěn)定性,所以需要對(duì)網(wǎng)絡(luò)的流量,丟包情況、錯(cuò)包情況,連接數(shù)等等這些基礎(chǔ)設(shè)施的核心指標(biāo)進(jìn)行監(jiān)控。


3、系統(tǒng)層監(jiān)控

這層涵蓋了物理機(jī)、虛擬機(jī)、操作系統(tǒng)等,這些都是屬于系統(tǒng)級(jí)別監(jiān)控的方面,主要對(duì)幾個(gè)核心指標(biāo)進(jìn)行監(jiān)控,如cpu使用率、內(nèi)存占用率,磁盤IO和網(wǎng)絡(luò)帶寬情況。


4、應(yīng)用層監(jiān)控

這層涉及到方面和服務(wù)緊密相關(guān),例如對(duì)url訪問的性能,訪問的調(diào)用數(shù),訪問的延遲,還有對(duì)服務(wù)提供性能進(jìn)行監(jiān)控,服務(wù)的錯(cuò)誤率等,同時(shí)對(duì)sql也需要進(jìn)行監(jiān)控,查看是否有慢sql。對(duì)cache來說,需要監(jiān)控緩存的命中率和性能,每個(gè)服務(wù)的響應(yīng)時(shí)間和qps等等。


5、業(yè)務(wù)監(jiān)控

業(yè)務(wù)監(jiān)控具體指什么?舉個(gè)例子,比如說一個(gè)典型的交易網(wǎng)站,需要關(guān)注它的用戶登錄情況、注冊(cè)情況、下單情況、支付情況等等,這些直接影響到實(shí)際觸發(fā)的業(yè)務(wù)交易情況,這層監(jiān)控可以提供給運(yùn)營和公司高管們,提供他們需要關(guān)注的數(shù)據(jù),直接以數(shù)據(jù)支撐公司在戰(zhàn)略層面的決策和方向。


6、端用戶體驗(yàn)監(jiān)控

一個(gè)應(yīng)用程序可能通過app、h5、pc端的方式交付到用戶的手上,用戶通過瀏覽器,客戶端打開到我們的服務(wù),那么在用戶端,用戶的體驗(yàn)是怎么樣?用戶端的性能是怎么樣?以及有沒有產(chǎn)生錯(cuò)誤等等……


這些信息都需要進(jìn)行監(jiān)控并記錄下來,如果沒有監(jiān)控,有可能因?yàn)槟承〣UG或者性能問題,造成用戶體驗(yàn)非常差,而我們并沒有感知。


其中包括監(jiān)控用戶端的使用性能、返回碼,在哪些城市地區(qū),他們的使用情況是怎么樣,還有運(yùn)營商的情況,包括三大運(yùn)營商不同用戶的連接情況。我們需要進(jìn)一步知道,是否有哪些渠道哪些用戶接入的時(shí)候存在著問題,我們還需要知道客戶端使用的操作系統(tǒng)瀏覽器的版本。


簡(jiǎn)單來說,這就是我們體系化的監(jiān)控分層,每一個(gè)層級(jí)都非常重要。一般情況下,當(dāng)一個(gè)問題出現(xiàn)時(shí),較大概率會(huì)先暴露在用戶端或業(yè)務(wù)層,比如說,我們的訂單量下降了,業(yè)務(wù)人員和開發(fā)人員會(huì)先從上到下去逐層檢查是在哪里出現(xiàn)了問題,先確定是否哪個(gè)接口調(diào)用比較慢,哪個(gè)服務(wù)調(diào)用出現(xiàn)延時(shí),再看是否哪個(gè)機(jī)器負(fù)載過高了,然后再進(jìn)一步往下一個(gè)層去看,是否是網(wǎng)絡(luò)調(diào)用不穩(wěn)定導(dǎo)致。所以,一個(gè)好的監(jiān)控體系,在每個(gè)層級(jí)都非常重要。


- 微服務(wù)監(jiān)控的要點(diǎn) -


1、五個(gè)監(jiān)控要點(diǎn)

上文講解的是從層級(jí)方面進(jìn)行監(jiān)控,接下來,我們來看看哪些要點(diǎn)可以進(jìn)行監(jiān)控:


全面解析微服務(wù)系統(tǒng)監(jiān)控分層,啃透服務(wù)治理核心!

簡(jiǎn)單來說,可以分為以下五個(gè)點(diǎn):

1、日志監(jiān)控

2、Metrics監(jiān)控

3、調(diào)用鏈監(jiān)控

4、報(bào)警系統(tǒng)

5、健康檢查


2、典型主流的監(jiān)控架構(gòu)


全面解析微服務(wù)系統(tǒng)監(jiān)控分層,啃透服務(wù)治理核心!


在微服務(wù)運(yùn)行的體系下,我們一般把監(jiān)控的agent分散到各個(gè)服務(wù)身邊,agent分別是收集機(jī)器和服務(wù)的metrics,發(fā)送到后臺(tái)監(jiān)控系統(tǒng),一般來說,我們的服務(wù)量非常大,在收集的過程中,會(huì)加入隊(duì)列。一般來說用kafka等消息隊(duì)列有個(gè)好處,兩邊可以進(jìn)行解耦,可以起到龐大的日志進(jìn)行一個(gè)緩存的地帶,并且可以做到高可用,保證消息不會(huì)丟失。


日志收集目前比較流行的是ELK的一套解決方案(Elasticsearch,Logstash,Kibana),Elasticsearch 分布式搜索引擎,Logstash 是一個(gè)日志收集的agent,Kibana 是一個(gè)查詢的日志界面。


metrice會(huì)采用一個(gè)時(shí)間序列的數(shù)據(jù)庫,influxDB是最近比較主流時(shí)間數(shù)據(jù)庫。

微服務(wù)的agent例如springboot也提供了健康檢查的端點(diǎn),可以檢查cpu使用情況、內(nèi)存使用情況、jvm使用情況,這些需要一個(gè)健康檢查機(jī)制,能夠定期對(duì)服務(wù)的健康和機(jī)器的健康進(jìn)行check,比較常見的是nagios、zabbix等,這些開源平臺(tái)能夠定期去檢查到各個(gè)微服務(wù)的檢查程序并能夠進(jìn)行告警給相關(guān)人員,在服務(wù)未崩潰之前就可以進(jìn)行提前的預(yù)先接入。



	

免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉