close

隨着越來越多的應用採用雲原生架構,大家對可觀測性的關注度和討論度也越來越高,那麼可觀測性到底如何服務好上層業務?

本周,InfoQ 大會早班車欄目策劃的「可觀測在企業的實踐應用與實際價值」直播中也談到了這個問題,直播嘉賓阿里雲資深技術專家周小帆(承嗣)和字節跳動可觀測性平台負責人孔羅星對此分享了各自的看法。

孔羅星:回答這個問題前,我們首先要思考,我們做可觀測性是為了什麼?肯定是為了服務好我們上層業務的目標用戶,讓他們的體驗不受影響,這背後就需要保障後端一系列服務的穩定性,比如客戶端的穩定性。

如果要保障這些穩定性,就要能及時地發現問題、解決問題,這些能力就很依賴可觀測性的一系列技術。比如對我們來說,我們的業務包括抖音的 Feed 流、推薦,字節的電商等,他們背後的開發、QA、運維團隊都是我們的業務方,所以我覺得這個問題大致可以說我們怎麼服務好這些業務方。

以往大家可能不是那麼重視業務監控,但現在我認為業務監控對字節這種規模的企業來說是最重要的。比如交易這種下單付款的業務流程,它需要有一些黃金指標去判斷它有沒有異常,或者說它現在出問題了,問題有多嚴重。大家都能體會到這些背後的重要性,但真正做起來卻比較困難,因為不同的角色,大家對這些的認知可能不太一樣。這時候,我們就需要跟這些業務團隊一起去理清這些概念,然後把這些業務的監控點給他梳理完整。一旦業務監控完整了,不管業務方是做技術的還是非技術的,都能體會到業務監控的價值。這樣他們也就產生了對可觀測性的認可。

周小帆(承嗣):一個龐大的 IT 公司體系中有很多角色,服務好業務,其實就是服務好這個龐大公司裡面不同的工種,通過不同的方式去服務好他們。

我們以「鷹眼」為例,它最開始服務的對象是誰呢?是研發人員,具體來講就是我們這個微服務體系當中的研發人員。「鷹眼」的分布式鏈路追蹤體系是通過一些上下游的串聯,包括整個請求的全鏈路軌跡的回放等這些特性去服務研發人員,讓他們在日常工作中能夠很精準地排查到跨應用、跨進程中一些問題的根因。

但隨着應用的發展,我們也逐步開始服務一些其他團隊。比如對運維團隊,可觀測性的作用非常直接就是監控。但其實如今的運維承擔了多重職責,它不光要保障基礎軟件包括基礎設施的穩定性,它還要去看成本,包括在相對小型的公司中,它還承擔了一些安全防護方面的工作,比如平時的攻擊等這些安全方面的隱患它都要一肩挑起。那可觀測性的產品以及數據,怎麼樣去服務好這些客戶?其實是通過安全方面的一些特性(Cloud SIEM 和 RASP),包括像成本方面的一些報表等東西,幫助運維人員去更好地梳理平時的水位。我們說的容量預測也是同樣道理,就是怎麼樣用最經濟的方式去度過一個個業務高峰。

同時,我們還看到一些可觀測數據也服務了運營人員,他們更關注客戶的一些增長情況。當一個企業完完全全數字化以後,你的可觀測數據很多時候能夠反映你的業務運行狀況。所以我們看到很多運營人員,他在觀察這個業務增長的時候,他會拿這部分數據,通過一些清洗、梳理、編排來分析用戶的一些使用軌跡、用戶增長的一些分布情況等。可觀測可以通過各種方式去服務這些不同的工種。

今天我們還看到一個情況,就是我們有很多不同角色之間的,所謂「融合工種」之間的協同。因為不同工種在溝通交流的過程中,他們很多時候需要拿可觀測的數據作為溝通的橋樑。比如我們經常會看到運維人員拿着一些數據到研發人員那裡說哪裡不行,哪裡需要修改,這些都是日常工作中常常見到的案例。

所以說,可觀測並不是直接地給上層業務帶來什麼樣的收益,而是通過賦能一個企業的不同工種的日常工作,以及工種和工種之間的協同關係來去整體支撐一個大型企業的正常運作。這是我對可觀測怎麼樣去服務好上層業務的一個理解。

為了讓大家更了解可觀測性在業務中的應用,將於 10 月 31 日 -11 月 1 日舉辦的 QCon 全球軟件開發大會(北京站)上,我們設置了「雲原生時代的可觀測最佳實踐」專題,邀請到阿里雲資深技術專家周小帆(承嗣)擔任出品人。目前已確定來自騰訊雲、百度、雲杉網絡、阿里的 4 個議題,為你介紹典型行業在雲原生場景下對可觀測技術的落地案例與最佳實踐。

此外,我們還設置了雲原生微服務架構新趨勢、雲原生架構變革、研發效能提升、業務架構、面向資效平衡的架構設計、ML 模型效率與易用性等共 23 個專題,目前會議日程已上線,點擊底部【閱讀原文】了解更多專題詳情。

團隊購票可享更多優惠,購票請諮詢:15600537884(微信同電話)。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()