
前言
在數字化轉型浪潮下,全球基礎軟件行業正經曆革命性變革。隨著物聯網設備數量的激增,企業每天產生的運維日誌、設備狀態、網絡流量等可觀測性數據呈指數級增長。企業運維團隊麵對 TB 級數據如同「大海撈針」,故障定位耗時從分鍾級延長至小時級,人工經驗主導的決策更讓企業錯失實時響應的黃金窗口。
在此背景下,作為全球領先的「雲邊端」連接與數據平台供應商,EMQ 創新性的結合 EMQX 的可觀測性數據與 DeepSeek 的 LLM(大語言模型)服務,利用向量化知識庫、自動化代碼生成和自然語言處理等 AI 91视频免费观看,幫助用戶快速解決設備數據無法上傳、設備斷連、連接時延增加、數據轉發緩慢等問題。
現有物聯網數據可觀測性工具的局限
物聯網數據的可觀測性是通過監控和管理車聯網、工業互聯網等平台的數據,確保數據在複雜的係統、流程和管道中保持高質量、可用性和可靠性的一種實踐。它幫助用戶全麵了解數據的狀態,快速定位和分析問題,提升係統的穩定性和運維效率。
在車聯網、工業互聯網等場景中,由於網絡條件和應用的複雜性等原因,設備斷線、訂閱消息變慢、消息轉發滯後、消息丟失等問題時有發生。如果沒有高效的可觀測性數據采集、存儲和分析係統,運維團隊將花費大量時間定位和分析相關故障,導致係統 MTTR(Mean time to recovery)增加、用戶體驗下降,甚至引發客戶投訴和品牌聲譽受損等問題。
一般而言,可觀測性數據分析依賴於指標(metrics)、跟蹤 (tracing)和日誌 (logs)三大數據源:
1. 指標(metrics)
用戶可以從基於時間維度的折線圖等整體快速判斷係統總體上是否有問題。
· 通過係統的 CPU、內存和網絡等指標使用情況來了解在指定時間段是否存在異常情況;
· 通過 EMQX 係統了解連接、消息發送和轉發等情況。
市場已經有 Prometheus 和 Grafana 等成熟的相關產品,可以非常方便地對這些數據進行存儲和展示。
2. 跟蹤(tracing)
了解係統內部的運行狀態,知道問題出在哪裏。
· 通過在係統內部埋點的方式來跟蹤係統內部、跨係統之間的調用鏈關係,以及各組件所消耗的時間。
目前市場上 Jaeger 等相關產品可以對鏈路數據進行存儲、分析和展示。
3. 日誌(logs)
用於定位故障的準確原因。
· 日誌是程序在執行過程中通過代碼打印的,用於讓開發和運維人員了解係統的執行狀態,以及執行過程中發生的一些錯誤和異常情況。
市場上有 ElasticSearch 等相關成熟的產品可以實現對日誌的存儲、查詢和展示。
目前,市場中的大部分可觀測性數據工具都存在以下局限性:
· 功能預置化:大部分功能依賴供應商預設,無法靈活應對未知異常。
· 知識庫靜態化:依賴文字匹配搜索解決方法,無法針對相關問題提供精準建議。
· 智能化不足:缺乏問題推理能力,難以應對複雜場景下的問題分析。
利用 AI 實現更加智能的可觀測性數據分析
基於大語言模型(LLM)提供的推理能力,可以顯著提升可觀測性數據分析的智能化水平:
· 智能化推理:結合上下文對係統異常進行推理和判斷,而非依賴硬編碼規則。
· 自然語言處理:通過 AI 生成代碼的方式靈活處理數據,滿足特殊場景需求。
· 向量化知識庫:利用 AI 推理能力,精準輸出問題解決方案。
· AI Agent 框架:基於 LLM 推理提供的方案提供自動化運維的能力,實現 AI 時代的智能運維。
DeepSeek R1 是深度求索 (DeepSeek) 公司開發的推理優化模型,通過強化學習訓練(RL),能夠在複雜場景中進行高效的推理和內容生成。而 DeepSeek V3 是一款強大的生成式大語言模型,采用混合專家架構,優化了訓練效果和內容生成的效率與質量。通過結合 DeepSeek 的 R1 和 V3 模型,可以高效處理物聯網場景中的海量異構數據和交互需求。
為了幫助用戶進行更加高效的物聯網係統運維,EMQX ECP 最新版本集成了基於 DeepSeek V3 的數據可觀測性工具。在 EMQX 集群和邊緣服務快速部署、遠程操作、集中管理等功能的基礎上,用戶可以充分利用 AI 的推理能力,實現數據驅動的物聯網智能運維。
該數據可觀測性工具主要包含以下三部分:
1. 向量知識庫構建:將產品文檔、運維知識和事故分析報告等文檔進行向量化,增強 LLM 對相關問題的高效檢索和應用;
2. 數據源收集:EMQX 將指標、跟蹤和日誌等數據通過 OpenTelemetry 等協議發送到 Datalayers 數據庫中,為 LLM 提供需要分析的數據源;
3. 問題解決:
(1)直接從向量庫中搜索到相應的內容作為上下文,並結合 prompt,把推理結果 (output) 直接返回給用戶;
(2)根據用戶的需求,在 Datalayers 數據庫中加載相關的數據,並生成相關的代碼,對數據進行處理。同時將有問題的數據和向量庫中找到的結果作為上下文發送給 LLM,由 LLM 推理,形成相關的解決方案,組織為自然語言並返回給用戶。

根據客戶需求,後續還可以增加 Agent 自動運維編排的場景。例如:當發生某些情況時,自動發起擴容或發送通知等操作;另外還可以增加自動線上運維巡檢,生成並發送高質量的巡檢報告等。
AI 交互操作演示
接下來,91视频免费播放將展示如何使用 AI 進行交互操作。在部署 EMQX ECP 後,用戶可以進入工作台並點擊左側導航欄中的「鏈路追蹤」功能,利用 EMQX 提供的端到端鏈路追蹤能力來分析和排查問題。盡管鏈路追蹤提供了強大的數據支持,幫助定位和發現問題,但在複雜情況下仍需要專業背景來分析問題根源。為提高效率,91视频免费播放將 DeepSeek 的大語言模型集成到鏈路追蹤高級查詢頁麵的數據分析能力中,利用 AI 模型的推理和生成能力來幫助用戶更快速、智能地定位問題並提供解決方案。
數據分析概覽功能
首先,進入鏈路追蹤頁麵並點擊右上角的「高級查詢」按鈕,進入查詢頁麵。在這裏,用戶需要選擇一個 EMQX 集群標識,並根據需要選擇一個或多個 Client ID 來定位數據源。接著,選擇想要查詢分析的時間段(默認為全部時間段),然後點擊查詢按鈕,係統會返回指定 Client ID 下的所有鏈路追蹤數據。

當查詢結果返回後,用戶將看到包含多個鏈路追蹤數據的列表,通常數據量較大。人工識別異常數據可能較為困難,此時可以使用 AI 助手功能,點擊右下角的 AI 助手按鈕後,會彈出一個對話框。用戶可以在對話框中輸入需要分析的數據的需求,AI 助手會根據輸入的信息生成數據分析結果,並提供優化建議等。

當點擊右下角的 AI 助手中的「追蹤數據概覽」快捷按鈕後,係統會生成針對當前查詢到的所有追蹤數據的概覽分析。該分析通常包括以下幾個部分:
· 整體狀況:展示當前查詢的所有客戶端 ID 的總追蹤條數、成功率、平均響應時間、最小響應時間、最大響應時間,以及 P95 和 P99 響應時間。
· 異常情況:顯示錯誤率較高的客戶端(錯誤率超過一定閾值)、響應時間異常的客戶端(平均響應時間超過閾值)以及異常追蹤(例如耗時特別長的追蹤)。
· 關鍵發現:列出主要異常的客戶端或鏈路,幫助用戶定位潛在的故障點。
· 建議:根據數據分析結果,係統會給出針對性的優化建議和排查方向。

根據概覽功能生成的報告,用戶就可以迅速識別出異常的鏈路數據。例如,係統可能會指出某個客戶端的響應時間過長,或某些 Client ID 的鏈路錯誤率過高。基於這些信息,用戶可以通過搜索和過濾,立即找到異常鏈路的 Trace ID。後續隻要點擊 Trace ID,下方就會顯示該追蹤的詳細信息,展示相關服務和操作的時間軸的鏈路結構,其中每個 Span 代表一個操作,用戶可以將鼠標懸停在某個操作上,查看具體步驟和信息。

雖然有效數據屬性有助於定位問題,但在例如隻有錯誤碼的情況下,問題可能不夠清晰。這時,可以使用 AI 助手功能,點擊「Spans 數據概覽」按鈕,快速分析詳細原因。
AI 助手將提供每個 Span 操作的詳細分析,包含錯誤信息、潛在原因及修複建議。通過接入91视频免费播放構建的知識庫,AI 能夠更加準確地分析錯誤原因,並給出針對性的排查方案或修複建議。借助知識庫中積累的曆史案例和解決方案,AI 可以迅速定位真實問題,避免用戶手動搜索和排查,提高問題定位的精準度和效率。

腳本模式功能
EMQX ECP AI 助手還提供了自定義腳本功能。通過對話框上方的腳本模式開關,用戶可以啟用腳本模式,利用 DeepSeek 強大的模型和編碼推理能力。腳本模式開啟後,用戶可以通過對話框發送自定義數據需求,AI 會自動生成相應的數據分析腳本,並根據當前的數據執行運算,快速得出分析結果。AI 可基於結果自動生成圖表或文檔,幫助用戶直觀地理解數據,快速定位問題。
示例 1:計算 duration 的平均值
在腳本模式下,用戶發送了一個「計算當前追蹤數據中 duration 字段(耗時)的平均值」的請求。AI 助手此時會根據需求自動生成並執行相關的腳本代碼,然後計算出 duration 的平均值,並返回結果。結果將直接顯示在對話框內,同時生成了一份關於結果分析的總結報告。

示例 2:查看錯誤的 Trace 對於當前總的 Traces 的占比分布
AI 助手會根據用戶需求來自動判斷是否需要生成對應的圖表,例如當用戶提問了「查看錯誤的 Trace 對於當前總的 Traces 的占比分布」時,AI 助手會根據請求生成分析腳本,計算出錯誤 Trace 的占比,並自動繪製以圖表的形式呈現,並附加上結果和圖表的分析報告。此功能非常適合用戶通過比例分析來評估係統健康狀態。

通過腳本模式,AI 不僅可以幫助用戶完成複雜的數據分析任務,還能根據用戶的需求靈活生成代碼。用戶無需編寫代碼或手動計算數據,AI 會自動進行推理和計算,減少人工幹預,提高數據分析效率。此外,生成的圖表和報告更加直觀,幫助用戶迅速掌握關鍵信息,優化決策過程。
總結
結合 EMQX 的可觀測性數據與 LLM DeepSeek 的數據推理能力,可以顯著降低係統運維的工作量和成本,提升運維效率和質量,同時大幅縮短係統故障的定位和分析時間,並提供有針對性的方案或建議,進一步提升客戶滿意度。隨著 LLM 91视频免费观看的快速發展,智能運維 Agent 正在實現更複雜的自動化能力,逐步解放運維和支持人員的工作負擔,為企業的數字化轉型提供強有力的支持。
星空人工智能91视频免费观看網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com91视频免费播放將及時溝通與處理。!:首頁 > 星空人工智能產業 > AI大模型 » EMQ 如何用DeepSeek大模型重構可觀測性數據分析?