Skip to main content

📊 異常偵測與告警觸發

本章節解析異常處理流程的起點。在每秒流入海量數據的環境下,如何確保「每一筆異常都不被漏掉」且「任務派發具備事務性」,是系統設計的首要挑戰。

1. 多維度異常判定邏輯

統計引擎在數據寫入時,會同時啟動兩條判定路徑:

  • 統計違規 (OOC):基於統計規則(如 Nelson Rules)的判定。
  • 規格違規 (OOS):基於物理規格邊界 (USL/LSLUSL/LSL) 的判定。

2. 原子性保證 (Transaction Atomicity)

為了防止告警任務遺失,系統採用事務封裝技術:

  • 封裝作業:將「數據持久化」與「告警任務插入」鎖定在同一個資料庫事務中。
  • 續傳機制:若發送服務掛掉,背景補償程式會在恢復後自動續傳,達成「零丟失」。

3. 告警任務的優先級判定

系統根據以下維度動態計算優先級:

  • 違規嚴重度OOSOOS 優先級通常高於 OOCOOC
  • 製程關鍵度:關鍵工序標記為 High Priority
  • 派發策略:高優先級任務確保在 55 秒內觸發行動裝置通知。

4. 領域專家思維:補點情境

  • 歷史重判:修改舊數據時,系統自動重新執行該區間判定。
  • 延遲觸發:補點告警標記為 Backfill Alert,通常不觸發自動 Hold Lot,由工程師事後審查。