用於製造的邊緣 AI
無論您是首次評估以 AI 為基礎的檢測、正從一個無法滿足週期時間的雲端試點中恢復,還是要將一個可運作的原型擴展至 15 座廠房,問題都是一樣的:要將邊緣 AI 投入生產,是一項整合與營運的挑戰,而非硬體採購。
我們打造客製化的邊緣視覺與聲學 AI 系統,與您現有的 PLC、MES 及品質工作流程整合。供應商中立的架構。真正的 OT/IT 融合。可擴展的機群營運。
84%
的整合專案失敗或部分失敗
HiveMQ/產業資料,2025
5-15%
開箱即用 AOI 的誤判退件率
Edge AI Vision Alliance,2026
$22K/分鐘
非預期停機的平均成本(汽車業)
Siemens《停機的真實成本》,2024
邊緣 AI 的銷售說詞很有說服力:在輸送帶上裝一顆 Jetson,以 12 毫秒執行推論,即時偵測缺陷。NVIDIA 會賣您硬體。Landing AI 會賣您模型。但有 84% 的系統整合專案失敗或部分失敗,而原因從來都不是推論速度。
一家二級汽車沖壓廠在一台以每分鐘 40 衝程運轉的 200 噸連續模沖床上裝設兩台 GigE 相機。視覺模型在實驗室中以 97% 的準確率偵測毛邊、充填不足與滑屑壓痕。在生產現場,誤判退件率卻達到 14%。
為什麼?實驗室影像是在受控的 LED 環形照明下拍攝的。在沖床上,鈑金表面在每個衝程角度都會以不同方式反射廠房頂部的照明。沖壓潤滑劑在熱模與冷模上的積聚方式不同。一個班次的前 50 件零件,看起來與達到熱平衡時的零件不同。
解決之道不是更好的模型,而是搭配偏光背光的結構化照明以消除鏡面反射、一台熱像儀以將表面外觀與模具溫度建立關聯,以及一條納入冷啟動、產線中段與產線末段條件影像的訓練流程。接著才開始整合工作:透過 EtherNet/IP 將檢測結果對應到 Allen-Bradley ControlLogix,使退件致動器在 750 毫秒的衝程窗口內觸發、在 MES 中為每件零件標記其檢測結果以利追溯,並將缺陷影像依缺陷類別與模具工位篩選後送至品質工程師的儀表板。
那項整合工作佔專案時程的 60%。模型訓練佔 15%。硬體則只是一張採購單。
只有 34% 的製造商擁有具備即時資料串流的生產系統。其餘 66% 仍處於試點或研究階段。若沒有廠級的即時資料基礎設施,邊緣 AI 便無法大規模運作。如果您的歷史資料庫每 5 秒收集一次資料,但您的檢測決策需要在 50 毫秒內完成,那麼就存在一種架構上的不匹配,再多的邊緣運算也無法解決。
一項 2025 年的物流邊緣部署在上線六個月後崩潰。500 台邊緣裝置中有 30% 因電力問題而離線,而 IT 部門需要 48 小時才能解決每一台,因為他們沒有既定的現場故障排除流程。大規模的邊緣 AI 需要營運架構:具備回滾機制的 OTA 模型更新、裝置健康監測,以及 OT 團隊無需隨時聯絡供應商即可執行的維護程序。
這個市場版圖包含平台供應商、純 AI 新創公司、工業自動化既有業者,以及大型系統整合商。每一方都解決問題的一部分,卻沒有任何一方能為同時並用 Siemens 與 Allen-Bradley 的中型製造商,解決完整的「整合到營運」流程。
| 供應商 | 他們銷售什麼 | 優勢 | 落差 |
|---|---|---|---|
| Siemens Industrial Edge | 在 Siemens OT 生態系內運行邊緣應用的平台。符合 IEC 62443-4-2 的機群管理。 | 深度 PLC 整合(S7-1500)、Xcelerator 市集、安全認證。 | 以 Siemens 為中心。若您有一半產線使用 Allen-Bradley,Industrial Edge 無法弭平那個落差。2026 年 1 月的 CISA 安全公告要求進行修補。 |
| NVIDIA Metropolis | 用於視覺 AI 的開發工具與工作流程。超過 50 家工廠客戶,包括 Foxconn 與 Wistron。 | 99.8% 的 AOI 準確率基準。GPU 生態系、TensorRT 最佳化、DeepStream 流程。 | 銷售硬體與 SDK,而非已部署的解決方案。您仍需要整合、OT 連接性與營運架構。完全鎖定於 NVIDIA。 |
| Rockwell FactoryTalk VisionAI | 與 Rockwell PLC 閉迴路整合的無程式碼 AI 檢測。 | 廠房操作員無需 ML 專業知識即可訓練模型。緊密的 ControlLogix 整合。 | 僅限 Rockwell 生態系。無法與 Siemens、Mitsubishi 或混合供應商的廠房整合。相較於客製化架構,模型的精密程度有限。 |
| Landing AI(LandingLens) | 以資料為中心的視覺檢測平台。AI 開發成本最多降低 60%。 | 強大的資料標註工作流程。Andrew Ng 的團隊深知訓練資料瓶頸所在。 | 是平台,而非整合。無法在您特定的 OT 環境中處理 OPC-UA 連接性、PLC 編程或機群營運。 |
| Cognex(In-Sight + Edge Learning) | 以 FPGA 為基礎的邊緣學習(5-10 張訓練影像),外加用於複雜缺陷的深度學習。 | 業界標準的機器視覺。簡單通過/不通過檢查的快速設定。針對工廠環境強化。 | 以規則為本的傳統限制了彈性。複雜的多類別缺陷偵測或客製化分割邏輯,需要超越 Cognex 生態系。 |
| Augury | 用於機器健康的聲學與振動 AI。估值超過 10 億美元,客戶包括 PepsiCo 與 Nestle。 | 經 Fortune 500 部署驗證的預測性維護。強大的感測器到洞察流程。 | SaaS 模式,而非邊緣優先。專注於連續製程產業,而非離散式製造檢測。沒有視覺檢測能力。 |
| 地端 IPC + GPU | 搭載 NVIDIA RTX A2000/A4000 或 Intel Arc 的強固型 x86 工業電腦。 | OT 團隊熟悉。標準的 PCIe 擴充。維護更容易,可像更換其他元件一樣抽換 GPU 卡。 | 功耗較高(70W 以上,相較於 25W)。較大的尺寸需要機櫃空間。大規模部署時單位成本較高(每片 Jetson 模組 $500-900,相較於 $3-5K)。不適用於高密度部署。 |
| 四大會計師事務所/大型系統整合商 | Accenture、Deloitte 及大型工業系統整合商提供「智慧工廠」轉型計畫。 | 企業級的信譽。能配置多年計畫的大型團隊。與您的高階主管既有的關係。 | 他們實作平台,而非打造客製化推論流程。委託案起價為 50 萬至 200 萬美元以上,並以企業節奏推進。一個耗時 6 個月、用以決定要採購哪個平台的探索階段,與在第 3 號產線上裝好一座可運作的檢測站,並不是同一回事。 |
沒有任何供應商能妥善解決的落差:AI 採用的組織變革管理、僅有 5% 製造商保有完整設備故障紀錄時的訓練資料策展,以及單一廠房內運行兩家製造商三代 PLC 的跨供應商 OT 整合。
每一項委託案都是客製化的。以下是我們帶到工廠現場的能力。
我們設計完整的檢測流程:相機選型(用於移動輸送帶的全域快門 GigE Vision、用於靜態工位搭配結構化照明的面掃描)、模型架構(用於即時多類別偵測的 YOLOv8 變體、用於尺寸公差與表面分級的 U-Net 分割),以及量化策略。
當缺陷類別包含髮絲狀裂紋或變色等細微特徵時,我們會採用搭配 QAT(量化感知訓練)的 INT8 量化。訓練後量化則適用於高對比缺陷,例如缺件或嚴重變形。此選擇取決於您特定的缺陷分類,而我們會逐一缺陷類別驗證準確率,而不只是看整體指標。
超音波 MEMS 麥克風陣列(96-192 kHz 取樣)搭配運行於 ARM Cortex-M7 微控制器上的輕量 1D-CNN 分類器。模型小於 200KB,推論在 1 毫秒以內。我們使用 4-8 元素陣列進行空間濾波,可提供足夠的指向性,在 85-100 dB 的工廠環境中隔離軸承座的聲射,而無需 64 元素研究級陣列高達 1 萬至 5 萬美元的成本。
真正的工作在於建立頻譜庫。每一種軸承類型、每一台機器、每一種運轉條件都有不同的基準聲學特徵。我們在 2-4 週的受監控運轉中建立基準,接著針對您設備上潤滑流失與早期剝落所顯現的特定頻段(通常為 25-50 kHz)訓練故障分類器。
整合是專案失敗的首要原因(見上方統計數據)。我們橋接各種通訊協定:用於老舊設備的 Modbus TCP、用於 Allen-Bradley ControlLogix 的 EtherNet/IP、用於 Siemens S7-1500 的 Profinet,以及作為統一層的 OPC-UA。我們處理標籤對應、資料型別轉換,以及決定您的退件致動器是否能在衝程窗口內觸發的時序限制。
整合的範圍延伸到 PLC 之外。檢測結果會回饋至您的 MES 以做零件層級的追溯、您的 ERP 以做廢料核算,以及您的品質儀表板以呈現即時 SPC 圖表。我們以邊緣端的輕量 MQTT 訊息代理建構這些資料流程,而不是將所有資料都繞道雲端。
管理橫跨多座廠房的 50-500 台邊緣裝置,是一門營運紀律,而非一項軟體功能。我們打造機群管理層:透過 K3s(輕量 Kubernetes)的容器化模型部署、具備分階段推送與自動回滾的 OTA 更新流程、附帶告警的裝置健康監測,以及具備稽核軌跡的模型版本控管以利法規追溯。
每台裝置儲存其目前的模型以及前兩個版本。如果某個新模型在其首個生產班次中將誤判退件率推升超過可設定的閾值,該裝置便會自動回滾。這意味著一次糟糕的再訓練週期只會付出一個班次的偏高誤判退件成本,而非一場生產危機。
歐盟《AI 法案》的義務將於 2026 年 8 月 2 日全面適用。用於安全關鍵品質決策的製造 AI,需要符合性評鑑、資料譜系追蹤、人在迴路中的查核點,以及在每個已部署模型上標註風險分類標籤。我們從第一天起就將這種追溯能力建入部署流程:每一份模型產物都帶有元資料,將其連結至其訓練執行、資料集雜湊、驗證指標與核准紀錄。在安全方面,我們依循 IEC 62443 的區域與管道模型設計邊緣裝置的網路分段,強化分散式邊緣裝置為您 OT 網路所引入的攻擊面。
四個階段。務實的時程。您需要事先規劃以因應的注意事項。
我們盤點您目前的檢測流程、OT 網路拓撲、PLC 平台、MES 整合點與資料基礎設施。我們量測您實際的週期時間與延遲預算。我們清點現有的缺陷資料(若有的話)。
注意事項: 如果您的廠房沒有已標註的缺陷影像,也沒有系統化的缺陷分類,那麼資料收集階段(第 2 階段)將比您擁有歷史資料時多花 3-5 週。我們在一開始就誠實說明這一點,因為這是時程中最大的單一變數。
硬體採購與安裝。必要時的訓練資料收集:我們在您現有檢測旁以擷取模式部署相機 1-3 週,由操作員透過觸控螢幕介面標註缺陷。針對您特定缺陷分類的模型訓練、量化與驗證。PLC 整合開發:標籤對應、通訊測試、退件邏輯編程。
注意事項: 您生產線上的模型準確率不會與實驗室基準相符。照明變化、材料供應商更換與熱效應等真實世界條件,需要反覆的調校。我們在此階段預留 2-3 次訓練迭代。
AI 系統在您現有檢測旁運行,但不致動退件機構。每一個決策都會被記錄:原本會退件、原本會通過。我們與既有流程比對,以驗證偵測率、誤判退件率與週期時間合規性。操作員在切換之前建立對系統的信心。
注意事項: 影子模式會揭露訓練資料漏掉的缺陷類別。這是預期之中的,而非失敗。我們利用影子模式的發現在切換前進行再訓練。為了趕上線日期而草率略過影子模式,是部署後問題最常見的單一成因。
切換至即時退件致動。將營運交接給您的團隊:監測儀表板、再訓練程序、升級路徑。對於多產線推展,後續每條產線採用既定的模型與整合模式需 3-5 週。多廠房推展則每座廠房額外增加 2-3 週,用於網路佈建與站點校準。
注意事項: 第一條產線最昂貴也最緩慢。第 2 至 5 條產線則明顯更快。但每座廠房都有站點特有的變數(照明、振動、網路拓撲),需要在地校準。切勿假設 B 廠就是 A 廠的複製貼上。
單一產線部署的總時程: 8-14 週 從啟動到生產驗證。最大的變數是訓練資料的可得性,而非硬體採購。在上線後,請每週預留 2-4 小時/週 的品質工程師時間,用於持續的標籤審查與模型效能監測。
回答關於您現況的六個問題。此評估會辨識哪個部署階段適用於您的廠房,以及在邊緣 AI 能夠帶來成果之前需要哪些基礎工作。
1. 您目前的檢測方法是什麼?
2. 您是否擁有來自生產線的已標註缺陷影像資料?
3. 您工廠現場有哪些 PLC/自動化平台?
4. 您的目標部署規模為何?
5. 您的廠房是否具備來自生產設備的即時資料串流?
6. 您的生產 AI 是否有歐盟《AI 法案》的合規要求?
傳統自動光學檢測系統開箱即用時會產生 5-15% 的誤判退件率。經良好調校的 AI 視覺系統能將其降至 2% 以下,同時維持 99% 以上的真實缺陷偵測率。從 15% 降到 2% 以下的路徑,是一個校準與資料問題,而非模型架構問題。
首先,要針對可接受的產品變異進行訓練,而不只是缺陷資料庫。非密封面上的外觀刮痕與配合面上的刮痕並非同一種缺陷,而像素層級的分割讓您能編碼這種區別:「若刮痕長度在密封面 5mm 範圍內超過 2mm 則退件。」
其次,硬體維護所造成的誤判退件漂移比模型劣化更多。照明強度下降、相機光學元件累積殘渣、安裝振動使對位偏移。我們在每次部署中都建入排程化的硬體驗證:照明的光譜輸出檢查、光學元件的 MTF 量測、安裝座的位置漂移監測。
第三,要持續以近期的誤判退件樣本進行再訓練。六個月前出貨的模型從未見過新供應商略有不同的表面處理。我們建立回饋迴路,讓操作員在觸控螢幕上標記誤判退件,而那些影像會自動回饋至下一個再訓練週期。
閾值調校本身是依缺陷類別而定的:關鍵的結構性缺陷採取積極的靈敏度(接受更多誤報),外觀缺陷則採取放寬的閾值(將誤判退件降到最低)。這不是單一的信心度滑桿,而是一個圍繞您品質規格所建構的逐類別決策矩陣。
這是我們聽到最常見的技術問題,而誠實的答案是:取決於您的營運成熟度與規模。
Jetson Orin NX 在 15W-25W 的功耗範圍內提供 100 TOPS。搭載 NVIDIA RTX A2000 的工業電腦在 70W 下提供相近的推論吞吐量,但能給您熟悉的 x86 環境、標準的 PCIe 擴充,以及您 OT 團隊早已熟知的維護程序。
對於單站部署或具備強大 IT 支援的廠房,IPC 路線通常能更快投入生產。您的維護團隊無需學習嵌入式 Linux 即可抽換 GPU 卡。對於高密度部署(每條產線 10 個以上檢測站、多條產線),Jetson 的能源效率與尺寸勝出。將一個無風扇的 100x87mm 模組直接安裝在輸送帶機架上,便不再需要獨立的機櫃。
對於需要 50-200 台以上裝置的多廠房推展,Jetson 較低的單位成本(模組 $500-900,相較於強固型 IPC 的 $3,000-5,000)會顯著改變總持有成本。
我們以硬體彈性為原則進行設計。模型匯出為 ONNX 格式,可在 Jetson 上編譯為 TensorRT,或在 Intel/AMD IPC 上透過 ONNX Runtime 運行。應用程式容器無論哪種方式都相同。這意味著您可以在試點廠房以 IPC 起步,並在規模化推展時遷移至 Jetson,而無需重建軟體堆疊。
具備一個檢測站的單一產線部署,從啟動到生產驗證通常需要 8-14 週。時程的分布並不平均,而這種比例分配令大多數團隊感到意外。
硬體選型、採購與安裝需 2-3 週。模型開發在您擁有已標註訓練資料的情況下需 2-3 週。如果您沒有已標註資料,則需額外增加 3-5 週用於資料收集與標註。
OT 整合,意即透過 OPC-UA 或 Modbus TCP 將檢測結果從邊緣裝置送入 PLC 退件邏輯,需 2-4 週。這是我們看到時程最常落後的地方。AI 輸出與 PLC 程式之間的標籤對應,需要 AI 團隊與控制工程師之間的協調。
生產驗證,即在現有檢測旁以影子模式運行系統 1-2 週,然後切換並再進行一週的並行驗證。
第一條產線之後的多產線推展更快:每條產線 3-5 週,因為模型、整合模式與營運程序皆已建立。多廠房推展則每座廠房額外增加 2-3 週,用於網路佈建、OT 團隊訓練與站點特有的校準。最大的變數是資料。如果您目前的流程會產生已標註的缺陷影像,我們第一天就能開始訓練。如果操作員目前在未拍攝缺陷的情況下報廢零件,那麼資料收集階段便會主導整個時程。
這是大多數邊緣 AI 供應商避而不談的問題,卻是決定您的投資將會複利增值還是貶值的關鍵。每一次產品換線、新供應商材料或工具調整,都可能改變視覺系統眼中「正常」的樣貌。一家新的陽極處理供應商會產出略有不同的表面紋理。一套重新加工的模具會造成不同的分模線輪廓。在舊生產資料上訓練的模型開始將良品標記為不良。
我們將再訓練流程作為核心交付項目來打造,而非事後補充。邊緣裝置在生產期間持續擷取並預先標註影像。操作員在本地觸控螢幕介面上確認或更正標籤。已標註的影像在換班期間(而非即時)同步至地端訓練伺服器,因此不影響生產頻寬。當資料集超過閾值時(通常為每週)會自動執行再訓練。新的候選模型在部署前會以一個保留的測試集進行驗證。
關鍵的架構抉擇是具備即時回滾的版本化模型部署。每台邊緣裝置儲存目前的模型以及前兩個版本。如果某個新模型在其首個生產班次中將誤判退件率推升超過可設定的閾值,該裝置便會自動回滾並通報營運團隊。這意味著一次糟糕的再訓練週期只會讓您付出一個班次的偏高誤判退件成本,而非一場生產危機。
對於重大的產品變更,例如全新的零件幾何,我們會執行一次聚焦的資料收集衝刺:3-5 天的生產搭配強化擷取、由品質工程師進行人工標註,以及一個專屬的訓練週期。這就是 AI 檢測的維護成本。請每週預留 2-4 小時的品質工程師時間用於標籤審查,外加在地端 GPU 伺服器上每週再訓練的運算成本。
大多數歐盟《AI 法案》的義務將於 2026 年 8 月 2 日全面適用。用於安全關鍵決策、影響產品安全的品質把關,或員工監測的製造 AI 系統,屬於高風險分類,並需要在部署前進行符合性評鑑。
影響您邊緣 AI 架構的實務要求:從訓練資料、模型版本到生產決策的完整資料譜系追蹤。每一個檢測決策都需要一條可回溯至產生它的模型版本、訓練資料集與校準狀態的路徑。影響安全的工作流程需要人在迴路中的查核點。如果您的 AI 系統決定某個煞車元件是否通過檢測,必須有一位合格的人員能夠審查並推翻。每個已部署模型上的風險分類標籤需指明風險等級、使用情境與合規狀態。
對於邊緣部署,這意味著您的機群管理系統必須追蹤哪個模型版本運行於哪台裝置上、上次更新的時間,以及它是以哪些訓練資料所建構。我們將這種追溯能力建入部署流程:每一份模型產物都帶有元資料,將其連結至其訓練執行、資料集雜湊、驗證指標與核准紀錄。
罰則十分可觀:對於違禁的 AI 違規行為,最高可達 3,500 萬歐元或全球年營業額的 7%。即使是非違禁但不合規的高風險系統,罰款也達 1,500 萬歐元或營業額的 3%。如果您計畫在八月前讓 AI 投入生產,那麼現在就開始合規評估並非可有可無。
可以,而物理原理說明了為什麼。振動是一個落後指標。軸承只有在實質損壞已經發生之後才會異常振動:內圈剝落、滾動元件點蝕。等到加速規在滾珠通過頻率上偵測到偏高的振幅時,損壞已是結構性的。
超音波聲射是一個領先指標。當軸承失去潤滑或產生微觀裂紋時,增加的金屬對金屬摩擦會在 20-100 kHz 範圍內產生高頻應力波。這些超音波聲射會比低頻振動特徵或可聽見的噪音早數週出現。超音波異常與振動告警之間的偵測窗口,對於低速軸承(低於 1,000 RPM)通常為 4-8 週,對於高速主軸則為數天至數週。
部署使用以 96 kHz 或 192 kHz 取樣的 MEMS 麥克風陣列,搭配運行於 ARM Cortex-M7 等微控制器上的輕量 1D-CNN 分類器。模型很小,通常小於 200KB,而推論耗時在 1 毫秒以內。每個監測點的系統總成本為 $500-2,000,視感測器配置與安裝需求而定。
實務上的挑戰是環境噪音。一個處於 85-100 dB 的工廠現場充滿了堆高機、氣動工具與鄰近機械。我們透過小型麥克風陣列(4-8 元素,而非某些論文所提議的 64 元素陣列)進行空間濾波,以聚焦於軸承座並抑制來自其他方向的環境噪音。在大多數安裝幾何下,四個元素便能以大型陣列一小部分的成本提供足夠的指向性。
對於運轉於 10,000 RPM 以上、乾轉事件可在數秒內使軸承熔焊的關鍵主軸,我們透過一個安全評級的繼電器,將分類器輸出直接接線至機器的緊急停止電路。從偵測到致動的延遲在 5 毫秒以內。由聲學偵測所避免的 $500 軸承更換,與由振動監測才察覺的 $45,000 主軸更換,兩者間的成本差異使得投資報酬率的論證顯而易見。
支撐這個解決方案頁面的技術基礎,可作為互動式白皮書取用。
延遲斷路開關:打造後雲端時代的工業架構對邊緣推論延遲、INT8 量化基準、聲學 TinyML 架構,以及將 AI 從雲端移至工廠現場的經濟論證所做的深入技術分析。
Knauf Insulation 在第一年透過用於減少廢料的邊緣視覺 AI 達成 511% 的投資報酬率。
無論您需要的是用以證明商業案例的單一產線試點,還是用以橫跨多廠擴展的機群架構,我們都從對您現有生產線進行延遲與整合稽核開始。