自主實驗室設計 + AI 整合
高通量篩選所涵蓋的範圍,與化學空間實際所含的內容之間的差距並非漸進式的,而是天文級的。自駕實驗室藉由以策略性、AI 主導的實驗取代隨機搜尋,來縮小這道差距。我們建構最佳化引擎、儀器整合與閉迴路架構,將您現有的實驗室轉變為一套自主探索系統。
10-50 倍
達到目標所需的實驗數量更少
貝氏最佳化 vs. 隨機篩選
高達 90%
採用 CIBO 後試劑成本降低幅度
成本知情型 BO,ChemRxiv 2024
24/7
設備使用率 vs. 人力配置的 30-40%
自主運作基準
湯瑪斯·愛迪生用來測試數千種碳絲的方法,是理論落後於實驗的那個時代的產物。到了 2026 年,研發實驗室仍在執行它的各種變體,而經濟狀況不但沒有改善,反而更糟。
符合 Lipinski 規則、具藥理活性的小分子數量估計約為 1060。一場大型 HTS 行動測試 106 種化合物。這僅涵蓋整個空間的 0.000000000000000000000000000000000000000000000000000001%。延伸至複雜的生物製劑與多元素合金,該空間趨近於 10100,超過可觀測宇宙中的原子數量(1080)。
HTS 假設答案存在於一個預先合成好的化合物庫中。對於新穎的材料類別,最佳組成幾乎肯定不存在於地球上的任何化合物庫裡。您是在用一根茶匙,在如太平洋般大小的乾草堆中尋找一根針。
每項資產的藥物開發成本已達 20 億美元以上(Deloitte,2024)。製藥研發在臨床試驗中的失敗率徘徊在 90%。製藥業內部報酬率(IRR)在 2022 年跌至 12 年來最低點 1.2%,隨後在 2024 年回升至 5.9%,這在很大程度上是仰賴 GLP-1 的異常突出表現。這就是 Eroom 定律:研發生產力在支出不斷攀升的情況下卻持續下滑。
在材料科學領域,成本以不同方式衡量,但模式相同。電池研究人員追求理論上能提供高能量密度、卻違反熱力學穩定性限制的材料。若缺乏「先模擬、後合成」,這些死胡同往往要在數月的實驗室時間與數十萬美元的試劑成本之後才會被發現。
一間中型材料實驗室正在尋找一種無鉛鹵化物鈣鈦礦,需具備特定的能隙與穩定性特性,以用於次世代太陽能電池。該組成空間包含 5 種陽離子選項、8 種陰離子組合,以及連續的化學計量比,得出約 108 種可行組成。
傳統做法:一位博士後研究員根據文獻直覺與指導教授建議,每週合成 3-5 種組成。以每次合成 150 美元(前驅物、基板製備、表徵)計算,他們在一年內花費 78,000 美元測試 520 種組成。那僅是空間的 0.00052%。所找到的最佳候選者,可能離全域最佳解相去甚遠。
若採用貝氏最佳化,搭配一個以 Materials Project 中 50,000 個 DFT 計算鈣鈦礦結構預先訓練的 GNN 代理模型,該系統可在 80-120 次針對性實驗中找出組成空間中表現最頂尖的 0.1%。試劑總成本:12,000-18,000 美元。代理模型能在毫秒內預測能隙與生成能。採集函數(期望改善量)只挑選那些預測效能高、或模型不確定性大到值得進一步研究的組成。其餘 400 多次只會產生漸進式或無用數據的實驗,根本不會被執行。
自駕實驗室領域自 2024 年以來迅速整併。在選擇路徑之前,您應了解每個選項實際提供什麼,以及它在哪裡有所不足。
| 選項 | 您能獲得什麼 | 典型成本 | 誠實的缺口 |
|---|---|---|---|
| Radical AI | 完整自主實驗室。每天 25 種以上合金。已篩選數十億種組成。布魯克林海軍工廠設施(2026 年 1 月)。5,500 萬美元種子+輪,6,000 萬美元 A 輪。 | 合作夥伴關係/合約 | 聚焦合金。您的數據存放在他們的技術堆疊上。最佳化邏輯是他們的黑盒子,您無法修改。適用於冶金,較不適用於製藥或 MOF。 |
| Emerald Cloud Lab | 位於 CMU 的 200 多台自動化儀器。寄送樣本,取得結果。提供 GxP 企業層級方案。 | 訂閱制(每年 5 萬至 50 萬美元以上) | 僅限遠端。您不會親自操作儀器。受限於他們支援的檢測目錄。專有化學數據會離開您的場所。 |
| Atinary | 搭載 ML 最佳化器的 SDL 軟體平台。DMTAL 循環。在波士頓推出「科學發現工廠」(2025)。 | SaaS + 整合 | 支援特定儀器類型。要在其 UI 之外客製化最佳化邏輯,需要他們的工程團隊。雖在成長,但尚未在企業規模下久經考驗。 |
| Kebotix | 面向材料探索的企業級 AI。雲端 + ML + 物理建模 + 自動化。 | 企業合約 | 總部位於劍橋,創立於 2017 年。相較於較新的進入者,公開驗證較少。平台式做法意味著您的工作流程要去適應他們,而非反過來。 |
| 四大/大型系統整合商 | 數位轉型顧問服務。實驗室策略、廠商選擇、變革管理。團隊龐大、名號響亮。 | 50 萬至 500 萬美元以上的委託案 | 他們導入平台,而非建構最佳化引擎。沒有內部的 BO/GNN 專業能力。交付成果是一份策略簡報與廠商整合,而非一套可運作的閉迴路。原本應該花 3-4 個月的工作,他們的委託案卻會拖上 6-18 個月。 |
| 內部團隊 | 完全掌控。建構您自己的 BO 引擎、撰寫您自己的 SiLA 2 驅動程式、訓練您自己的 GNN。 | 2-3 位 ML 工程師 + 1-2 位自動化工程師(每年 80 萬至 150 萬美元) | 招募既懂高斯過程、化學空間,又懂 SiLA 2 的 ML 工程師極為困難。在產生任何實驗價值之前,需要 6-12 個月的爬升期。在競爭激烈的勞動市場中流動率很高。 |
| Veriprajna | 客製打造的 BO 引擎、GNN 代理模型、SiLA 2 儀器驅動程式、GxP 合規層。您擁有所有程式碼與模型。可與您現有硬體整合。 | 15 萬至 60 萬美元的專案 | 沒有託管實驗室設施。沒有預先建好的儀器庫。每項整合都是客製工程。對於標準化檢測(平台即足以勝任)而言,速度較慢。 |
正確的選擇取決於您的儀器組合、數據敏感性與法規要求。對於使用常見儀器、無智財敏感性的標準化檢測,平台行得通。對於擁有老舊設備、專有數據、GxP 限制或非標準最佳化問題的實驗室,客製整合是唯一的路徑。
六項能力,將現有實驗室轉變為一套自主探索系統。每一項都可作為獨立委託案,或作為完整閉迴路建置的一部分。
我們會針對您特定的材料領域,配置代理模型、採集函數與保真度層級。當您的組成空間超過 50 個維度時,我們會採用稀疏變分高斯過程(SVGP),因為具備 O(n3) 複雜度的標準高斯過程將無法收斂。對於具有 10-15 個參數且試劑昂貴的反應最佳化,我們會部署成本知情型 BO,以最小化每單位資訊所需的成本。
採集函數比多數實驗室所認知的更為重要。期望改善量較為保守,適合用於開發已知具前景的區域。湯普森抽樣能促進批次多樣性,在同時進行多個平行合成時表現較佳。我們會根據您的實驗設置來選擇,而非套用預設值。
您實驗室裡的每一台儀器都說著不同的語言。Hamilton STAR 使用 VENUS 腳本。Tecan EVO 使用 FluentControl API。Agilent 儀器則暴露 FAST API 或老舊的序列協定。我們為每一台建構 SiLA 2 微服務驅動程式,讓您的 AI 最佳化層無論底層是哪台儀器,都能送出一致的單一指令格式。
缺乏現代 API 的老舊儀器(10-20 年歷史)會以轉接硬體(Raspberry Pi 或嵌入式控制器)包裹起來,並執行一個 Python SiLA 2 伺服器。每項驅動程式整合需 2-4 週,視廠商 API 文件品質而定。一間典型的中型實驗室需要 6-12 個驅動程式才能構成可運作的閉迴路。
圖神經網路在分子性質預測上勝過 LLM,因為分子是 3D 圖,而非文字字串。我們建構 GNN 代理模型(用於晶體結構的 CGCNN、用於分子幾何的 SchNet 或 DimeNet),能在毫秒內預測目標性質,而非 DFT 計算所需的數小時。
對於研究充分的材料族,我們會從 Materials Project(154,000 個以上結構)或 AFLOW 進行引導啟動。對於新穎類別,我們會採用來自相關族系的遷移學習,並以主動學習透過針對性 DFT 計算來填補空缺。Matbench Discovery 基準(2026)顯示,最佳模型可達到 6.1 倍的探索加速因子。我們會針對您的領域以該範圍為目標。
對於製藥實驗室,FDA 的 ALCOA+ 框架要求每一個自動化步驟都必須可歸屬、清晰可讀、即時記錄、保有原始性且準確無誤。多數 SDL 軟體把合規當作事後補救。我們將稽核軌跡層建構為一項專屬服務:它攔截來自 BO 引擎的每一個數據事件、每一個機器人動作與每一個表徵結果,加上時間戳記,並將其儲存在僅可附加的日誌中。
CDER 警告信在 2025 財年激增 50%,其中數據完整性是主要的引述類別。2026 年 1 月 FDA/EMA 就藥物開發中的 AI 發布的聯合指引,為數據治理與人類監督設定了明確期望。我們從一開始就架構合規,而非在稽核發現問題後才硬補上去。
將完整的設計-製作-測試-分析(DMTA)循環作為一套生產系統。BO 引擎產生一個候選者。機器人平台透過 SiLA 2 接收合成指令。表徵儀器(XRD、光譜、顯微鏡)量測結果。回饋更新代理模型。該循環在無人為干預下不斷重複。
我們納入一個數位孿生層,在實體執行之前模擬每一次實驗:驗證流程時序、檢查機器手臂的碰撞路徑、標示試劑相容性問題,並透過將即時感測器數據與預測行為比對來偵測異常。這可預防柏克萊 A-Lab 所遭遇的 29% 合成失敗率,並讓您的 24/7 運作不會在夜間出現意外。
將您 20 年歷史的 HPLC 包裹進一個 SiLA 2 微服務驅動程式。將您的 Excel 實驗追蹤替換為一條結構化數據管道,直接餵入最佳化迴路。將您各自獨立的 LIMS、ELN 與儀器輸出統整進單一資料湖,讓每一次實驗(包括失敗)都成為代理模型的訓練數據。
無需拆除重建。我們在仍可運作的設備之上加一層智慧層。典型的現代化路徑:先做儀器驅動程式(第 1-8 週),再做數據管道(第 4-12 週,重疊進行),第三步是 BO 引擎(第 8-16 週),最後是閉迴路整合(第 12-20 週)。科學家在整個過程中持續執行他們目前的工作流程。
這是一間材料實驗室在針對特定能隙與熱穩定性目標、最佳化無鉛鹵化物鈣鈦礦組成時的代表性工作流程。
我們從 Materials Project 拉取 50,000 個 DFT 計算的鹵化物鈣鈦礦結構。一個 CGCNN(晶體圖卷積神經網路)以這些數據預先訓練,以從晶體結構預測生成能與能隙。在單一 GPU 上訓練需 4-8 小時。該模型對已知鈣鈦礦的生成能達到約 0.05 eV 的 MAE,這準確到足以為候選者排序,卻不足以取代實驗驗證。這正是重點:代理模型是一道過濾器,而非神諭。
組成空間定義如下:Cs/MA/FA 陽離子比、Sn/Ge/Bi 取代程度、I/Br/Cl 鹵化物比。這構成一個約 30 維的連續空間。多目標:最大化能隙穩定性(針對串疊式太陽能電池應用,目標為 1.2-1.5 eV)、最小化生成能(熱力學穩定性),並最大化熱分解溫度(運作耐久性)。BO 引擎使用多目標採集函數(期望超體積改善量)來探索帕雷托前緣。
BO 引擎首先查詢 CGCNN 代理模型(每次預測僅需毫秒、成本近乎為零)。它生成 10,000 個候選組成,並依預測的帕雷托最佳性加以排序。前 200 個會被送入快速 DFT 鬆弛計算(每次計算數分鐘,每次運算成本約 0.50 美元)。MF-BO 框架學習 GNN 預測與 DFT 結果之間的相關性。在相關性強的地方,便信任 GNN 預測。在相關性弱的地方(通常位於訓練分布的邊緣),則觸發更多 DFT 計算。此階段可在不進行任何實體合成的情況下淘汰約 99% 的候選者。
前 20 個經 DFT 驗證的候選者會以合成指令送往機器人平台。一台液體處理器(透過 SiLA 2 控制)分配前驅物溶液。一台加熱板/管狀爐執行退火流程。一台 XRD 儀器(SiLA 2 連線)確認晶相。一台 UV-Vis 光譜儀量測能隙。一台 TGA 儀器量測熱分解。所有結果皆加上時間戳記、連結至原始 BO 建議,並儲存於結構化數據管道中。
每一筆實驗結果,包括失敗的結果,都會回饋至代理模型。一個在 150C(而非預測的 300C)就分解的組成是有價值的:它告訴模型其預測在何處出錯,並使決策邊界更為銳利。BO 引擎更新其後驗、重新計算採集函數,並選出下一批。經過 4-6 個循環(2-3 週內共 80-120 次實驗),系統便已描繪出可行的帕雷托前緣。實驗室如今擁有 5-10 種同時滿足全部三項目標、經實體量測確認、且每一種都附有完整不確定性表徵的組成。
一場典型的閉迴路實驗室建置,從啟動到自主運作需 16-24 週。每個階段都有明確的交付成果與一道執行/中止關卡。
我們盤點每一台儀器、其 API 能力、目前的數據流,以及整合複雜度。我們描繪最佳化問題:您在搜尋什麼、維度有多少、有哪些限制。我們評估現有數據(LIMS 匯出、ELN 紀錄、先前實驗結果)作為代理模型引導啟動的潛力。
交付成果: 一份技術架構文件,載明 BO 引擎配置、含各儀器時程的儀器整合計畫、代理模型策略,以及數據管道設計。這份文件詳盡到,即使您選擇不與我們合作,您的內部團隊也能獨立執行它。
為每一台儀器平行進行 SiLA 2 驅動程式開發。數據管道建構:從原始儀器輸出到結構化格式,再到模型可用的特徵。必要時建立老舊系統轉接器。每個驅動程式先個別測試,再以編排序列進行測試。
交付成果: 可運作的 SiLA 2 驅動程式,涵蓋所有儀器。具備結構化實驗記錄的統一數據管道。您的實驗室在此階段持續執行既有工作流程。
代理模型訓練(或針對新穎材料類別進行遷移學習 + 微調)。以選定的採集函數與保真度層級配置 BO 引擎。用於流程模擬的數位孿生層。與儀器層進行整合測試:在已知材料上跑完整的 DMTA 循環,以在部署到您實際的搜尋問題之前驗證迴路。
交付成果: 可運作的 BO 引擎,能產生實驗建議。經驗證的代理模型,並在您的材料族上量化預測準確度。能在實體執行前攔截流程錯誤的數位孿生。
在一個試點搜尋問題上進行完整自主運作。系統 24/7 運行,人類監督從主動監控逐步降低為以異常為基礎的警示。追蹤的效能指標包括:每日實驗數、相對於基準的命中率、每次實驗成本、隨迭代而來的模型預測準確度。
交付成果: 在您實際最佳化問題上運行的自主實驗室。完整的交接文件。您的團隊已就此系統受訓。所有程式碼、模型與配置皆移交予您。我們的存在已不再是運作所必需。
回答 8 個關於您目前實驗室設置的問題。本評估會找出您在自主實驗室部署上最強與最弱的領域,並為每一類別提供具體的後續步驟,無論您是否與我們合作。
您不需要替換任何東西。關鍵的一層是中介軟體,而非硬體。我們將每一台現有儀器包裹進一個 SiLA 2 微服務驅動程式,把高階指令(分配 5ml、加熱至 200C、執行 XRD 掃描)轉譯成您儀器所說的廠商專屬協定。Hamilton STAR 需要 VENUS 腳本指令。Tecan EVO 需要 FluentControl API 呼叫。一台較舊的 Agilent HPLC 可能需要包裹在執行於 Raspberry Pi 上的 Python 轉接器中的序列埠通訊。
每個驅動程式需 2-4 週建構,視儀器 API 文件品質而定。一旦包裹完成,每一台儀器在 AI 最佳化層眼中看起來都一樣:一個具備已定義能力的 SiLA 2 微服務。我們發現,實驗室通常需要 6-12 個儀器驅動程式才能構成可運作的閉迴路。對中型實驗室而言,整體整合時程為 8-16 週,而您的儀器在建置期間仍持續執行既有工作流程。
唯一的硬體增添,通常是一台小型編排伺服器(本地端或雲端連線),用以執行 BO 引擎並協調儀器指令。
誠實的答案取決於三個變數:您目前的實驗吞吐量、您搜尋空間的維度,以及您的試劑成本。一間每週在 30 維組成空間上跑 20 次手動實驗、每次實驗平均試劑成本 200 美元的材料科學實驗室,其數學算法會與一間每週跑 500 塊 HTS 盤的製藥實驗室截然不同。
就材料科學的案例而言,部署成本知情型貝氏最佳化(CIBO)通常可將找到一個可行候選者所需的實驗數量減少 10-50 倍。若您原本要跑 1,000 次實驗來涵蓋一個組成空間,而 CIBO 讓您在 50-100 次實驗內達到相同結果,光是試劑節省就有 18 萬至 19 萬美元。再加上人力重新配置(科學家設計實驗而非移液),以及機器人設備的 24/7 使用率(相對於人力配置實驗室的 30-40% 使用率),多數中型實驗室在整合投資上會在 12-18 個月內回本。
但有個前提:這些數字假設您的數據基礎設施乾淨到足以餵入最佳化迴路。若您頭 3 個月都花在正規化來自 Excel 試算表與各自獨立 LIMS 的數據,投資報酬率時程便會往後推。麥肯錫估計,全面的自動化與 AI 整合可將整體製藥研發成本削減約 25%,並可將週期時間縮短 500 天以上。
HTS 是蠻力法:在物理上盡可能合成並測試愈多候選者愈好,寄望答案就在您的化合物庫中。貝氏最佳化則是策略性搜尋:使用一個機率性的代理模型來預測最佳候選者所在之處,只測試那些,更新模型,然後重複。
數字說明了一切。一場標準 HTS 行動測試約 106 種化合物。具藥理活性的小分子空間估計約為 1060。當答案很可能就在一個既有化合物庫中、且您負擔得起相關基礎設施時,HTS 行得通。當您探索的是最佳組成很可能不存在於任何化合物庫的新穎材料類別時,它便失靈。
搭配高斯過程代理模型的 BO,恰恰在這種情境中表現出色:初始數據少、實驗昂貴、搜尋空間龐大。採集函數在數學上平衡了「探索未知區域」與「開發已知具前景區域」。成本知情型 BO 再加上一個成本維度:若兩個實驗提供相近的資訊增益,但其中一個試劑成本 5,000 美元、另一個 50 美元,CIBO 會選擇較便宜的路徑。研究顯示,CIBO 可在達到相同目標的同時,將最佳化成本降低高達 90%。
其侷限:搭配高斯過程的標準 BO 在觀測值上以 O(n3) 規模擴展,且在超過 50 個維度時會陷入困境。對於高維組成空間,我們使用稀疏 GP 近似(SVGP)或深度核學習,這需要更多前期工程,但能處理數百個維度。
可以,但前提是要有刻意設計的合規架構。多數 SDL 平台是為學術研究而設計,而非為受監管的環境。FDA 的 ALCOA+ 框架要求每一個數據點都必須是可歸屬的(誰產生了它,包括哪個演算法選了該實驗)、清晰可讀、即時的(在建立當下加上時間戳記,而非事後批次記錄)、原始的,以及準確的。
對一座自主實驗室而言,這意味著 BO 引擎的實驗選擇必須連同完整的決策脈絡一併記錄:用了哪個採集函數、代理模型預測了什麼、為何選擇這個實驗而非其他選項。每一個機器人動作都必須產生一條不可竄改的稽核軌跡。失敗的實驗必須連同失效模式分析一併記錄,而非默默丟棄。
CDER 警告信在 2025 財年激增 50%,其中數據完整性是主要的引述類別。2026 年 1 月,FDA 與 EMA 聯合發布了《藥物開發中良好 AI 實踐的 10 項指導原則》,涵蓋數據治理、文件記錄、生命週期管理與人類監督。
我們將合規層建構為一項獨立服務,環繞在您的 SDL 工作流程外圍:它攔截每一個數據事件、加上時間戳記、連結至發起的流程,並儲存於僅可附加的稽核日誌中。這一層為整合時程增加約 3-4 週,並需要與您的品質團隊協調,以對照您特定的 SOP 進行驗證。
這就是冷啟動問題,也是自主材料探索中最常見的技術挑戰。若您處理的是研究充分的材料族(鈣鈦礦、金屬有機框架、常見小分子),Materials Project(154,000 個以上結構)、AFLOW 或開放量子材料資料庫中的大型 DFT 計算數據集,便能引導啟動您的代理模型。
對於新穎材料類別,路徑分為三個階段。階段一:遷移學習。在一個數據豐富的相關材料族(例如二元氧化物)上預先訓練一個 GNN,再以您手上現有的任何數據(即便只有 50-100 個結構)對您的目標類別進行微調。《ACS Central Science》發表的研究顯示,遷移學習能以少了幾個數量級的目標領域數據,達到有用的預測準確度。
階段二:搭配多保真度 BO 的主動學習。使用廉價的 DFT 計算(每次數分鐘)來快速擴充代理模型對您空間的知識,再以昂貴的高保真度計算或實際合成,有選擇地驗證最不確定的預測。MF-BO 框架學習模擬與實驗之間的相關性,因此它知道何時該信任廉價計算。
階段三:負面數據擷取。每一次失敗的實驗都會獲得結構化記錄:嘗試了什麼、出了什麼差錯、量測到的性質。這會使決策邊界更為銳利,並防止系統反覆探索死胡同。多數實驗室把這類數據丟掉。我們則視之為永久的智財。達到有用代理模型的時程:對於採用遷移學習的研究充分材料族為 2-4 週;對於需要 DFT 引導啟動的真正新穎類別則為 3-6 個月。
這取決於三個因素:您的儀器有多獨特、您的數據有多敏感,以及您對最佳化邏輯需要多大的掌控權。
像 Emerald Cloud Lab 這樣的平台,提供對 200 多台自動化儀器的即用型存取。您寄送樣本,他們執行實驗,您取回數據。對於不需要客製工作流程、且您能接受專有數據存放在他人基礎設施上的標準化檢測而言,這行得通。Radical AI 建構每天篩選數十億種組成的完整自主實驗室。若您的問題與他們聚焦合金的方向一致,他們的吞吐量難以匹敵。但您是在他們的技術堆疊、他們的演算法、他們的數據管道上運行。
在以下情況下,客製建構才合理:(1) 您的儀器組合包含沒有任何平台支援的老舊或特殊設備;(2) 您的數據主權要求禁止將專有化學數據送出場所之外;(3) 您的最佳化問題需要非標準做法(搭配客製保真度來源的多保真度 BO、物理知情型代理模型、領域專屬的採集函數);或 (4) 您需要平台並不提供的 GxP 合規層。
典型的中型材料實驗室擁有 3-5 台沒有任何平台可開箱即用支援的儀器、至少一項法規限制,以及一個不符合通用 UI 的最佳化問題。建構於開放標準(SiLA 2、像 BoTorch 這類開源 BO 函式庫)之上的客製整合,能在不被綁定的情況下賦予您自主能力。
支撐本解決方案頁面的方法論與技術架構,在我們的互動式白皮書中有詳細說明。
涵蓋貝氏最佳化數學、PIML vs. 黑盒 AI、用於分子性質預測的 GNN 架構、SiLA 2 中介軟體設計,以及「先模擬、後合成」的經濟論據。
麥肯錫估計,AI 與自動化整合可將製藥研發成本削減 25%,並將週期時間縮短 500 天以上。
無論您需要的是一份實驗室架構評估、為既有自動化設置打造的 BO 引擎,還是從儀器整合到自主運作的完整閉迴路建置,我們都會將委託案的範疇調整為與您目前的狀態與目標相匹配。