自主实验室设计 + AI 集成
高通量筛选所能覆盖的范围与化学空间所包含的范围之间的差距并非渐进式的,而是天文数字级的。自动驾驶实验室通过以策略性、AI 主导的实验取代随机搜索来弥合这一差距。我们构建优化引擎、仪器集成与闭环架构,将您现有的实验室转变为一套自主发现系统。
10-50 倍
达到目标所需实验更少
贝叶斯优化 vs. 随机筛选
高达 90%
采用 CIBO 降低试剂成本
成本知情贝叶斯优化,ChemRxiv 2024
24/7
设备利用率,相较于人工配备的 30-40%
自主运行基准
托马斯·爱迪生用来测试数千种碳丝的方法论,是理论落后于实验那个时代的产物。到 2026 年,研发实验室仍在运行其各种变体,而经济状况只是变得更糟,而非更好。
符合 Lipinski 规则的具有药理活性的小分子数量估计为 1060。一次大规模 HTS 活动测试 106 种化合物。这覆盖了该空间的 0.000000000000000000000000000000000000000000000000000001%。若扩展到复杂的生物制品与多元素合金,该空间逼近 10100,超过了可观测宇宙中原子的数量(1080)。
HTS 假定答案存在于一个预先合成的化合物库之中。对于新型材料类别而言,最优组成几乎肯定不存在于地球上任何一个库中。您是在用一把茶匙,在一个太平洋大小的草垛里寻找一根针。
每个资产的药物开发成本已达到 20 亿美元以上(德勤,2024)。制药业研发在临床试验中的失败率徘徊在 90%。制药业内部收益率(IRR)在 2022 年跌至 12 年来最低的 1.2%,随后在 2024 年回升至 5.9%,这在很大程度上得益于 GLP-1 的异军突起。这就是埃罗姆定律(Eroom's Law):研发生产率在支出上升的同时仍在下降。
在材料科学中,成本的衡量方式有所不同,但模式如出一辙。电池研究人员追逐理论上能提供高能量密度、却违背热力学稳定性约束的材料。若没有先模拟再合成,这些死胡同往往要在耗费数月实验室时间和数十万美元试剂成本之后才会被发现。
一家中型材料实验室正在为下一代太阳能电池寻找一种具有特定带隙与稳定性特性的无铅卤化物钙钛矿。该组成空间包括 5 种阳离子选项、8 种阴离子组合以及连续的化学计量比,产生大约 108 种可行组成。
传统方法:一位博士后凭借文献直觉和导师建议,每周合成 3-5 种组成。按每次合成 150 美元(前驱体、基底制备、表征),他们一年花费 78,000 美元测试 520 种组成。这仅占该空间的 0.00052%。所找到的最佳候选物可能远未接近全局最优。
采用贝叶斯优化,并使用在来自 Materials Project 的 50,000 个 DFT 计算钙钛矿结构上预训练的 GNN 代理模型,该系统能在 80-120 次有针对性的实验中识别出组成空间排名前 0.1% 的部分。试剂总成本:12,000-18,000 美元。该代理模型在毫秒内预测带隙与形成能。采集函数(期望改进,Expected Improvement)只选择那些预测性能高、或模型不确定性大到足以值得研究的组成。其余 400 多次本会产生增量数据或无用数据的实验则永远不会运行。
自 2024 年以来,自动驾驶实验室领域迅速整合。在选择路径之前,您应当了解每个选项实际提供了什么、以及它在何处力有不逮。
| 选项 | 您获得什么 | 典型成本 | 诚实的短板 |
|---|---|---|---|
| Radical AI | 完整的自主实验室。每天 25 种以上合金。已筛选数十亿种组成。布鲁克林海军船坞设施(2026 年 1 月)。5500 万美元种子+轮,6000 万美元 A 轮。 | 合作/合同 | 聚焦于合金。您的数据存放在他们的技术栈上。优化逻辑是他们的黑箱,您无法修改。适用于冶金,对于制药或 MOF 则不太适用。 |
| Emerald Cloud Lab | 在卡内基梅隆大学(CMU)拥有 200 多台自动化仪器。寄送样品,获得结果。提供 GxP 企业级方案。 | 订阅制(每年 5 万至 50 万美元以上) | 仅限远程。您无法接触仪器。受限于他们支持的检测目录。专有化学数据会离开您的场所。 |
| Atinary | 带有 ML 优化器的 SDL 软件平台。DMTAL 循环。在波士顿推出了"科学发现工厂"(2025 年)。 | SaaS + 集成 | 支持某些仪器类型。在其 UI 之外定制优化逻辑需要他们的工程团队。处于成长期,但尚未在企业规模上经受实战检验。 |
| Kebotix | 面向材料发现的企业级 AI。云端 + ML + 物理建模 + 自动化。 | 企业合同 | 总部位于剑桥,成立于 2017 年。相比更新的入局者,公开验证较少。平台化的做法意味着您的工作流要去适配他们,而非反过来。 |
| 四大 / 大型系统集成商 | 数字化转型咨询。实验室战略、供应商选型、变革管理。团队庞大,名号响亮。 | 50 万至 500 万美元以上的项目 | 他们部署平台,而非构建优化引擎。没有内部的 BO/GNN 专长。交付物是一份战略演示文稿和供应商集成,而非一套能运行的闭环。本应 3-4 个月完成的工作,他们的项目要做 6-18 个月。 |
| 自建团队 | 完全掌控。构建您自己的 BO 引擎,编写您自己的 SiLA 2 驱动,训练您自己的 GNN。 | 2-3 名 ML 工程师 + 1-2 名自动化工程师(每年 80 万至 150 万美元) | 招聘既懂高斯过程、化学空间又懂 SiLA 2 的 ML 工程师极其困难。在产生任何实验价值之前需要 6-12 个月的爬坡期。在紧张的劳动力市场中流失率很高。 |
| Veriprajna | 定制构建的 BO 引擎、GNN 代理模型、SiLA 2 仪器驱动、GxP 合规层。您拥有全部代码和模型。与您现有的硬件集成。 | 15 万至 60 万美元的项目 | 没有托管的实验室设施。没有预建的仪器库。每一次集成都是定制工程。对于平台即可胜任的标准化检测,速度较慢。 |
正确的选择取决于您的仪器组合、数据敏感性和监管要求。对于在常见仪器上运行、且无 IP 敏感性的标准化检测,平台可以胜任。对于拥有遗留设备、专有数据、GxP 约束或非标准优化问题的实验室,定制集成是唯一的路径。
六项能力,将一个现有实验室转变为一套自主发现系统。每一项既可作为独立的合作项目,也可作为完整闭环构建的一部分。
我们为您特定的材料领域配置代理模型、采集函数和保真度层级。当您的组成空间超过 50 维时,我们会采用稀疏变分高斯过程(SVGP),因为具有 O(n3) 复杂度的标准高斯过程将无法收敛。对于参数为 10-15 个且试剂昂贵的反应优化,我们部署成本知情贝叶斯优化(Cost-Informed BO),以使每单位信息的成本最小化。
采集函数的重要性超过多数实验室的认知。期望改进(Expected Improvement)较为保守,适合开发已知有前景的区域。汤普森采样(Thompson Sampling)促进批次多样性,在运行多个并行合成时更优。我们根据您的实验配置进行选择,而非套用默认值。
您实验室中的每台仪器说着不同的语言。Hamilton STAR 使用 VENUS 脚本。Tecan EVO 使用 FluentControl API。Agilent 仪器暴露 FAST API 或遗留的串行协议。我们为每台仪器构建 SiLA 2 微服务驱动,这样无论底层是何种仪器,您的 AI 优化层都发送一种一致的命令格式。
对于缺乏现代 API 的遗留仪器(有 10-20 年历史),我们用运行 Python SiLA 2 服务器的适配硬件(树莓派或嵌入式控制器)将其封装。每个驱动的集成需要 2-4 周,具体取决于供应商 API 文档的质量。一个典型的中型实验室需要 6-12 个驱动才能形成一套可运行的闭环。
图神经网络(GNN)在分子性质预测上优于大语言模型(LLM),因为分子是三维图,而非文本字符串。我们构建 GNN 代理模型(用于晶体结构的 CGCNN、用于分子几何的 SchNet 或 DimeNet),在毫秒内预测目标性质,而非 DFT 计算所需的数小时。
对于研究充分的材料族,我们从 Materials Project(154,000+ 个结构)或 AFLOW 进行引导。对于新型类别,我们采用从相关材料族迁移学习,并用主动学习辅以有针对性的 DFT 计算来填补空白。Matbench Discovery 基准(2026 年)显示,最佳模型实现了 6.1 倍的发现加速因子。我们以这一区间作为您所在领域的目标。
对于制药实验室,FDA 的 ALCOA+ 框架要求每一个自动化步骤都做到可归属、可辨识、同步记录、原始且准确。多数 SDL 软件将合规视为事后补救。我们将审计追踪层构建为一项专用服务:它拦截来自 BO 引擎的每一个数据事件、每一次机器人动作以及每一项表征结果,为其打上时间戳,并存入只可追加的日志。
CDER 警告信在 2025 财年激增了 50%,数据完整性是一个主要的引用类别。2026 年 1 月 FDA/EMA 关于 AI 在药物开发中应用的联合指南,对数据治理和人工监督设定了明确的预期。我们从一开始就将合规纳入架构设计,而非在审计发现问题后才仓促拼接上去。
将完整的设计-制造-测试-分析(DMTA)循环作为一套生产系统。BO 引擎生成一个候选物。机器人平台通过 SiLA 2 接收合成指令。表征仪器(XRD、光谱、显微镜)测量结果。反馈更新代理模型。该循环无需人工干预即可重复。
我们包含一个数字孪生层,在物理执行前对每次实验进行模拟:验证流程时序,检查机械臂的碰撞路径,标记试剂兼容性问题,并通过将实时传感器数据与预测行为相比对来检测异常。这可以防止伯克利 A-Lab 所遭遇的 29% 合成失败率,并让您的 24/7 运行不出现隔夜的意外。
将您那台 20 年历史的 HPLC 封装进一个 SiLA 2 微服务驱动中。将您用 Excel 进行的实验追踪替换为一条结构化数据流水线,直接馈入优化循环。将您互不相连的 LIMS、ELN 和仪器输出统一到一个数据湖中,在那里每一次实验(包括失败的实验)都成为代理模型的训练数据。
无需推倒重来。我们在仍可正常工作的设备之上添加一个智能层。典型的现代化路径:先做仪器驱动(第 1-8 周),其次做数据流水线(第 4-12 周,与前者重叠),第三做 BO 引擎(第 8-16 周),最后做闭环集成(第 12-20 周)。在整个过程中,科学家们继续运行他们当前的工作流。
这是一个有代表性的工作流,针对一家为特定带隙与热稳定性目标优化无铅卤化物钙钛矿组成的材料实验室。
我们从 Materials Project 拉取 50,000 个 DFT 计算的卤化物钙钛矿结构。在这些数据上预训练一个 CGCNN(晶体图卷积神经网络),以根据晶体结构预测形成能和带隙。在单个 GPU 上训练需要 4-8 小时。该模型对已知钙钛矿的形成能达到约 0.05 eV 的 MAE,这足以对候选物进行排序,但还不足以取代实验验证。这正是关键所在:代理模型是一个过滤器,而非神谕。
组成空间被定义为:Cs/MA/FA 阳离子比例,Sn/Ge/Bi 取代水平,I/Br/Cl 卤素比例。这构成一个约 30 维的连续空间。多目标:最大化带隙稳定性(叠层太阳能电池应用的目标为 1.2-1.5 eV),最小化形成能(热力学稳定性),以及最大化热分解温度(运行耐久性)。BO 引擎使用多目标采集函数(期望超体积改进,Expected Hypervolume Improvement)来探索帕累托前沿。
BO 引擎首先查询 CGCNN 代理模型(每次预测毫秒级、成本近乎为零)。它生成 10,000 个候选组成,并按预测的帕累托最优性对其排序。排名前 200 的会被传递给一次快速的 DFT 弛豫(每次计算数分钟,每次约 0.50 美元的计算成本)。MF-BO 框架学习 GNN 预测与 DFT 结果之间的相关性。在相关性强的地方,信任 GNN 的预测。在相关性弱的地方(通常位于训练分布的边缘),则触发更多 DFT 计算。这一阶段在不进行任何物理合成的情况下淘汰了约 99% 的候选物。
排名前 20 的经 DFT 验证的候选物作为合成指令被发送至机器人平台。一台液体处理器(通过 SiLA 2 控制)分配前驱体溶液。一台热板/管式炉运行退火流程。一台 XRD 仪器(SiLA 2 连接)确认晶相。一台 UV-Vis 光谱仪测量带隙。一台 TGA 仪器测量热分解。所有结果都被打上时间戳,关联到原始的 BO 推荐,并存入结构化数据流水线。
每一项实验结果(包括失败的结果)都反馈到代理模型中。一个在 150℃ 而非预测的 300℃ 就分解的组成是有价值的:它告诉模型其预测在何处出错,并锐化决策边界。BO 引擎更新其后验,重新计算采集函数,并选择下一个批次。经过 4-6 个循环(在 2-3 周内共 80-120 次实验)后,该系统已绘制出可行的帕累托前沿。实验室如今拥有 5-10 种满足全部三项目标、经物理测量确认的组成,且每种都附有完整的不确定性表征。
一次典型的闭环实验室构建从启动到自主运行需要 16-24 周。每个阶段都有明确的交付物和一个通过/不通过的关口。
我们清点每一台仪器、其 API 能力、当前的数据流以及集成复杂度。我们梳理优化问题:您在搜索什么、在多少维度上、带有何种约束。我们评估现有数据(LIMS 导出、ELN 记录、先前的实验结果),以判断其用于引导代理模型的潜力。
交付物: 一份技术架构文档,规定 BO 引擎配置、含每台仪器时间线的仪器集成计划、代理模型策略以及数据流水线设计。该文档足够详细,以至于如果您选择不与我们继续合作,您的内部团队也能独立执行它。
为每台仪器并行开发 SiLA 2 驱动。数据流水线构建:从原始仪器输出到结构化格式,再到可供模型使用的特征。在需要的地方做遗留系统适配器。每个驱动都先单独测试,然后在编排序列中测试。
交付物: 为所有仪器提供可运行的 SiLA 2 驱动。带结构化实验日志记录的统一数据流水线。在此阶段,您的实验室继续运行现有工作流。
代理模型训练(或针对新型材料类别进行迁移学习 + 微调)。配置 BO 引擎,含选定的采集函数和保真度层级。用于流程模拟的数字孪生层。与仪器层的集成测试:在一种已知材料上运行完整的 DMTA 循环,以在部署到您实际的搜索问题之前验证该闭环。
交付物: 可运行的、能产出实验推荐的 BO 引擎。在您的材料族上经过验证、带量化预测精度的代理模型。在物理执行前捕捉流程错误的数字孪生。
在一个试点搜索问题上进行完整的自主运行。系统 24/7 运行,人工监督从主动监控逐步减至基于异常的告警。所追踪的性能指标包括:每天实验数、相对基线的命中率、每次实验成本、跨迭代的模型预测精度。
交付物: 运行您实际优化问题的自主实验室。完整的交接文档。您的团队接受过该系统的培训。所有代码、模型和配置移交给您。运行不再需要我们。
回答关于您当前实验室配置的 8 个问题。该评估识别出您在自主实验室部署方面最强和最弱的领域,并为每个类别提供具体的后续步骤,无论您是否与我们合作。
您无需替换任何东西。关键的层是中间件,而非硬件。我们将每台现有仪器封装进一个 SiLA 2 微服务驱动中,它把高层级命令(分配 5ml、加热到 200℃、运行 XRD 扫描)翻译成您仪器所说的供应商特定协议。Hamilton STAR 需要 VENUS 脚本命令。Tecan EVO 需要 FluentControl API 调用。一台较老的 Agilent HPLC 可能需要封装在运行于树莓派上的 Python 适配器中的串行端口通信。
每个驱动需要 2-4 周来构建,具体取决于仪器 API 文档的质量。一旦封装完毕,在 AI 优化层看来每台仪器都一模一样:一个具有已定义能力的 SiLA 2 微服务。我们发现,实验室通常需要 6-12 个仪器驱动才能形成一套可运行的闭环。对于一个中型实验室,集成总时间线为 8-16 周,并且在构建期间您的仪器会继续运行其现有工作流。
唯一通常需要新增的硬件是一台小型编排服务器(本地部署或云端连接),用于运行 BO 引擎并协调仪器命令。
诚实的答案取决于三个变量:您当前的实验吞吐量、搜索空间的维度,以及您的试剂成本。一家在 30 维组成空间上每周运行 20 次手动实验、每次实验平均试剂成本 200 美元的材料科学实验室,其数学结果将与一家每周运行 500 块 HTS 板的制药实验室不同。
对于材料科学的情形,部署成本知情贝叶斯优化(CIBO)通常能将找到一个可行候选物所需的实验数量减少 10-50 倍。如果您原本需要运行 1,000 次实验来覆盖一个组成空间,而 CIBO 让您在 50-100 次实验中就达到同样的结果,那么仅试剂节省就达 18 万至 19 万美元。再加上人力的重新配置(科学家设计实验而非移液)以及机器人设备的 24/7 利用率(相较于人工配备实验室 30-40% 的利用率),多数中型实验室在集成投资上能在 12-18 个月内收回成本。
注意事项:这些数字假定您的数据基础设施足够干净,能够馈入优化循环。如果您头 3 个月花在归一化来自 Excel 电子表格和互不相连的 LIMS 的数据上,那么投资回报时间线就会向后推移。麦肯锡估计,全面的自动化和 AI 集成可将制药研发总成本削减约 25%,并能将周期时间缩短 500 多天。
HTS 是蛮力:尽物理所能合成并测试尽可能多的候选物,寄望于答案就在您的库中。贝叶斯优化是策略性搜索:使用概率代理模型预测最佳候选物在何处,只测试那些,更新模型,然后重复。
数字足以说明问题。一次标准的 HTS 活动测试大约 106 种化合物。具有药理活性的小分子空间估计为 1060。HTS 在答案很可能存在于一个预先存在的库中、且您负担得起基础设施时有效。当您探索新型材料类别、而最优组成很可能不存在于任何库中时,它就失效了。
采用高斯过程代理的 BO 恰恰在这种情形下表现出色:初始数据少、实验昂贵、搜索空间大。采集函数在数学上平衡了探索未知区域与开发已知有前景区域之间的取舍。成本知情 BO 增加了一个成本维度:如果两次实验提供相似的信息增益,但一次试剂成本 5,000 美元、另一次 50 美元,CIBO 会选择更便宜的路径。研究表明,CIBO 在达到同样目标的同时,将优化成本降低高达 90%。
局限性:采用高斯过程的标准 BO 在观测数上以 O(n3) 缩放,并且在超过 50 维时表现吃力。对于高维组成空间,我们使用稀疏 GP 近似(SVGP)或深度核学习,它们需要更多前期工程,但能处理数百个维度。
能,但只有通过刻意设计的合规架构。多数 SDL 平台是为学术研究而设计的,而非受监管的环境。FDA 的 ALCOA+ 框架要求每一个数据点都做到可归属(谁产生了它,包括是哪个算法选择了该实验)、可辨识、同步记录(在创建时打上时间戳,而非事后批量记录)、原始且准确。
对于一个自主实验室,这意味着 BO 引擎的实验选择必须连同完整的决策上下文一起记录:用了哪个采集函数、代理模型预测了什么、为何选择这次实验而非其他备选。每一次机器人动作都必须生成一份不可篡改的审计追踪。失败的实验必须连同失败模式分析一起被捕获,而非被悄无声息地丢弃。
CDER 警告信在 2025 财年激增了 50%,数据完整性是一个主要的引用类别。2026 年 1 月,FDA 与 EMA 联合发布了《药物开发中良好 AI 实践的 10 项指导原则》,涵盖数据治理、文档、生命周期管理和人工监督。
我们将合规层构建为一项独立服务,包裹在您的 SDL 工作流周围:它拦截每一个数据事件,为其打上时间戳,将其关联到发起的流程,并存入一份只可追加的审计日志。这一层为集成时间线增加约 3-4 周,并需要与您的质量团队协作,针对您特定的 SOP 进行验证。
这就是冷启动问题,也是自主材料发现中最常见的技术挑战。如果您研究的是一个研究充分的材料族(钙钛矿、金属有机框架、常见小分子),那么 Materials Project(154,000+ 个结构)、AFLOW 或开放量子材料数据库中的大型 DFT 计算数据集就能引导您的代理模型。
对于新型材料类别,路径分为三个阶段。阶段 1:迁移学习。在一个数据丰富的相关材料族(比如二元氧化物)上预训练一个 GNN,再用您手头的任何数据(哪怕只有 50-100 个结构)在您的目标类别上进行微调。《ACS Central Science》发表的研究表明,迁移学习能以少几个数量级的目标域数据达到有用的预测精度。
阶段 2:结合多保真度 BO 的主动学习。使用廉价的 DFT 计算(每次数分钟)来快速扩展代理模型对您空间的认识,然后用昂贵的高保真度计算或实际合成有选择地验证最不确定的预测。MF-BO 框架学习模拟与实验之间的相关性,因此它知道何时应当信任廉价的计算。
阶段 3:负数据捕获。每一次失败的实验都得到结构化记录:尝试了什么、出了什么问题、测得的性质如何。这锐化了决策边界,并防止系统反复探索死胡同。多数实验室会把这类数据丢掉。我们将其视为永久的 IP。达到有用代理模型的时间线:对于采用迁移学习、研究充分的材料族为 2-4 周,对于需要 DFT 引导、真正新型的类别为 3-6 个月。
这取决于三个因素:您的仪器有多独特、您的数据有多敏感,以及您需要对优化逻辑有多大的控制权。
像 Emerald Cloud Lab 这样的平台提供对 200 多台自动化仪器的交钥匙访问。您寄送样品,他们运行实验,您拿回数据。这适用于无需工作流定制、且您能接受专有数据存放在别人基础设施上的标准化检测。Radical AI 构建每天筛选数十亿种组成的完整自主实验室。如果您的问题契合他们对合金的专注,他们的吞吐量难以匹敌。但您是在他们的技术栈、他们的算法、他们的数据流水线上运行的。
在以下情况下,定制构建是合理的:(1) 您的仪器组合包含没有任何平台支持的遗留或专用设备;(2) 您的数据主权要求禁止将专有化学数据发送到场所之外;(3) 您的优化问题需要非标准的方法(带自定义保真度来源的多保真度 BO、物理知情代理、领域特定的采集函数);或 (4) 您需要平台不提供的 GxP 合规层。
典型的中型材料实验室有 3-5 台开箱即用没有任何平台支持的仪器、至少一项监管约束,以及一个不适配通用 UI 的优化问题。建立在开放标准(SiLA 2、BoTorch 等开源 BO 库)之上的定制集成,能在没有锁定的情况下为您提供自主能力。
本解决方案页背后的方法论与技术架构,在我们的交互式白皮书中有详尽阐述。
涵盖贝叶斯优化的数学原理、PIML 与黑箱 AI 的对比、用于分子性质预测的 GNN 架构、SiLA 2 中间件设计,以及先模拟再合成的经济论证。
麦肯锡估计,AI 与自动化集成可将制药研发成本削减 25%,并将周期时间缩短 500 多天。
无论您需要的是一次实验室架构评估、为现有自动化配置打造一个 BO 引擎,还是从仪器集成到自主运行的完整闭环构建,我们都会确定合作范围以契合您当前的状态和目标。