6616AI

中国公司让AI真正走进实验室做实验,成绩超过OpenAI最强模型

2026-07-04

这事跟你有啥关系?

想象一下:你只需要说一句“帮我做个基因突变实验”,AI就能自己写方案、操作机器、完成实验,甚至还能根据结果自我改进。这就是涌生智能和上海人工智能实验室最新成果干的事。他们发布的系统叫ProtoPilot,让AI第一次真正走进了生命科学实验室,不光会“想”,还会“动手”。

AI做实验到底难在哪?

以前AI在生命科学领域只能干“脑力活”:读论文、回答问题、预测蛋白质结构。但要从“写方案”到“实际动手”,中间隔着好几道坎:

  • 模糊需求:你说“做个实验”,AI得自己拆解成具体步骤。
  • 方案不等于能执行:实验室里用什么设备、多少液体、温度多少,写错一步实验就白做。
  • 没有反馈:AI做完方案就撒手不管,错了也不知道错在哪。

硅谷的OpenAI、谷歌、Anthropic这些公司也卡在了这里——它们的模型能写出漂亮的实验方案,但还没法真正指挥机器干活。

国产系统怎么做到的?

ProtoPilot用了多个AI分工协作的方式:

  • 一个AI当“主管”,把你的模糊想法拆成几个小任务。
  • 一个AI当“实验专家”,写出科学的实验方案。
  • 一个AI当“编程员”,把方案翻译成机器能懂的指令。

最关键的是,实验失败后,它会记住教训,下次改进。简单说,这个系统会越用越聪明。

成绩单如何?

在行业公认的测试(ProtocolQA)里:

  • 开放式问答:ProtoPilot得分52.38%,接近人类专家(54%),而OpenAI最强模型GPT-5.6 Sol只有43.5%。
  • 非开放式问答:ProtoPilot得分85.18%,已经超过人类专家水平。

换句话说,在“理解实验、设计流程”这件事上,这个国产系统已经跑赢了目前全球最顶尖的AI。