中国公司让AI真正走进实验室做实验,成绩超过OpenAI最强模型
2026-07-04
这事跟你有啥关系?
想象一下:你只需要说一句“帮我做个基因突变实验”,AI就能自己写方案、操作机器、完成实验,甚至还能根据结果自我改进。这就是涌生智能和上海人工智能实验室最新成果干的事。他们发布的系统叫ProtoPilot,让AI第一次真正走进了生命科学实验室,不光会“想”,还会“动手”。
AI做实验到底难在哪?
以前AI在生命科学领域只能干“脑力活”:读论文、回答问题、预测蛋白质结构。但要从“写方案”到“实际动手”,中间隔着好几道坎:
- 模糊需求:你说“做个实验”,AI得自己拆解成具体步骤。
- 方案不等于能执行:实验室里用什么设备、多少液体、温度多少,写错一步实验就白做。
- 没有反馈:AI做完方案就撒手不管,错了也不知道错在哪。
硅谷的OpenAI、谷歌、Anthropic这些公司也卡在了这里——它们的模型能写出漂亮的实验方案,但还没法真正指挥机器干活。
国产系统怎么做到的?
ProtoPilot用了多个AI分工协作的方式:
- 一个AI当“主管”,把你的模糊想法拆成几个小任务。
- 一个AI当“实验专家”,写出科学的实验方案。
- 一个AI当“编程员”,把方案翻译成机器能懂的指令。
最关键的是,实验失败后,它会记住教训,下次改进。简单说,这个系统会越用越聪明。
成绩单如何?
在行业公认的测试(ProtocolQA)里:
- 开放式问答:ProtoPilot得分52.38%,接近人类专家(54%),而OpenAI最强模型GPT-5.6 Sol只有43.5%。
- 非开放式问答:ProtoPilot得分85.18%,已经超过人类专家水平。
换句话说,在“理解实验、设计流程”这件事上,这个国产系统已经跑赢了目前全球最顶尖的AI。