AI写代码终于能自己检查对错了!OpenSquilla新版本让AI学会“自证清白”
2026-07-02
一句话说清楚
一个叫 OpenSquilla 的开源 AI 助手最近更新了(0.4.0 版本),它最大的变化是:AI 在写完代码后,不再直接说“我改好了”,而是先自己跑一遍测试,证明自己确实改对了,再把结果交给人类。这就好比学生做完作业先自己检查一遍再交卷,而不是交上去让老师挑错。
为什么这件事跟你有关?
AI 写代码的能力最近进步很快,但过去一直有个大问题——AI 写的代码经常有 bug,人类还是得花大量时间从头到尾检查一遍。这导致 AI 写代码很难做到“全自动”,没法真正大规模用在实际工作中。现在 OpenSquilla 让 AI 学会“自我验证”,就等于给 AI 加了个自动质检员,能大幅减少人类复查的时间,让 AI 更可靠。
它具体怎么做到的?
OpenSquilla 用了三步走:
- 先故意写错——AI 先写一个肯定会失败的测试,用来确认它确实找到了要修的问题。
- 再改代码——把代码改好,让刚才那个失败的测试变绿(通过)。
- 最后全面检查——跑一遍项目里原有的所有测试,确保新代码没把别的地方搞坏。
三步全通过才算交付。如果哪一步没通过,AI 会自动重改,直到全部通过为止。而且 AI 只在一个隔离的“副本”里修改,确认没问题后才真正写到原来的代码里,不会搞乱原项目。
效果怎么样?
官方拿一个著名的教学项目(叫 micrograd,是 AI 大佬写的)做了演示:AI 为它添加了一个计算结果梯度的功能(这个功能一旦算错,人眼很难发现,但会导致模型越学越歪)。AI 自我验证后,人工把结果和行业标准工具 PyTorch对比到小数点后10位都完全一致——不是“AI 自己说对了”,而是“它跟官方标准答案一模一样”。
另外还有两个小亮点
- 省钱:OpenSquilla 会根据任务的复杂程度,自动选择不同档次的 AI 模型(简单的用便宜的,复杂的用贵的),据说能省下 60%–80% 的费用。
- 好安装:这次还推出了 macOS 和 Windows 的桌面安装包,双击就能安装,不用再敲命令行代码。
注:以上信息由 OpenSquilla 官方提供,我们做了通俗化转述。