AI写代码终于能自己检查对错了！OpenSquilla新版本让AI学会“自证清白”

一句话说清楚

一个叫 OpenSquilla 的开源 AI 助手最近更新了（0.4.0 版本），它最大的变化是：AI 在写完代码后，不再直接说“我改好了”，而是先自己跑一遍测试，证明自己确实改对了，再把结果交给人类。这就好比学生做完作业先自己检查一遍再交卷，而不是交上去让老师挑错。

为什么这件事跟你有关？

AI 写代码的能力最近进步很快，但过去一直有个大问题——AI 写的代码经常有 bug，人类还是得花大量时间从头到尾检查一遍。这导致 AI 写代码很难做到“全自动”，没法真正大规模用在实际工作中。现在 OpenSquilla 让 AI 学会“自我验证”，就等于给 AI 加了个自动质检员，能大幅减少人类复查的时间，让 AI 更可靠。

它具体怎么做到的？

OpenSquilla 用了三步走：

先故意写错——AI 先写一个肯定会失败的测试，用来确认它确实找到了要修的问题。
再改代码——把代码改好，让刚才那个失败的测试变绿（通过）。
最后全面检查——跑一遍项目里原有的所有测试，确保新代码没把别的地方搞坏。

三步全通过才算交付。如果哪一步没通过，AI 会自动重改，直到全部通过为止。而且 AI 只在一个隔离的“副本”里修改，确认没问题后才真正写到原来的代码里，不会搞乱原项目。

效果怎么样？

官方拿一个著名的教学项目（叫 micrograd，是 AI 大佬写的）做了演示：AI 为它添加了一个计算结果梯度的功能（这个功能一旦算错，人眼很难发现，但会导致模型越学越歪）。AI 自我验证后，人工把结果和行业标准工具 PyTorch对比到小数点后10位都完全一致——不是“AI 自己说对了”，而是“它跟官方标准答案一模一样”。

另外还有两个小亮点

省钱：OpenSquilla 会根据任务的复杂程度，自动选择不同档次的 AI 模型（简单的用便宜的，复杂的用贵的），据说能省下 60%–80% 的费用。
好安装：这次还推出了 macOS 和 Windows 的桌面安装包，双击就能安装，不用再敲命令行代码。

注：以上信息由 OpenSquilla 官方提供，我们做了通俗化转述。