让AI当老板，14个AI有10个把公司干破产了

普林斯顿大学最近搞了个实验，叫CEO-Bench。简单说，就是让AI当虚拟公司的CEO，看它们能不能赚钱。结果有点惨：14个AI上场，最后有10个把公司干破产了，本金100万美元全亏光。

这件事跟普通人有什么关系呢？它告诉我们，现在AI虽然能写文章、画图画、写代码，但让它做复杂决策——比如怎么定价格、怎么投广告、什么时候招人——还远不如人类，甚至比不上一个简单固定的规则。

比赛怎么玩的？

AI能做的事情跟真老板差不多：可以写代码改产品、查数据库看数据、决定广告投多少钱、定什么价格、招不招客服……甚至还能刷社交媒体看客户吐槽和竞争对手动态。

但难点在于，投了广告后客户可能要过一周才来；砸钱搞研发，产品变好也要好几天。成本是立刻烧掉的，回报却迟迟不来。而且对手还会使绊子，市场口味也会变。这些不确定性，人类老板有时候也只能靠直觉。

结果有多惨？

14个AI选手中，只有3个赚了钱：

其他AI不是亏钱就是中途破产，连一些知名大模型都没撑到最后。

最戏剧性的是第四名——它根本不是AI大模型，而是一个纯靠固定规则的程序，就像个“呆瓜”，按事先写好的脚本定价格、分资源。结果它赚了1576万，超过了除了前三名之外的所有大模型。

几个有意思的发现

胆子大的AI比保守的AI更容易赚钱：研究发现，敢尝试新策略的AI（比如换广告渠道、调整价格）比那些一遇到挫折就缩手缩脚（砍成本、存现金）的AI赚得多。商业世界光活着没用，得赢。
别用写代码的AI来当老板：研究者试着把本来给程序员用的AI（比如Claude Code）套在CEO角色上，结果表现反而变差。因为给“码农”写的提示词，不适合管公司。这告诉我们：不同的工作，需要专门定制的AI。未来可能会出现专门当老板的AI、专门当HR的AI、专门当财务的AI。

人类老板还能保住饭碗

文章最后提到一个经典故事：1997年苹果快破产时，乔布斯画了一个2x2矩阵，把苹果的产品砍到只剩四个方向，然后才有了iMac、iPhone。

这种在极不确定的情况下靠直觉画出一个框架的能力，现在的AI还做不到。AI能把每个格子里填满颜色，但画不出那个矩阵。而这，暂时还属于人类。