6616AI

让AI当老板,14个AI有10个把公司干破产了

2026-06-30

普林斯顿大学最近搞了个实验,叫CEO-Bench。简单说,就是让AI当虚拟公司的CEO,看它们能不能赚钱。结果有点惨:14个AI上场,最后有10个把公司干破产了,本金100万美元全亏光。

这件事跟普通人有什么关系呢?它告诉我们,现在AI虽然能写文章、画图画、写代码,但让它做复杂决策——比如怎么定价格、怎么投广告、什么时候招人——还远不如人类,甚至比不上一个简单固定的规则。

比赛怎么玩的?

  • 给每个AI 100万美元本金,零客户。
  • 让它们运营一家虚拟的SaaS公司(就是卖软件服务的),时间跨度500天。
  • 目标是赚最多的钱,如果中途钱花光了就算破产出局。

AI能做的事情跟真老板差不多:可以写代码改产品、查数据库看数据、决定广告投多少钱、定什么价格、招不招客服……甚至还能刷社交媒体看客户吐槽和竞争对手动态。

但难点在于,投了广告后客户可能要过一周才来;砸钱搞研发,产品变好也要好几天。成本是立刻烧掉的,回报却迟迟不来。而且对手还会使绊子,市场口味也会变。这些不确定性,人类老板有时候也只能靠直觉。

结果有多惨?

14个AI选手中,只有3个赚了钱:

  • 冠军Fable 5:赚了4715万美元,翻了47倍。
  • 亚军Claude Opus 4.8:赚了2780万。
  • 季军GPT-5.5:赚了2130万。

其他AI不是亏钱就是中途破产,连一些知名大模型都没撑到最后。

最戏剧性的是第四名——它根本不是AI大模型,而是一个纯靠固定规则的程序,就像个“呆瓜”,按事先写好的脚本定价格、分资源。结果它赚了1576万,超过了除了前三名之外的所有大模型。

几个有意思的发现

  1. 胆子大的AI比保守的AI更容易赚钱:研究发现,敢尝试新策略的AI(比如换广告渠道、调整价格)比那些一遇到挫折就缩手缩脚(砍成本、存现金)的AI赚得多。商业世界光活着没用,得赢。

  2. 别用写代码的AI来当老板:研究者试着把本来给程序员用的AI(比如Claude Code)套在CEO角色上,结果表现反而变差。因为给“码农”写的提示词,不适合管公司。这告诉我们:不同的工作,需要专门定制的AI。未来可能会出现专门当老板的AI、专门当HR的AI、专门当财务的AI。

人类老板还能保住饭碗

文章最后提到一个经典故事:1997年苹果快破产时,乔布斯画了一个2x2矩阵,把苹果的产品砍到只剩四个方向,然后才有了iMac、iPhone。

这种在极不确定的情况下靠直觉画出一个框架的能力,现在的AI还做不到。AI能把每个格子里填满颜色,但画不出那个矩阵。而这,暂时还属于人类。