全球首款零英伟达的万亿参数大模型来了,美团出品,海外开发者抢着用
2026-07-03
发生了什么?
美团最近悄悄地放了个大招——他们训练了一个1.6万亿参数的超级大模型,叫LongCat-2.0。但最牛的地方不是它大,而是从训练到运行,全程没有用英伟达的芯片,全部用的是国产芯片。这是全球第一个做到这点的万亿级模型。
而且这个模型其实早就“出道”了——它在海外开发者平台OpenRouter上化名“Owl Alpha”,成了很多程序员写代码、做自动化任务的首选,月调用量排到了前三。所以它不光技术厉害,市场也验证过了。
跟普通人有什么关系?
以前大家总觉得做AI大模型必须用英伟达的贵芯片,国产芯片不行。但现在美团证明了:国产芯片也能撑起世界级的大模型。这意味着未来AI的算力成本会降下来,更多企业能用上便宜的AI服务,可能很快你用的各种APP里的AI功能都会更聪明、更便宜。
它有多强?
有人拿它做了三个测试:
- 读长文档:给它几万字的中英文混编报告,它能准确找出藏在里面的信息,速度还很快。
- 改代码:让它把一个经典游戏2048改成赛博朋克风格、从4x4变成5x5格子,再加一个计步器——它自己分析、自己改,12分钟搞定。
- 写研究报告:让它上网查资料写一篇结构化报告,它自己完成,不用人管。
而且它还很省钱:同样的任务,它用的计算量(token用量)只有其他大模型的一半还少,按美团的价格,一次复杂任务不到一毛钱。
为什么能做到?
难点在于国产芯片的显存小、通信慢。美团用了5万张国产卡并行,每天都会坏卡,但靠自动修复系统把故障率降下来。同时优化了模型结构,比如“N-gram Embedding”(让模型一开头就认出常用词组)、“零计算专家”(不算没用的部分),让每一分算力都用在刀刃上。
这些优化让模型在国产卡上的效率从17.8%提升到27.68%,每天能处理的文本量增加了近一半。
结论
LongCat-2.0证明了国产算力+国产模型这条路走得通。美团花了三年时间铺垫,现在终于出了一张漂亮成绩单。对普通人来说,这意味着未来AI会更便宜、更普及,而且不用依赖国外的芯片。