词元高质量出海,大幕拉开

算电协同助中国大模型持续提升全球竞争力

来源:解放日报 作者:李晔 日期:2026-03-28
■大模型推理,产出的是代码、分析、翻译和创意,是一种更深层的嵌入。一旦开发者对模型形成习惯,其切换成本会随时间积累而越筑越高

本报记者 李晔

越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“词元(Token)出海”现象。

一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus 4.6编程,发现其“好用但贵”,单日词元消耗数千万个,每日成本动辄上百美元。这名开发者转而拥抱中国大模型公司MiniMax的M2.5开源模型,性能相当,词元消耗所产生的费用仅为美国头部模型的1/17。此非个案,而是风潮——碾压级的性价比,催生高频调用。

数据显示,近一个月来,在中美大模型API调用量的较量中,中国模型更胜一筹,调用量第一、第二和第四均为中国模型,分别为MiniMax M2.5、阶跃星辰Step 3.5 Flash,以及DeepSeek V3.2。同时,平台前十模型的词元总消耗量的60%以上来自中国模型。

这意味着,全球开发者更喜欢调用中国大模型,愿意为中国词元付费。大模型推理所需算力、电力均在中国完成,却创新实现“词元出海”这一数字服务贸易形式。

其中,我国低成本电力无疑是核心优势之一。利用乌兰察布、宁夏等地可再生能源丰富及气候优势,我国实行“东数西算”,绿电价格较美国电价低50%到70%,从而降低了数据中心运营成本。字节、阿里等大厂均在中西部地区布局数据中心。

“词元出海”的更硬核辅助,在于中国大模型的技术实力,以及硬件厂商的高质量算力。

MiniMax多次登顶OpenRouter调用量排行,创始人闫俊杰在2026上海全球投资促进大会开幕式上介绍,MiniMax致力于AI普惠,早在“龙虾”大火前就定下目标:复杂智能体运行1小时,成本1美元。

国内芯片企业同样励志。据记者了解,国内某头部模型厂商与国内自主芯片企业的合作算力已达数千卡规模。国产GPU在易用性与成本上的综合优势,对于日均词元调用量上亿乃至十几亿的头部大模型而言,是其商业竞争力的关键因子。

这一波“词元出海”,寒武纪、昆仑芯、天数智芯等芯片企业已率先实现适配及应用。如阶跃星辰Step 3.5 Flash等多款模型的推理和训练微调,均在天数智芯的通用GPU集群上完成,天数智芯加速卡还为多家AI企业大模型研发提供算力资源支撑。

在天数智芯副总裁宋煜看来,“词元出海”浪潮下,算电协同下的高质量算力,成为助力中国大模型持续提升全球竞争力的关键力量。他认为,评判高质量算力,有高效率、可预期、可持续三大维度。

高效率,指在真实训练和推理场景中,将电力、带宽、显存和互联尽可能转化为有效吞吐。可预期,指在大规模集群、复杂业务负载和功率约束下,算力性能、时延和稳定性能被准确评估并持续兑现。如天数智芯有业内独家的IX-SIMU全栈软件仿真系统,可在集群部署前仿真模拟实际运行效果,减少“上线后发现不行”的风险。可持续,则指芯片不只跑今天的算法,还能持续向“后”兼容。

大模型推理,产出的是代码、分析、翻译和创意,是一种更深层的嵌入。一旦开发者对模型形成习惯,其切换成本会随时间积累而越筑越高。此番词元高质量出海,大幕刚刚拉开。