AI集体涨价,Token效能比价值被重新审视
豆包缘何推出付费版本
5月4日,豆包在免费服务基础上新增付费版本,每月收费从68元至500元不等,主要覆盖复杂任务和生产力场景,适应更多算力与推理的消耗需求。
豆包付费增值服务的背后,是Token(词元)价格的不断攀升。Token消耗规模的激增直接推高了算力需求,进而传导至云计算服务价格。一年前还在打价格战的国产大模型厂商,如今集体选择涨价。
3月中旬,阿里云发布公告,因全球AI需求爆发及供应链成本上涨,AI算力、存储等产品价格上调5%至34%。一个月后,阿里云再度宣布部分模型单元服务价格再次上调2%至7%。腾讯云紧随其后,旗下AI编程助手CodeBuddy与WorkBuddy将提价,企业旗舰版涨幅约154%,企业专享版涨幅达100%,这是腾讯云年内的第三次涨价。“国产大模型第一股”智谱今年也宣布多轮涨价,并首次在核心场景实现与海外头部厂商的价格对齐。
为何算力市场规模越做越大,Token价格反而逆势上涨?“Token定价像是一道多元方程,变量很多。”百度千帆平台产品负责人张婷解释,GPU芯片是推理最核心的成本,一张高端GPU动辄几十万元,运行一个大模型需要几十甚至几百张同时工作,大型推理集群的电费也是天文数字。此外,研发摊销、工程师与数据投入、99.99%可靠性要求、内容安全过滤……这些成本最终都反映在Token价格上。
涨价在倒逼行业重新思考Token效率的价值。“大模型产业落地的下半场,核心命题不是模型参数规模的竞争,而是单位Token效能的持续提升。”蚂蚁数科大模型技术创新部总经理章鹏认为,面对Token涨价的趋势,效率成为企业更关注的指标。
4月末,阶跃星辰发布新一代图像生成编辑模型Step Image Edit 2,参数量仅3.5B(1B等于10亿),单次生图耗时0.5至2秒,性能与12B至20B级开源图像编辑大模型趋同,API定价仅为每张0.02元。阶跃星辰首席战略官李璟告诉记者:“推理成本与部署门槛的现实压力,推动业界重新审视Token效能比的价值。”
几乎同期,蚂蚁数科推出商业版LingDT-2.6-flash,总参数量104B、激活参数7.4B,在同等测评任务下较同参数级别模型可节省90%的Token消耗,输入定价为每百万Token仅0.1美元。
上海交大安泰经管学院教授史占中认为,长期来看,芯片和能源成本将回归行业均值,训练顶级模型的研究人才和数据积累才是AI的真正护城河。