用户名:
密 码:
验证码:
看不清
忘记密码?
模糊搜索
作者搜索
标题搜索
正文搜索
摘要搜索
查看新版>>
登录
注册
首页
视频
在场
观观观察局
文汇视讯
文汇艺术
文汇大家聊
文汇馆长说
文汇青年营
潮探007
冲呀花花采访团
魔都三棱镜
汇演
艺见
许蜜桃
我不是唐亿森
速瞰天下
书人茶话
顾问天下
上海时刻
晏秋秋
江江三人行
饭小兔的美学洞窟
Biu比由
文汇科代表
解放日报谢飞君
文汇讲述
新聚场
沪上养老攻略
教育鹏友圈
Gloria in Shanghai
政情
@康平路
直通200号
伴公汀
上海一周
反腐记
抗战·上海寻迹
交汇点
市政厅
经济
财经连线
产业观察
金融区块链
流量研究所
市场解码
任我行
产经
市场
城生活
财经
城事更新
文化
文旅乐游
文化观澜
文艺清单
文化视点
独家探班
观众席
片场视听
文汇人文之城
台前幕后
文化生活
副刊
新民艺评
朝花时文
海上记忆
上书房
笔会
文汇文艺评论
文汇文艺百家
文汇读书
夜光杯
民生
民声直通车
上海辟谣平台
人民建议
读者
城市的味道
帮侬忙
上海滩
民生调查
侬好上海
谈天
文汇集结号
汇帮忙
区情
浦江眼
前沿风
郊野笔记
上海屋檐下
海上755
区域
Yeah!上海
十六区
郊野大地
评论
观见
时评
文汇时评
文汇微言
新民眼
思想
上观学习
思想汇
学林
论苑
文汇智库
文汇学人
文汇讲堂
深度
纵深
原点
申观察
新民周刊
科创
创新之城
科创前沿
科学新知
科科哒
教卫
教育在线
文汇教育
教育星球
学堂有名堂
医声医事
哎哟不怕
健康生活
第医线
康健园
医本正经聊天室
体育
运动+
文汇体育
新民体育
新民场外音
厉苒苒
东方体育日报
社会
说法
案页
十二公民
新瞰点
新民法谭
新音频
长三角
华东局
江南
城市志
要闻
时政要闻
国内
港澳台
北京来信
山海情
风物
京华传真
国际
世界观
大局观
海外惊奇
文汇环球
国际视点
深海区
侨梁
浩峰说
天下
早读
纵览
时事
话媒堂
上官河
汇闻
新民早报
视觉
图数图说
见识录
大视界
数据洋葱
文汇视觉
图个明白
新民印象
直播
文学报
新批评
文学现场
世界文学
品牌
健面谈
文创+
大区势
企示录
一起来
科创上海
微观上海
车天下
品牌汇
教育汇
文旅在线
新民汇
新民亲选
援疆风采
喀什风情
爱我国防
新民小记者
万象
专题
直播
上观号
电子报
解放日报
文汇报
新民晚报
上海日报
新闻晨报
上海法治报
社区晨报
东方体育日报
文学报
浦东时报
新民周刊
上海宣传通讯
我的位置:
上观号
>
上海经信委
>
文章详情
上下楼就是上下游!上海这家人工智能企业要做最“卷”的多模态大模型|上海新“模”样
转自:
上海经信委
2025-02-21 12:41:09
转载自:解放日报
2月18日,AI大模型独角兽企业阶跃星辰旗下两款多模态大模型宣布开源,其中包含全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio,一时间在全球开源社区内引发热议。
相较于国内多数大模型企业,阶跃星辰几乎是个“小透明”,但凭借成立不足2年接连推出11款大模型,成功跻身“AI六小虎”之列,还被《麻省理工科技评论》评为“DeepSeek之外值得关注的四家中国人工智能初创公司”之一,认为其展现出不逊于DeepSeek的技术实力。
国内外“百模大战”方兴未艾之际,阶跃星辰如何在短时间内突围?
“卷”技术也“卷”人才
“阶跃星辰成立比较晚,但我们要做最‘卷’的多模态大模型。”约定的采访时间刚到,阶跃星辰副总裁李璟一股风似的来到会议室,语速很快,创业者的精气神扑面而来。
阶跃星辰有多“卷”呢?春节前夕,DeepSeek正席卷全球时,阶跃星辰也没闲着,六天连发了六个模型,涵盖语言、语音、推理、图片理解、视频生成等多类别。新模型不仅在阶跃星辰最擅长的多模态领域继续领跑,推理模型Step R-mini在视觉推理领域也取得突破性进展。
最近,全球大模型掀起了一阵开源潮,阶跃星辰还将性能最好的两款多模态大模型面向全球开发者开源。其中Step-Video-T2V参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频。Step-Audio语音模型在5大主流公开测试集中均超过了行业内同类型开源模型,尤其是在汉语水平考试六级评测中的表现尤为突出,堪称“最懂中国话”的开源语音交互大模型。
“阶跃星辰能在短时间内突围,关键因素是高人才密度对创新的正向反馈。”李璟告诉记者,阶跃星辰团队成员只有500余人,但算法和技术人员的比例接近80%,其中不乏行业内的“大牛”。
在C端闯出另一条路
“我们一直按照节奏来推进C端应用开发,创业公司要把有限的成本放在技术研发上,而不是投流和广告。”在李璟看来,模型性能就是产品能力,阶跃星辰Step系列模型的优势在多模态领域,跃问App更应该在图像和视听等差异化体验上有所突破。
例如,跃问App提供的上海三日旅游攻略,不仅包含常见的文字介绍,还会生成图文详尽的攻略,游客通过拍照能了解景点更多资料,跃问App还能进行语音讲解。
“我们的核心能力是面向C端用户,但我们更愿意与合作伙伴共同提供C端服务。”李璟表示,国产大模型抢占日益拥挤的C端赛道,阶跃星辰正闯出另一条路。早在创立初期,阶跃星辰在金融财经、内容创作、智能终端、消费电子等领域,已经和不少行业龙头达成了合作意向。
面向金融财经领域,去年3月,阶跃星辰与上海报业集团旗下界面财联社围绕AIGC(生成式人工智能)财经资讯、智能投研等领域推进大模型的应用落地。同时,阶跃星辰还联合国泰君安、界面财联社推出业内首个千亿级参数多模态证券垂直类大模型——君弘灵犀大模型,在行业内首个实现了将大模型能力全面融入客户智能化服务体系之中。“我们和界面财联社共同开发的AI智能体‘小财神’,是面向个人投资者最优秀的产品之一。”李璟说。
在消费零售行业,阶跃星辰凭借多模态大模型的优势,与茶百道探索安全巡检等方面的场景应用。今年1月起,全国数千家茶百道门店接入Step-1V多模态理解大模型。数据显示,Step-1V平均每天能够为茶百道督导员节约75%的检核时间。
2024年下半年,阶跃星辰多模态API(编程接口)的调用量增长超45倍,Step系列模型积累了一批活跃的应用开发者,多个走红社交网络的AI应用,如“歌词爆改机”“胃之书”“林间疗愈室”等,均采用阶跃星辰的多模态大模型。
上下楼就是上下游
“阶跃星辰作为一家初创型民营企业,发展如此迅猛,离不开上海对算力、数据等基础设施资源的投入和开放。”李璟告诉记者,上海早在2017年就确立了发展人工智能产业的愿景,2018年举办首届世界人工智能大会,这些举措远远早于本轮生成式人工智能热潮。
正是上海的前瞻性,孕育出健康完善的AI生态。记者在西岸智塔的铭牌栏上看到,微软亚洲研究院(上海)、联影智能、得帆科技等知名研发平台和头部企业,都是阶跃星辰的“邻居”。仅一栋楼,就汇聚了数十家人工智能企业和科研机构,形成了集政、产、学、研、用于一体的AI垂直产业生态,“上下楼就是上下游”,让阶跃星辰能快速找到合作方、对接资源和获取服务。
上海人工智能语料数据平台型企业库帕思科技也在不远处。库帕思已全面启动具身智能、金融、制造、教育、医疗、文娱、城市治理等领域的行业语料库建设,语料运营1.0平台已投入实战运营,正加快布局从真实世界到模拟仿真到数据合成平台2.0研制。目前,库帕思已经链接了超过50家语料生态合作伙伴。智能算力方面,上海仪电投产了多个国内领先的“大规模、高等级”万卡智算集群,为阶跃星辰等大模型企业以及研究机构提供低成本算力服务。
“得益于上海市的整体统筹布局,我们和合作方联合自建了大型的训练集群,这是推动我们向更优模型迈进的关键基础设施之一,也是与许多创业公司相比显著的优势所在。”李璟说。
欢迎转发,但请注明出处“上海经信委”
觉得不错请点赞!