2月18日,阶跃星辰正式开源了两款多模态大模型:Step-Video-T2V 视频生成大模型与 Step-Audio 语音交互模型。近日,两款大模型正式完成与华为昇腾计算平台的适配,并在魔乐社区(Modelers)等主流技术平台上线。此次 Step 系列两款开源模型,依托昇腾高性能计算架构,大幅提升模型推理效率与部署体验,为智能语音交互、视频生成等场景提供更优质的技术支撑,同时为开发者提供了更高效的模型训练和推理体验,加速了 AI 应用的开发进程。通过适配华为昇腾 CANN 异构计算架构,国产算力与开源模型实现了深度结合,为多模态 AI 应用提供了有力支持。未来,阶跃星辰将持续携手华为昇腾,共同推动多模态 AI 技术与开源生态的发展,为开发者与行业伙伴带来更多前沿创新,共同探索 AI 的无限可能。模型链接:
https://modelers.cn/models/StepFun/Step-Video-T2V-npu
https://modelers.cn/models/StepFun/Step-Audio-npu
数据集链接:
https://modelers.cn/datasets/Modelers_Park/Step-Video-T2V-Eval