阶跃星辰发布基模Step 3,联合近10家芯片厂商发起「模芯生态创新联盟」
基础大模型研发已步入深水区,模型厂商和芯片厂商正通过联合技术创新的模式,让大模型和算力双向实现价值最大化,加速推动大模型真正被各行各业用起来。
7 月 25 日,阶跃星辰在上海召开「Step 3 大模型发布会暨生态联盟成立大会」,会上阶跃发布了新一代基础大模型 Step 3,这款模型兼顾智能与效率,旨在面向推理时代打造最适合应用的模型,将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。凭借系统和架构创新,Step 3 实现了行业领先的推理解码效率。根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。
值得关注的是,为了通过底层联合创新提升大模型适配性和算力效率,阶跃星辰联合近 10 家芯片及基础设施厂商发起「模芯生态创新联盟」,打通芯片、模型和平台全链路技术。该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。该联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。
面向推理时代,能否降低推理成本也是决定大模型应用渗透率的关键问题。业内人士认为,API 价格战带来的普及只有短期效应,要彻底推动 AI 技术惠民需要发展可持续模式,通过模型系统架构创新是最本质的解题思路。「模芯生态创新联盟」的发起,是模型、芯片、基础设施全链路技术厂商协同探索创新的良好开始。Step 3 已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。
此外,本次 WAIC 期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型 Step 3o Vision,第二代端到端语音大模型 Step-Audio 2。目前,所有这些模型都可以在“阶跃 AI”官网(stepfun.com)和“阶跃 AI”App(应用商店搜索下载)进行体验。
Top
1、只要出事,摩托车死亡概率就是比其他车高,摩托车死亡率是多少
2、山西人爱午睡这事儿,全网还没说清楚,山西人中午吃什么饭
3、历史辨伪鉴真举隅 – 不能颠倒黑白