
Step 3.5 Flash 采用稀疏 MoE 架构,每个 token 仅激活约 110 亿个参数(总计 1960 亿参数),在保证模型能力的同时显著提升推理效率,为 Agent 类应用提供更高效、可负担的底层模型选择。包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对 Step 3.5 Flash 的适配,通过底层联合创新提升模型适配性和算力效率。模型与算力的协同发展,有效降低推理成本,降低企业和开发者在应用大模型时的综合门槛,加快大模型在实际应用场景中的落地。
公开信息显示,阶跃星辰于 2025 年 7 月联合近 10 家芯片及基础设施厂商发起 " 模芯生态创新联盟 ",旨在打通芯片、模型与平台之间的技术壁垒,通过联合优化提升算力利用效率,加速大模型在各行业场景中的应用落地。业内认为,随着推理模型成为主流,模型与算力的深度协同将成为推动大模型规模化应用的重要路径。