观点网讯:3 月 31 日,阿里千问正式发布新一代全模态大模型 Qwen3.5-Omni,该模型在 215 项第三方性能测试中取得 SOTA(当前最优效果),在音视频理解与实时交互等多项核心指标上超越 Google Gemini-3.1 Pro。
根据公开资料整理,Qwen3.5-Omni 系列包含 Plus、Flash 及 Light 三种尺寸的 Instruct 版本,支持 256k 长上下文,可处理超过 10 小时的音频输入及超过 400 秒的 720P(1FPS)音视频输入。模型采用 Hybrid-Attention MoE 架构,在海量文本、视觉及超过 1 亿小时的音视频数据上进行原生多模态预训练。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。