《科创板日报》9 月 29 日讯(记者 黄心怡)梁文锋最新动作来了,DeepSeek-V3.2-Exp 今天正式发布并开源。
根据 DeepSeek 官方介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek 稀疏注意力(Sparse Attention)机制,旨在对长文本的训练和推理效率进行探索性的优化和验证。
对于此次模型更新,中信建投 TMT 行业首席分析师武超则评价,DeepSeek-V3.2-Exp" 易用性再次大幅提升 "。
值得一提的是,除了英伟达 CUDA 版本外,DeepSeek 还开源了 TileLang 版本 GPU 算子。
目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价。
在缓存命中的情况下,输入价格由 0.5 元 / 百万 token 降低为 0.2 元。在缓存未命中的情况下,输入价格由 4 元 / 百万 token 减低为 2 元。输出价格则从 12 元 / 百万 token 大幅降低为 3 元。
据介绍,该实验版本代表了 DeepSeek 对更高效的 transformer 架构的研究,特别注重提高处理扩展文本序列时的计算效率。
DeepSeek 稀疏注意力架构 ( DSA ) 首次实现了细粒度(fine-grained)稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长文本训练和推理效率。
" 我们使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。在最后阶段,以 TileLang 作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含 TileLang 与 CUDA 两种版本。我们建议社区在进行研究性实验时,使用基于 TileLang 的版本以方便调试和快速迭代。"
《科创板日报》了解到,TileLang 编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源 AI 算子编程语言。在华为全联接大会上,该团队核心成员董宇骐曾介绍,TileLang 实现了 FlashAttention 算子开发,代码量从 500+ 行减少至 80 行,并保持了与官方版本持平的性能。
除了 DeepSeek 外,近期阿里通义千问、智谱也都在推进大模型的迭代升级。
在 2025 云栖大会现场,阿里云接连发布了七款大模型技术产品,覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型 Qwen3-Max 正式发布,预训练数据量达 36T,总参数超过万亿,在 Coding 编程能力和 Agent 工具调用能力上有较大提升。
智谱新模型 GLM-4.6 将于近日发布,目前已可通过 API 接口调用。
月之暗面 Kimi 则发布 Agent 模式 "OK Computer" 并开启灰度测试。据官方介绍,"OK Computer" 延续 " 模型即 Agent" 理念,通过端到端训练 Kimi K2 模型,进一步提升智能体及工具调用能力。