作者 | ZeR0
编辑 | 漠影
太卷了!太卷了!
智东西 8 月 2 日报道,刚刚,知名 AI 大模型评测 Chatbot Arena 放榜!
阿里
Qwen3-235B-A22B-Instruct-2507 位列大语言模型总榜第三,月之暗面 Kimi-K2-0711-preview、深度求索 DeepSeek-R1-0528 并列为总榜第五,以开源之姿超越 Claude 4、GPT-4.1 等顶尖闭源模型。
在 7 月 30 日公布的 Chatbot Arena 编程榜单中,深度求索 DeepSeek-R1-0528、阿里 Qwen3-Coder 并列第一,月之暗面 Kimi-K2-Instruct 位列第七。
Qwen3-235B-A22B-Instruct-2507、阿里 Qwen3-Coder、月之暗面 Kimi K2 均是在 7 月最新发布的开源模型。
赶在 7 月收尾、8 月开头,中国 AI 大模型依旧在紧锣密鼓地上新,字节跳动、阶跃星辰、阿里、月之暗面近两天接连公布模型新动作。
周四晚,字节跳动 Seed 团队发布发布实验性扩散语言模型 Seed Diffusion Preview,阶跃星辰开源基础大模型 Step3。周五,阿里开源 " 甜品级 " 编程模型
Qwen3-Coder-30B-A3B-Instruct,月之暗面发布 kimi-k2 的高速版 kimi-k2-turbo-preview。
Hugging Face 还在周五发布了中国 AI 社区 7 月重点,回溯这一个月来令人眼花缭乱的开源浪潮,包括:
另一个 "DeepSeek 时刻 " —— Kimi K2
Qwen 完全矩阵化 - Instruct / Thinking / Coder 模型跨越 30B – 480B 参数规模
多模态浪潮:
GLM-4.1V-Thinking: Image+Text > Text
Intern-S1: Image+Text > Text
Wan 2.2 – Text +Image > video
Skywork-R1V3: Image+Text > Text
Skywork-UniPic: Text > Image / Image > Text
Tar-7B: Any-to-Any
Ming-Lite-Omni-1.5: Any-to-Any
Step3: Image+Text > Text
HunyuanWorld-1: Image > 3D
ThinkSound: Video > Audio
Neta-Lumina: Text > Image
轻量级、可部署的模型
SmallThinker runs on 1GB RAM
Agentic 编程成为主流
Qwen3-Coder: fully spec ’ d tool calling
GLM-4.5: browser agents, IDE assistant
Qwen3 WebDev demo: text-to-frontend code
特定领域和实用的模型 / 工具 / 数据集
Science one S1: Scientific model
Agentar DeepFinance: Finance dataset
ObjectClear: Interactive Vision Tool
Qwen3 MT Demo: Machine Translation Tool
其中回顾的 7 月 31 个亮眼开源模型、1 个框架、1 个数据集,来自 16 家企业、高校或研究机构:阿里(9 个)、月之暗面(2 个)、智谱(2 个)、阶跃星辰(1 个)、字节跳动(2 个)、昆仑万维(2 个)、智源研究院(1 个)、中国电信人工智能研究院(1 个)、蚂蚁集团(4 个)、快手(1 个)、捏 Ta(1 个)、中科院磐石(3 个)、上海交通大学(1 个)、腾讯(1 个)、上海人工智能实验室(1 个)、复旦大学(1 个)。
Qwen3-Coder-30B-A3B-Instruct、Qwen3-Coder-480B-A35B-Instruct,深度思考模型 Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Thinking-2507,基础模型 Qwen3-235B-A22B-Instruct-2507、Qwen3-30B-A3B-Instruct-2507,CoT 音频模型 ThinkSound,统一视频生成模型 Wan2.2-TI2V-5B,文生视频模型 Wan2.2-T2V-A14B。
2、月之暗面(2 个):MoE 基础模型 Kimi-K2-Base,与 Numina 团队联合研发的数学定理证明模型 Kimina-Prover-72B。
3、智谱(2 个):多模态大模型 GLM-4.1V-9B-Thinking,基础模型 GLM-4.5。
4、阶跃星辰(1 个):基础模型 Step3。
5、字节跳动(2 个):智能体模型 Tar-7B,多语言翻译模型 Seed-X-Instruct-7B。
6、昆仑万维(2 个):多模态推理大模型 Skywork-R1V3-38B,多模态统一模型 Skywork-UniPic-1.5B。
7、智源研究院(1 个):文生配音视频框架 MTVCraft。
8、中国电信人工智能研究院(1 个):
AI-Flow-Ruyi-7B-Preview0704。
9、蚂蚁集团(4 个):多模态推理模型 M2-Reasoning,多模态大模型
Ming-Lite-Omni-1.5,金融训练数据集 Agentar-DeepFinance-100K,交互式深度推理模型
KAG-Thinker-en-ch-7b-instruct。
10、快手(1 个):自适应思考模型 KAT-V1-40B。
11、捏 Ta(1 个):动漫风格图像生成模型 Neta-Lumina。
12、中科院磐石(3 个):科学基础大模型 S1-Base-671B、S1-Base-8B、S1-Base-32B。
13、上海交通大学(1 个):端侧原生大模型
SmallThinker-4BA0.6B-Instruct。
14、腾讯(1 个):3D 世界生成模型 HunyuanWorld-1。
15、上海人工智能实验室(1 个):科学多模态大模型 Intern-S1。
16、复旦大学(1 个):语音生成模型 MOSS-TTSD-v0.5。
前两天 Hugging Face 趋势榜前十直接被华人团队包揽。如今最新榜单中,华人团队占据前十中的 8 席,其中智谱占 2 席、腾讯占 1 席、阿里占 4 席、AI 大神李沐的美国创业公司 BosonAI 占 1 席。
智象未来(HiDream)、美团(MeiGen)、群核科技(SpatialLM)、百度(ERNIE)、稀宇科技(MiniMax)、中科院磐石(ScienceOne)、面壁智能(MiniCPM)等企业的模型虽在最新趋势榜 100 名开外,但也是中国开源 AI 生态的重要力量。
加起来,积极拥抱 AI 开源的中国企业,超过 20 家。
尤其是阿里,是无人争锋的头号 " 卷王 ",卷得频率直接断层,在 7 月先后开源了音频模型 ThinkSound、多模态推理模型 HumanOmniV2、编程模型 Qwen3-Coder(480B-A35B-Instruct)、推理模型
Qwen3-235B-A22B-Thinking-2507、Qwen3-30B-A3B-Thinking-2507、基础模型 Qwen3-235B-A22B-Instruct-2507(非思考版)、电影级视频模型 Wan2.2、编程模型 Qwen3-Coder-Flash(30B-A3B-Instruct),并将新模型背后的 GSPO 新算法公开。
以下是位列最新 Hugging Face 趋势榜 TOP100 中的中国企业、独立研究机构及上榜模型:
1、智谱(7 个):GLM-4.5、GLM-4.5-Air、GLM-4.5-FP8、GLM-4.5-Base、GLM-4.5-Air-FP8、GLM-4.1V-9B-Thinking、GLM-4.5-Air-Base。
2、腾讯(3 个):HunyuanWorld-1、Hunyuan3D-2.1、X-Omni-En。
3、阿里(18 个):
Qwen3-30B-A3B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Thinking-2507、Wan2.2-TI2V-5B、Wan2.2-T2V-A14B、Qwen3-30B-A3B-Thinking-2507、Wan2.2-I2V-A14B、Qwen3-235B-A22B-Instruct-2507、Wan2.2-TI2V-5B-Diffusers、Owen3-30B-A3B-Instruct-2507-FP8、Wan2.2-T2V-A14B-Diffusers、Wan2.2-I2V-A14B-Diffusers、Qwen3-Coder-480B-A35B-Instruct-FP8、Qwen3-0.6B、Qwen3-235B-A22B-Thinking-2507-FP8、Qwen3-30B-A3B、Qwen3-8B。
4、上海人工智能实验室(2 个):Intern-S1、Intern-S1-FP8。
5、月之暗面(1 个):Kimi-K2-Instruct。
6、阶跃星辰(2 个):Step3、OmniSVG(与复旦大学合作)。
7、捏 Ta(1 个):Neta-Lumina。
8、昆仑万维(1 个):Skywork-UniPic-1.5B。
9、小红书(1 个):dots.ocr。
10、字节跳动(1 个):Seed-X-PPO-7B。
11、蚂蚁集团(1 个):Ming-Lite-Omni-1.5。
12、深度求索 DeepSeek(2 个):DeepSeek-R1、DeepSeek-R1-0528-Qwen3-8B。
13、快手(1 个):KAT-V1-40B。
14、智源研究院(1 个):bge-m3。
上榜的还有一些知名个人开发者,比如 Kijai,虽然无法确定国籍,但从其密集选用国产模型的动作来看,大概率是华人。
unsloth、Comfy-Org、bullerwins、QuantStack、Phr00t、英伟达等海外团队位列趋势榜前 100 的模型,不少用阿里 Qwen3、阿里 Wan2.2、智谱 GLM-4.1V 等模型作为底模进行微调、蒸馏或量化。
最新 Hugging Face 趋势榜 TOP100:
在展现受欢迎程度的 "Most likes" 榜中,最后一次更新停留在今年 3 月份的旧版 DeepSeek-R1 依旧稳居第一。