KernelSwift 助力海光 DCU 秒级适配 DeepSeek V4

4 月 24 日，DeepSeek V4 预览版本正式发布并同步开源，海光信息携手上海 AI 实验室通过 DeepLink 团队推出的 KernelSwift ——大模型赋能智能算子生成的全栈系统，率先完成 DeepSeek V4 核心算子在海光 DCU 上的 Day0 适配，生成算子性能加速比达 3.4x，算子平均通过率约 80%。

算子迁移效率与性能优化，是释放国产算力潜能、打通大模型落地 " 最后一公里 " 的核心关键。长期以来，海光 DCU 团队与上海 AI 实验室保持深度技术协同，以先进算子技术为纽带，构建大模型与国产算力芯片高效适配的坚实桥梁，持续推动国产 AI 生态协同演进。

KernelSwift 作为支持多元算力的智能算子迁移系统，可提供 Triton 算子定制优化服务。借助高级抽象与自动算子生成，KernelSwift 可将适配周期从数月压缩至小时级，为海光 DCU 提供开箱即用的高性能算子支持。

在 DeepSeek V4 模型发布后，KernelSwift 基于海光 DCU 启动全自动流程生成核心算子，全程无需人工干预。得益于海光 DCU 对 Triton 的全面支持以及自研 AI 软件栈出色的兼容性，DeepSeek V4 模型共计 21 个核心算子均实现明显加速，自动生成的算子经少量人工修改后可实现 100% 正确性。

此次 Day0 适配的实现，不仅是双方技术实力与合作深度的体现，也标志着国产算子工具、国产大模型与国产芯片的协同发展进入新阶段，打破了过去 " 模型与芯片适配不同步 " 的行业痛点，推动国产 AI 生态从 " 单点突破 " 向 " 协同共赢 " 演进。

春播春管不误，苗情不负

21世纪经济报道 12小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

KernelSwift 助力海光 DCU 秒级适配 DeepSeek V4

宙世代

一起剪

相关阅读

美国富豪非洲狩猎时遭象群踩死：只剩一团残肢断骸

路口绿灯亮起货车突然压线“别车” 网友反手怒赞

世界最速！镜识科技Bolt人形机器人奔跑速度提升至11米/秒

东方卫视19:30《蜜语纪》正在热播

“中方注意到有关情况”

美国发布最新制裁

一部剧把仇恨做成产品：观众边骂边摇

《亢奋》第3季：5年后，这群20岁年轻人的生活比青春期更糟了

泰剧预告24小时冲上热搜TOP3：一个名字引爆跨圈层讨论

一个编剧为何把自己写进暴力深渊？

德黑兰将恢复赴华航班

董军同俄罗斯国防部长举行会谈

那个藏在温州南端的山，新开业，私汤入户，知道的人还不多。

平陆运河预计9月通航 中国与东盟经贸启新章

春播春管不误，苗情不负

最新评论

企业资讯

热门推荐

企业资讯

平陆运河预计9月通航中国与东盟经贸启新章