关于ZAKER 合作

DeepSeek V4 真要来了 !

我的创业故事:《

大家好,我是微笑哥。

大家可能听说过很多次,DeepSeek V4 就要爱了,这一次可能是最靠谱的时间点了。

就在上周,多位知情人士透露,DeepSeek 创始人梁文锋在内部已经明确了节奏:下一代旗舰大模型 V4,计划于 4 月下旬正式与公众见面

虽然官方还没按下那个最终的发布按钮,但网页端悄悄上线的 " 快速模式 " 和 " 专家模式 ",以及频繁的灰度测试,都在预示我们它很快要来了。

为什么跳票这么久?可能很大的一个原因是,DeepSeek 又要搞一次国内 AI 大模型谁也没有做过的事情。

那就是完全使用国产 AI 芯片。

有关注中国 AI 发展的人都知道,过去我们一直被卡脖子的不仅是芯片制程,更是英伟达 CUDA 生态的软件护城河。

但这一次,DeepSeek V4 干了一件牛逼的事情:完全运行在华为昇腾 950PR 芯片之上,底层代码从 CUDA 全面转向华为自研的 CANN 框架

这意味着什么?在极端的外部封锁下," 国产模型 + 国产芯片 " 这条独立技术路线,不仅走通了,还跑出了加速度

听说阿里、字节、腾讯等巨头已经闻风而动,提前预订了数十万片昇腾芯片,导致芯片价格直接飙升了 20% 。

现在感觉 DeepSeek 的使命,就是在 AI 领域替国人探索哪些无人区,等 DeepSeek 带头搞出来后,国产其它模型再跟进普及

就比如 DeepSeek V3 出来后,让国产的其它大模型,迅速的拉平了和国外大模型差距。

甚至 DeepSeek 公司每次发表新论文的时候,国内外的各大模型大厂,都会迅速跟进研究、融入到自己的模型中。

综合目前多方信源,DeepSeek V4 预计将采用万亿参数(1T)的 MoE(混合专家)架构,更夸张的是,它的上下文窗口直接拉到了100 万 Tokens

但其实我觉得 DeepSeek V4 虽然会比 V3 更好,但一定没有大家像之前期待的那么炸裂。

本质上来讲,DeepSeek 在大模型公司中,仍然属于比较小的公司,不管人力还是各种资源毕竟是有限的。

我们要尊重是事物发展规律。平心而论,DeepSeek 已经做得很优秀了。

它用最少的钱,跑出了最强的模型;它以一己之力,把全球 AI 推理成本打了下来。它已经完成了中国 AI 史上最重的一幕:证明了我们不仅能做,还能做得比硅谷更好。

但随之而来的,是沉重得近乎窒息的关注与期望。

当一个公司被贴上 " 全村的希望 "、" 国家 AI 旗手 " 的标签时,每一次宕机都会被无限放大,每一个延期都会被过度解读。

这种压力,足以压垮任何一家创业公司。

我们应该用正常的眼光来看待更多 " 平凡、也会犯错的 DeepSeek",哪怕崩溃了,V4 不那么惊艳,也并不影响 DeepSeek 的历史地位,已经它仍然是一家巨牛逼的公司。

PS:

去年开始,我一直在死磕 "AI+ 跨境 "。很多人问我,普通人现在入场跨境电商还有没有机会?我的答案是:有,而且是降维打击的机会。

我们实操了 6 家店,3 个月内单店营收稳步破万,更重要的是,新学员的出单率拿到了 90% 以上。

AI 跨境目前以每年 50%-80% 的速度增长,在这个大幅度增长的背景下会诞生无数个机遇,我们普通人只需要抓住一个即可。

建议你先了解一下,试错的成本并不高错过的代价确很大,加下面微信自动发《AI 跨境搞钱手册》,看完对这个项目会有一个系统的了解。

加我微信,自动发资料

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容