我的创业故事:《
大家好,我是微笑哥。
大家可能听说过很多次,DeepSeek V4 就要爱了,这一次可能是最靠谱的时间点了。
就在上周,多位知情人士透露,DeepSeek 创始人梁文锋在内部已经明确了节奏:下一代旗舰大模型 V4,计划于 4 月下旬正式与公众见面。

为什么跳票这么久?可能很大的一个原因是,DeepSeek 又要搞一次国内 AI 大模型谁也没有做过的事情。
那就是完全使用国产 AI 芯片。
有关注中国 AI 发展的人都知道,过去我们一直被卡脖子的不仅是芯片制程,更是英伟达 CUDA 生态的软件护城河。
但这一次,DeepSeek V4 干了一件牛逼的事情:完全运行在华为昇腾 950PR 芯片之上,底层代码从 CUDA 全面转向华为自研的 CANN 框架。
这意味着什么?在极端的外部封锁下," 国产模型 + 国产芯片 " 这条独立技术路线,不仅走通了,还跑出了加速度。
听说阿里、字节、腾讯等巨头已经闻风而动,提前预订了数十万片昇腾芯片,导致芯片价格直接飙升了 20% 。
现在感觉 DeepSeek 的使命,就是在 AI 领域替国人探索哪些无人区,等 DeepSeek 带头搞出来后,国产其它模型再跟进普及。
就比如 DeepSeek V3 出来后,让国产的其它大模型,迅速的拉平了和国外大模型差距。
甚至 DeepSeek 公司每次发表新论文的时候,国内外的各大模型大厂,都会迅速跟进研究、融入到自己的模型中。
综合目前多方信源,DeepSeek V4 预计将采用万亿参数(1T)的 MoE(混合专家)架构,更夸张的是,它的上下文窗口直接拉到了100 万 Tokens。
但其实我觉得 DeepSeek V4 虽然会比 V3 更好,但一定没有大家像之前期待的那么炸裂。
本质上来讲,DeepSeek 在大模型公司中,仍然属于比较小的公司,不管人力还是各种资源毕竟是有限的。
我们要尊重是事物发展规律。平心而论,DeepSeek 已经做得很优秀了。
它用最少的钱,跑出了最强的模型;它以一己之力,把全球 AI 推理成本打了下来。它已经完成了中国 AI 史上最重的一幕:证明了我们不仅能做,还能做得比硅谷更好。
但随之而来的,是沉重得近乎窒息的关注与期望。
当一个公司被贴上 " 全村的希望 "、" 国家 AI 旗手 " 的标签时,每一次宕机都会被无限放大,每一个延期都会被过度解读。
这种压力,足以压垮任何一家创业公司。
我们应该用正常的眼光来看待更多 " 平凡、也会犯错的 DeepSeek",哪怕崩溃了,V4 不那么惊艳,也并不影响 DeepSeek 的历史地位,已经它仍然是一家巨牛逼的公司。
PS:
去年开始,我一直在死磕 "AI+ 跨境 "。很多人问我,普通人现在入场跨境电商还有没有机会?我的答案是:有,而且是降维打击的机会。
我们实操了 6 家店,3 个月内单店营收稳步破万,更重要的是,新学员的出单率拿到了 90% 以上。

建议你先了解一下,试错的成本并不高错过的代价确很大,加下面微信自动发《AI 跨境搞钱手册》,看完对这个项目会有一个系统的了解。
加我微信,自动发资料