我悟了,DeepSeek V4 系列发布 1 个月,价格屠夫的本色这才刚刚发力啊!
官方这边,打折促销期还没过,折上折价格已官宣落定为永久降价。




长会话能把缓存命中保持在 90%+,输入 token 成本降到 1/5 的那种。

Reasonix 的实现思路也不复杂,最核心的一点是:基于字节稳定 prefix-cache 设计的 append-only 运行循环。
就是说,Reasonix 的工作流程是专门为了 DeepSeek 的缓存机制设计的:旧的上下文固定不动,新消息只往后追加,尽量保证每一轮请求的前半部分完全一样,从而提高缓存命中率,降低长会话成本。
具体架构可以拆分成 3 个部分来看。

自动前缀缓存(prefix-cache)仅在当前请求的精确字节前缀和先前请求匹配时才会激活,想要提高缓存命中率,需要解决的是大多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳的问题。
Reasonix 的解决方案是把上下文划分为三个区域:

工具调用修复(Tool-Call Repair)
DeepSeek 比较容易遇到的问题包括:
工具调用 JSON 在内部已经生成,但在最终消息里却消失不见;
模型想调用工具,但参数写歪了,即 JSON 参数畸形;
同一工具被反复调用且参数完全相同,即重复调用风暴;
JSON 被截断。
工具调用修复会通过 4 轮处理,让 Reasonix 在真正执行前,先尝试修复这些问题。
成本控制
首先,默认优先使用 v4 flash,困难任务才会切 pro。

用户要是觉得下一次任务比较难,就输入 /pro,这样下一轮对话模型就会切换为 v4 pro。跑完这一轮后 Reasonix 自动切回便宜模型,无需用户手动更改。
最后,失败信号会触发自动升级:失败次数到达警戒线后,当前轮次的剩余部分就会切到 v4 pro 上运行。
Reasonix 在安装使用方面也比较简单。
两步即可运行,无需全局安装:
进入项目目录;
输入:npx reasonix code,启动 TUI 会话。
不习惯用终端的话,Reasonix 还提供了桌面版。
以及再次再次高亮一下来自 Reasonix 官方的提醒:
Reasonix 只为 DeepSeek 打造,每一个抽象层级都基于 DeepSeek 的 Feature 构建,完全不通用,也 " 不会发布通用功能 "。
One More Thing
省钱的事情,大家伙当然喜闻乐见,毕竟也不是每个人都能像龙虾之父 Peter 那样无限狂烧公司 token。


我们真的需要一个 DeepSeek 原生编程 Agent 吗?
有网友分享说,Ta 写了一个微型桥接程序,在 Codex 中使用 DeepSeek V4 Pro,同样实现了 95% 以上的高缓存命中。
并且 Ta" 没做任何特殊处理,只是将 DeepSeek API 的格式调整为 Codex 所需要的 "。

甭管你用了哪一种方案,都欢迎在评论区分享分享心得体验。
大家省才是真的省(doge)。
项目地址:
https://github.com/esengine/DeepSeek-Reasonix
参考链接:
[ 1 ] https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1--cache-first-loop
[ 2 ] https://esengine.github.io/DeepSeek-Reasonix/index.html
— 欢迎 AI 产品从业者共建 —
「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。
一键关注 点亮星标
科技前沿进展每日见