超越 DeepMind 的 Langfun、抱抱脸的 Smolagent 等,国产智能体位列全球智能体第一梯队!
GitHub 明星开源项目、行业首个 100% 开源的企业级智能体 JoyAgent,迎来重要更新——
进一步开源 DataAgent 和 DCP 数据治理模块,加速企业级落地。
升级后的 JoyAgent,在全球权威智能体评测榜单 GAIA,Validation 集准确率 77%,Test 集准确率超 67%,相较于此前成绩实现稳步提升。
就在最近,京东亮剑,系统性将其历经内部复杂场景锤炼的系列 AI 能力,从大模型到 Agent,从推理框架到模型安全,悉数开源。
其中就包括行业首个突破可信推理与全模态能力的开源医疗大模型京医千询 2.0、GAIA 评测得分 59.14 的 OxyGent 多智能体框架……
开发者无需从零开始,开箱即可基于京东验证过的技术快速创新。
先来看 JoyAgent,自 7 月份在 WAIC 上作为首个 100% 开源企业级智能体亮相后,便广受关注。
它的开创性在于,当市面上大多数 Agent 还停留在仅开源 SDK 或者框架时,它直接将前后端、框架、引擎、核心子智能体等在内的完整产品能力全部开放,企业无需二次开发,可直接本地部署、开箱即用。
这种彻底的开放性,让它在开发者社群中迅速积累起好口碑。
此番升级,没有停留在小修小补,而是直指企业 AI 落地深水区——数据利用难题。
许多智能体在对答时表现惊艳,但一旦需要连接企业内部的工作流、理解结构化的数据库或半结构化的知识库,往往就束手无策。
JoyAgent 3.0 的突破正在于此。
与市场上其他方案相比,JoyDataAgent 的 " 端到端开箱即用 " 特性显得尤为突出。
当前一些竞品或不支持深度数据治理,或缺乏诊断分析能力,或核心代码并未开放。而 JoyDataAgent 将数据治理 DGP 协议、智能问数、诊断分析和工作建议等能力完整开源,形成了一个通用框架。
企业开发者只需按照 DGP 协议对数据表进行治理即可。
尤为重要的是,它能处理那些 " 没有固定答案 " 的复杂问题,通过 SOPPlan 模式和智能分析,为业务决策提供全新的视角洞察。
这种开放性,使得它能够灵活适配千行百业的独特流程,而非让企业去适应一个固化的平台。
为降低开发门槛,平台还提供了丰富的开箱即用工具集。
例如,京东自研的 NL2Workflow 功能,允许用户用自然语言直接生成可编辑、可执行的工作流。
同时在权威自然语言转 SQL 评测基准 BIRD-Bench 上,JoyDataAgent-SQL Test 集准确率 75.74%,Dev 集准确率 74.25%。
开发者无需面对冗余代码和令人头疼的 YAML 配置。该框架将工具、模型、智能体统统抽象为标准的 Oxy 原子组件。开发者用纯 Python 即可像拼装乐高一样自由组合,代码即插即用。
OxyGent 的独特之处,在于其切面设计理念。无论何种 AI 原子应用,都统一继承 Oxy 算子的生命周期。更值得一提的是,官方提供强大的推理可视化能力,如同为 AI 思维装上 "X 光 ",一眼洞察瓶颈。未来,当 Agent、MCP、LLM 成为历史,新生的 AI 应用仍将成为新的 "Oxy 原子 ",生长于 OxyGent 这个始终进化、面向未来的框架之中。
在 GAIA 评测中,OxyGent 拿下 59.14 分,紧追开源标杆 OWL(60.8 分)。
" 全景式 " 开源,瞄准产业痛点
除了重头戏 Agent,纵观京东开源全貌,打满两个关键词:彻底、全覆盖。
瞄准产业痛点,京东目前已经实现大模型产品和服务的全栈覆盖——
不仅包含上层的 Agent 应用开发环节,其开源体系更是已经延伸至底层基础设施与中间层的模型服务和工具。
先说大热的 AI 健康领域,面向复杂专病诊疗,京东健康开源行业首个突破可信推理及全模态能力的医疗大模型——京医千询 2.0。
为此,京医千询 2.0 会严格模拟医生临床诊疗思维路径,深度融合医学知识体系与真实诊疗逻辑,模型可在推理过程中主动引入并对齐外部的循证医学证据(即基于科学研究和临床实践的可靠医学数据和研究成果),以确保推理符合医学共识。
据介绍,为了实现可信推理,团队做了两项努力:
构建高质量长序列推理训练数据:让模型学习处理连续复杂的推理过程,而不仅仅是简单片段化的信息。
建立基于人类偏好的持续学习闭环:这个闭环会根据人类专家的反馈,对模型输出进行纠正和强化,让模型的决策更加符合人类专家的标准。
在此基础上,京医千询 2.0 还实现了对文本、影像、检验报告等多模态医学数据的深度融合解析。
为什么要多模态?答案显而易见。
和其它领域一样,多模态也是医疗大模型真正走入临床应用的必经之路。有了这一能力,模型不仅能够理解医学语言、提取关键临床信息,还能够精准解析影像资料,自动识别并描述感兴趣区域的位置特征与性质信息。
如此一来,模型就能建立起跨越不同数据模态的 " 思维链 ",实现多步、多源信息融合推理。
在涵盖医学影像病灶分割、报告生成、文档理解等 5 大能力的 21 项评测中,京医千询 2.0 的综合表现展现出领先优势。
实际上,自 2023 年推出并于今年 2 月全面开源以来,京医千询已在多家医院、健康管理中心、医药零售企业、体检中心以及养老机构得到应用。此次升级和持续开源无疑也会加速这一进程。
再来看基础设施方面,京东开源了自研的、专为国产芯片优化的 xLLM 推理框架,提供企业级的服务部署,使得性能更高、成本更低。
服务层(主要负责处理各种请求):包括在离线请求弹性调度、动态 PD 分离、EPD 混合机制及高可用容错设计;
引擎层(主要负责实际运算):包括多流并行计算、图融合优化、投机推理、动态负载均衡及全局 KV 缓存管理。
2025 京东全球科技探索大会期间,Oxygen-9N-xLLM 大模型推理引擎也正式官宣开源。这一推理引擎实现了服务 - 引擎分离的创新架构,在推理效能上取得进展,帮助京东零售业务实现 5 倍效率提升和 90% 成本优化,推动国产 AI Infra 从跟随国际开源框架到定义新一代推理标准。
京东还开源 JoySafety 大模型安全,提供从输入到输出的全链路防护。
其以可插拔的安全原子能力与 DAG 策略编排为核心,企业可根据自身业务需求,自定义安全策略,实现从通用防御到智能精准防护的升级。
具体来说,它内置了从敏感词识别到提示词注入检测等多维度的安全能力,独到之处在于 " 流式输出检测 + 撤回 " 机制,能在 AI 回答的过程中进行毫秒级风险判断,一旦发现有问题可立即中断。
经京东内部复杂业务验证,它能将恶意攻击和提示词注入成功率降低 95% 以上,并且支持 Docker 一键部署,让企业分钟级就能获得生产级的安全防护。
京东开源,意在何方?
京东这次如此大规模、成体系地开源其核心 AI 技术,背后的逻辑远不止于技术分享,而是直指 AI 落地最难啃的骨头——如何让前沿技术真正在千行百业中用得起、用得好。
当前,企业面对 AI 时往往陷入两难:
一方面,谁都害怕错过 AI 大模型的历史性机遇,迫切希望拥抱变革;但另一方面,具体到自身业务,究竟该如何下手、如何见效,又常常感到无从下手。动辄数百万的试错成本,以及高技术门槛和不确定的回报,让许多企业望而却步。
而京东的选择,是换一种思路破局,将自身在复杂业务场景中锤炼出的产业实践——包括工程技术、算法模型与落地经验——通过开源的方式,变成整个行业的 " 公共基础设施 "。
这步棋,首先为开发者扫清了障碍。以往需要重金投入才能触及的企业级 AI 能力,如今得以 " 开箱即用 "。开发者可以零成本直接基于这些久经考验的代码进行创新,这将激发来自社区的应用灵感与创新活力。
而当无数开发者基于京东的开源项目进行构建时,一种更深层的价值开始浮现——生态的协同与标准的形成。比如京东通过在开源项目中推动如 DGP 数据治理协议等技术标准,有助于推动形成统一、互操作的技术规范。
最终,这一切也将回馈于京东自身。
通过开源吸引全球开发者参与共建,京东能持续反哺自身技术迭代。当越来越多的企业选择基于这套 " 京东系 " 开源技术来构建其核心 AI 应用时,一个以京东为核心的繁荣技术生态便水到渠成。
在通往 AGI 的道路上,单一公司的技术突破存在天花板,而生态的繁荣则能集行业共智。
京东这步棋,下的正是未来。
GitHub 地址:https://github.com/jd-opensource
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
点亮星标
科技前沿进展每日见