CNFinBench 公布大语言模型综合得分 : 中国平安金融大模型荣登榜首

近日，中国平安金融大模型 PingAnGPT-Qwen3-32B 在行业权威大模型评测体系 CNFinBench 大语言模型公开榜单上综合排名榜首。本次参评模型阵容强大、竞争激烈，涵盖 DeepSeek-R1（671B）、Qwen3-235B-A22B、Kimi-K2（1000B）等开源大模型，以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等领先的闭源商业模型，代表当前行业水平。此次评测登顶也标志着平安在金融大模型领域的技术能力已达到行业先进水平。

CNFinBench 是由上海人工智能国家实验室团队联合金融领域权威机构打造的中文金融大模型综合性评测基准，为当前国内具权威性和行业认可度的金融大模型能力评估平台。本次测评中，PingAnGPT-Qwen3-32B 在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越，展现出精准的金融数值计算能力、严谨的逻辑推理能力和全金融领域知识体系的深度掌握，尤其在金融投研分析、风险计量等场景具有重要应用价值和安全可控优势。

评测方表示，此次登顶 CNFinBench，体现了平安在金融大模型领域的技术实力。值得关注的是，中国平安参评的模型仅采用 32B 参数规模，不足 DeepSeek-R1（671B）的 5% 及 Kimi-K2（1000B）的 3.2% 规模，却实现了综合性能上的超越，在模型效率与性能平衡上实现了重要技术突破。依托于 " 轻量高效 " 特性，该模型已支持产险车险报案、人事员服智能问数、客服实时质检、智能话术、集团财资费用审核等 97 个业务场景，并为其后续在私有化部署、场景化应用提供了坚实基础。

据悉，CNFinBench 评测体系覆盖金融专业知识问答、金融业务理解与分析、金融事实推理与计算、金融合规与风险控制、金融内生与应用安全五大核心维度，全面检验模型在金融垂直领域的专业深度、业务理解力、计算准确性、合规意识及安全可控性。

2025 年前三季度，平安的数据库已沉淀 30 万亿字节数据，覆盖近 2.50 亿个人客户；基于海量数据训练大模型，积累超 3.2 万亿高质量文本语料，31 万小时带标注的语音语料，超 75 亿图片语料。以海量数据为基础，以科技公司服务技术开发与应用，平安持续拓展场景应用的深度和广度，赋能金融业务优体验、控风险、降成本、促销售。2026 年 2 月，国家知识产权出版社发布《金融科技行业 2025 年专利分析白皮书》与《医疗健康行业 2025 年专利分析白皮书》，中国平安再度揽获 2025 年金融科技、医疗健康行业专利数双榜首，并在多项核心技术与关键应用场景中占据领先地位。

中国平安表示，通过打造领先 AI 能力，推进模型优化迭代，深化场景化应用落地，公司持续将技术优势转化为服务价值，以高质量的数字化金融供给，不断满足人民群众对美好生活的向往，践行 " 省心、省时、又省钱 " 的服务承诺，为金融强国建设贡献平安力量。

校对：杨旭

责编：刘新

129吨黄金运抵回国，普京宣布限制黄金出口

财经新闻 22小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

CNFinBench 公布大语言模型综合得分 : 中国平安金融大模型荣登榜首

宙世代

一起剪

相关阅读

129吨黄金运抵回国，普京宣布限制黄金出口

699元大邮轮，盯上月薪3000打工人

最新评论

企业资讯

热门推荐

企业资讯

热门订阅 换一批

中保新知

挖贝网

银莕财经

局市

医线Insight

GMIF创新观察

热门订阅换一批