近日,由中科创星参投的清程极智团队系统构建了以赤兔推理引擎、AI Ping 评测路由平台、八卦炉智能软件栈为核心的全链路 Token 解决方案。清程极智围绕大模型推理降本、国产算力生态适配、Token 服务质量与性价比三大行业关键痛点,集中推出了多项核心技术突破与规模化落地成果,以技术创新推动中国 AI 产业从 " 能用 " 迈向好用、省钱、自主可控的新阶段。(雷峰网)
清程极智成立于 2023 年 12 月,核心团队来自清华大学计算机系高性能计算所,已完成天使轮、PreA、PreA+ 三轮融资,获得中科创星、中金资本、考拉基金、联想创投、中关村科学城公司等多家国资与明星投资机构加持,是国内专注 AI 基础设施(AI Infra)的标杆企业,致力于打造一站式全链路 Token 解决方案。
当前,全球 AI 产业已进入规模化落地的关键阶段,Token 成为 AI 时代的 " 水电煤 ",是大模型服务与智能应用的核心生产要素。数据显示,2024 年初至 2026 年 3 月,中国 Token 日均调用量激增约 1400 倍,规模突破 140 万亿。伴随 Agent 智能体、多模态应用快速普及,Token 正从交互用量转向生产用量,直接推动产业对推理效率、部署成本、服务稳定性的要求持续攀升。
在 Token 需求爆发的同时,国产算力与国产模型迎来高速发展,但二者之间的推理环节却长期依赖海外引擎,难以充分释放国产硬件性能;而 Token 服务市场也面临乱、贵、慢、选型难等突出问题,供需错位、成本高企、体验不一,成为制约 AI 技术普惠化、规模化落地的核心瓶颈。
针对大模型部署成本高、国产算力适配不足的痛点,清程极智推出赤兔推理引擎。作为完全自主研发的国产推理引擎,赤兔打破海外技术垄断,构建 " 国产算力 + 国产引擎 + 国产模型 " 全国产化闭环,针对昇腾、海光、沐曦、摩尔线程等国产芯片的硬件特性深度优化,实现标量向量计算、数据表达、硬件调度、卡间互联的全维度适配,解决国产算力 " 能用不好用 " 的难题。
在性能与成本上,赤兔推理引擎实现突破性提升:通过软件方案在不具备 FP4/FP8 硬件能力的算力设备上支持 FP4/FP8 低位宽量化,使用 FP8 量化可降低 50% 算力门槛,FP4 量化可降低 75% 算力门槛;部署 DeepSeek V3 满血版模型时,仅需 1 台 8 卡 910B 服务器即可替代传统 4 台 8 卡机,硬件成本从 600 万元降至 150 万元。目前,赤兔已在券商、能源央企等场景落地应用,某能源央企实现 3500+ 员工全国产化算力稳定使用,算力效率提升近 40%,相关案例荣获 2025 人工智能应用大赛铜奖。(雷峰网)
面对 Token 服务市场服务商林立、指标混乱、选型成本高的行业乱象,清程极智打造 AI Ping 一站式大模型服务评测与 API 智能路由平台,成为国内首个集 " 信息汇总、客观评测、智能路由 " 于一体的 Token 服务枢纽。平台已接入 30 余家主流服务商、600 余个大模型服务,覆盖文本、图片、视频等全场景;通过 7 × 24 小时多地域分布式监测,实时输出延迟、吞吐、可靠性、价格等核心指标,数据真实可核验;依托智能路由算法,以统一 API 接口为用户自动匹配最优服务商,实现成本降低超 37%、吞吐提升超 90%、延迟降低超 20%,让开发者 " 一键调用、省心省钱 ",专注业务创新。
此外,清程极智还推出八卦炉智能软件栈,面向大模型训练、微调场景提供高效 Token 生产与智能调度能力,与赤兔推理引擎、AI Ping 平台形成协同,覆盖 AI" 训练推理应用 " 全流程,构建完整的 AI 基础设施生态。
清程极智相关负责人表示,公司将持续深耕 AI 基础设施领域,坚持核心技术自主可控,不断迭代赤兔推理引擎对国产芯片的适配能力,完善 AI Ping 评测与路由服务,联动国产算力、国产模型、行业应用等产业链伙伴,打造高效、普惠、安全的国产 AI 基础设施体系,响应国家 " 人工智能 +" 行动,以技术创新推动中国 AI 产业高质量发展。