36 氪获悉,AI 基础设施厂商「基流科技」已于近期完成近亿元 A+ 轮融资,由上海国投孚腾资本、国方创新联合领投,克拉玛依城发基金、张江燧芯基金跟投,老股东卓源亚洲连续四轮追加投资。本轮募集资金将主要用于核心技术研发、市场拓展和团队建设。
基流科技成立于 2023 年 2 月,源自清华大学网络安全实验室。创始人胡效赫是清华大学博士、博士后,在高性能网络和分布式系统领域有十余年研究经验。核心团队成员来自清华、北大等顶尖高校及阿里、百度、中兴等头部厂商。
基流科技定位为全栈自主的 AI 算力建筑商,团队专注于攻克大规模算力集群的分布式计算通信难题。作为国内极少拥有数个万卡集群落地经验的 AI 基础设施厂商,公司已服务包括智谱 AI、商汤科技、运营商、数据中心及地方国企在内的多个用户。
" 不同于专注算力平台运营的‘房地产开发商’和专注系统优化的‘装修商’,我们聚焦搭建覆盖计算通信软硬件的高性能开源自主智算系统,类似‘盖房子’。" 基流科技联合创始人兼 CFO 谢文奇向 36 氪介绍。
随着大模型和 AIGC 应用的爆发,算力已成为继水、电、网之后的新型基础设施,紧随之而来的是网络通信瓶颈、高故障率和供应商软硬绑定带来的高昂成本。英伟达凭借其 CUDA 生态,不仅销售 GPU,还捆绑其专用的网络设备,形成了封闭且昂贵的解决方案。
" 我们的核心优势在于性价比与开放性,其本质在于实现‘解耦’ ",基流科技创始人胡效赫曾指出。通过基流科技自研的 RoCE 组网方案,客户的成本可降低 40%,交付周期也从数月缩短至数周。在 2023 年下半年,基流科技就成功落地了国内最早的第三方千卡 H800 RoCE 集群,有力支撑了国产大模型公司的基座模型迭代。
目前,基流科技打造了自研的高性能开源智算系统 Galaxy HPAC(High-Performance AI Computing)。该系统主要包括三大核心产品:高性能融合 AI 网络 ( Mercury-X ) 、人工智能平台 ( Venus-AICloud ) 和算力建维平台 ( Venus-AIDOC ) 。另外,公司自研的 MS6426 全国芯 25.6T 高速开源 AI 交换机,已通过智算集群 72 小时长稳测试,实现规模部署。
谢文奇介绍,经过两年多时间的发展,公司累计组网调优交付的集群规模已达 23 个,超 6 万 6 千张 GPU、4000 余台交换机,和超 32 万个光模块,同时已成功落地多个跨远距离训推集群( 50 公里、100 公里、1500 公里)。
对于算力是否过剩的疑问,谢文奇告诉 36 氪,算力不只是为了预训练存在,目前不管国内还是国外的大模型公司仍在进行预训练,同时推理和后训练的算力需求正快速增长。但从需求占比看,他提到,2023 年训练与推理的算力需求比大概是 7:3,2024 年是 5:5,到 2025 年可能会达到 3:7。在立足北京、上海等核心区域同时,基流科技也积极响应国家战略,在新疆、宁夏等地参与算力项目落地。
目前,基流科技已投入十万卡集群的仿真和未来架构设计。胡效赫坦言,虽然国内对如何构建和使用十万卡集群仍在探索阶段,但技术必须先行。公司正与更多行业伙伴合作,推动硬件国产化替代和 AI 基础设施生态开放与成熟。