公众号记得加星标,第一时间看推送不会错过。
当全球半导体业界纷纷竞逐先进制程时,中国团队在今年 2 月 15-19 日于美国旧金山举办的 ISSCC 2026(国际固态电路会议)上走出了一条差异化创新之路——这一会议始于 1953 年,是全球固态电路领域最权威的学术殿堂,被誉为 " 芯片界的奥林匹克 ",历史上见证了第一个 8 位微处理器、第一个 1GB 内存 DRAM 等众多里程碑式发明的首次披露,其入选资格代表着相关技术达到国际领先水平。在梳理本届 ISSCC 2026 收录的全部技术成果时,我们注意到一个格外亮眼的存在:一家来自中国的 RRAM 领军企业,凭借在阻变存储器与存算一体领域的深厚积累,一举拿下两篇高质量论文,在全球顶尖学术舞台上展现出中国在先进存储架构上的实力与产业竞争力。
此次,Hefei Reliance Memory(合肥睿科微电子)携手国内顶尖科研机构与企业,以纯自主研发的 ReRAM(阻变存储器)技术为核心,依托 55nm 成熟 CMOS 制程,在大语言模型推理、边缘 AI 感知两大核心场景同时实现突破,打造出兼具高性能、高能效与低成本的存算一体芯片,用实打实的成果证明:成熟制程结合架构创新,完全有能力承载 AI 全场景的推理需求,彰显出睿科微电子在 AI 技术领域的扎实自主创新积淀。
当下 AI 推理场景(尤其是边缘端感知推理、LLM 轻量化推理)的规模化落地,正被两大痛点制约:一是先进制程芯片研发成本高、周期长,难以实现低成本普及;二是传统冯 · 诺依曼架构受 " 存储墙 " 困扰,数据频繁搬运导致功耗高、延迟大,无法匹配 AI 推理的高效需求。而睿科微电子深耕的 ReRAM 技术,恰好破解了这一困局—— ReRAM 又称 RRAM(阻变存储器),作为一种新型存储器,为半导体电子技术带来了革命性的功能提升。其基于金属 - 绝缘体结构,通过电压调控介质层的电阻状态实现数据存储,具备非易失性、高速读写、低功耗与高密度集成等多重优势。尤其在成本控制方面,工艺集成度高的特点,使其在规模化生产中展现出显著的成本优势。RRAM 的独特阻变特性,表现出巨大的发展潜力,能够为人工智能、物联网、边缘计算等前沿领域提供高性能的存储解决方案。结构简洁、可扩展性强、与 CMOS 工艺高度融合,使其被视为下一代存储器的理想选择,有望在智能芯片、可穿戴设备、自动驾驶等关键领域发挥重要作用。作为我国纯自主布局的新型非易失性存储器,它兼具 " 存储与计算一体化 " 的天然优势,可直接在存储单元内完成 AI 推理核心的矩阵乘法运算,从根源上消除数据搬运损耗,搭配成熟制程,完美平衡 " 性能、成本、功耗 " 三大核心诉求,为睿科微电子以成熟制程挑战先进制程奠定了坚实基础。
此次亮相 ISSCC 2026 的两项纯国产技术成果(对应会议 Session 7 图像传感器与 Session 31 AI 加速器专题),其中 LLM 推理相关突破在人工智能领域应用价值更为突出,搭配边缘 AI 感知推理成果,用精准的架构设计和卓越的实测数据,共同印证了成熟制程 ReRAM 的强大潜力,也彰显了睿科微电子在 AI 推理技术领域的创新实力。
突破一:3D 堆叠破局,成熟制程 ReRAM 支撑 LLM 高效推理(以架构创新挑战先进制程)
针对大语言模型(LLM)推理中 " 参数规模大、内存带宽紧张、外部访存延迟高 " 的核心痛点——这也是当前人工智能产业规模化落地的关键瓶颈,睿科微电子联合香港科技大学等国内科研机构,推出一款 55nm 基于推测解码的 LLM 加速器,核心采用纯自主的凸点面对面 ReRAM-on-Logic 3D 堆叠技术,搭配全栈自主研发的算法优化,彻底击穿 " 内存墙 ",为 AI 大模型推理提供低成本、高性能的国产化解决方案,以架构创新突破成熟制程局限,实现对先进制程性能的有效追赶。
这款加速器的三大自主创新设计,精准解决 LLM 推理痛点:其一,自主研发的局部旋转单元(LRU),通过分解式快速沃尔什 - 哈达玛变换(FWHT)消除激活异常值,支持 W4A8 高精度量化,在节省 92.7% 芯片面积的同时,实现 3.82-3.93 × 的推理速度提升;其二,ReRAM 堆叠式近存计算(RS-PNM)架构,将 4 颗睿科 ReRAM 芯片垂直堆叠于逻辑芯片之上,4 芯片系统可实现 32MB 片上存储与 102.4GB/s 极致带宽,足以将整个草稿语言模型(DLM)" 冻结 " 在片内,彻底消除外部访存延迟,推理速度再提升 1.1-1.46 ×;其三,自适应并行推测解码(APSD)方案,搭配自主设计的 workload 解耦乱序调度器(WDOS),进一步提升 1.1-1.29 × 推理速度,降低 10-14% 草稿 token 拒绝率。
实测表现同样亮眼:该 55nm 加速器逻辑芯片工作频率 63.5-285MHz,峰值性能 2.33TOPS,单颗 ReRAM 芯片功耗仅 49.54mW;在 LLaMA2-7B 等主流模型上,解码吞吐量达到 14.08-135.69token/s,其中在 MT-Bench 数据集上解码吞吐量达 17.82token/s,能耗仅 123.41mJ/token;对比传统高精度推理基线,速度提升 4.46-7.17 倍,能耗降低 3.74-4.85 倍,困惑度可与主流 W8A16 LLM 加速器媲美,优于同类 4b 及以下量化方案,充分证明 55nm 成熟制程 ReRAM 完全能承载 LLM 推理核心需求,彰显了睿科微电子以成熟制程挑战先进制程的技术实力,为人工智能大模型轻量化、规模化部署提供核心支撑。
突破二:全模拟感知推理,55nm ReRAM 实现边缘 AI 极致能效(边缘 AI 场景互补突破)
除 LLM 推理核心突破外,由南方科技大学林龙扬团队、犀灵视觉(Pixelcore)与睿科微电子联合研发的全模拟智能视觉 SoC,其相关论文《A 55nm Intelligent Vision SoC Achieving 346TOPS/W System Efficiency Via Fully Analog Sensing-to-Inference Pipeline》成功入选 ISSCC 2026 Session 7 图像传感器专题,实现了边缘 AI 传感器融合推理的全链路国产化突破。这一成果标志着三方团队在新型存算架构、端到端智能视觉处理及超低功耗集成电路设计方向取得国际领先进展,也进一步完善了睿科微电子 AI 全场景推理的技术布局,核心亮点在于 " 终结模数转换 " ——从图像传感、特征提取到多层神经网络推理,信号全程保持模拟形态,彻底摒弃了所有中间环节的 A/D 转换,从根源上降低损耗,适配人工智能边缘端感知场景的低成本、低功耗需求。
这款芯片的核心设计均源于国内自主研发,依托 55nm 国产成熟 CMOS 制程,搭配睿科微电子纯自主的 ReRAM 比特单元,集成了 128 × 128 PWM 图像传感器、近传感器 MAC 单元、线性恢复模拟存储器(LR-AMEM)及双 256 × 1024 1T1R 多层单元(MLC)ReRAM 存算宏(1.5Mbit,3b/ 单元)。其中,犀灵视觉贡献了业界领先的 " 像素级运算技术(In-Pixel Computation)",该技术超越传统冯诺依曼架构,高效将像素与运算技术相结合,带来高速度、低功耗优势;其创新逻辑清晰:PWM 图像传感器直接将光电流转换为脉宽信号,输入 ReRAM 存算阵列完成电荷域 MAC 运算,再通过 LR-AMEM 的内置电压 - 时间转换器(VTC)补偿模拟计算的非线性偏差,无需校准电路即可实现高精度推理,全程规避国外技术依赖,真正实现了端到端 " 感存算一体 ",延续了成熟制程结合架构创新的技术路径。
实测数据表现优异:该芯片实现 11pJ/ ( pixel · frame ) 的感知能效,峰值 MAC 能效高达 8791 TOPS/W,系统级能效达到 345.54 TOPS/W(接近 346 TOPS/W 的行业标杆水平);在 CIFAR-10 图像分类、CIFAR-100 分类、PASCAL VOC 2007 目标检测等典型边缘推理任务中,分别实现 91.12%、77.22% 的准确率和 20.5% 的 mAP@0.5,推理延迟低至 0.12ms(分类)与 0.195ms(检测)。相较于过往同类先进方案,其能效比实现了 75.6 倍至 966 倍的跨越式提升,成本却降低 40% 以上,可广泛应用于智能穿戴、微型机器人、自动驾驶感知等对功耗和成本敏感的国产化边缘设备,与 LLM 推理突破形成互补,完善 AI 全场景推理解决方案,进一步印证了成熟制程 ReRAM 的技术竞争力。
核心启示:自主创新,探索后摩尔时代 AI 芯片新路径
睿科微电子此次在 ISSCC 2026 的双重突破,不仅是单一技术的胜利,更为中国半导体产业提供了重要启示:合肥睿科微电子有限公司成立于 2018 年,总部坐落于中国集成电路产业重要集聚区——安徽省合肥市,是一家专注于新一代非易失性存储器芯片、接口技术及面向人工智能的先进存储解决方案的国家高新技术企业。公司已在全球布局超过 300 项存储器技术专利,覆盖主要半导体市场和制造地区。在后摩尔时代,制程微缩的红利逐渐放缓,以 ReRAM(RRAM)存算一体为核心的架构创新,与 3D 堆叠等先进封装技术的结合,正成为释放 AI 算力的关键引擎——睿科微电子通过自主技术的架构与集成创新,以成熟制程成功挑战先进制程的性能表现,走出了一条差异化的 AI 技术发展路径,为行业提供了可借鉴的实践范本。
从产业价值来看,纯国产 ReRAM+55nm 成熟制程的组合,既打破了国外在新型存储器与 AI 推理硬件领域的技术垄断,又规避了先进制程的高研发成本、高设备投入门槛,契合我国半导体产业 " 自主可控、降本增效 " 的发展趋势,为 AI 推理的国产化、规模化落地提供了可行路径。从应用前景来看,这款技术可广泛覆盖边缘 AI、LLM 轻量化部署、智能终端等多个场景,推动我国 AI 产业向自主可控、高质量发展迈进,也进一步巩固了睿科微电子在 ReRAM 及 AI 推理领域的技术优势。
今年 2 月 15-19 日于美国旧金山举办的 ISSCC 2026 舞台上,睿科微电子联合国内团队携 ReRAM 技术成果亮相,两项成果均入选这一顶级学术会议,既印证了 ReRAM 存算一体技术的国际认可度,也集中体现了睿科微电子在 AI 推理硬件领域的自主创新能力。这一实践充分说明:睿科微电子依托自主创新,深耕 ReRAM 存算一体等核心领域,以成熟制程成功挑战先进制程,在 AI 推理赛道实现重要突破,为 AI 芯片的低成本、高性能发展提供了可行方案。未来,期待睿科微电子、犀灵视觉等更多国产企业持续深耕核心技术,推动新型智能芯片从实验室走向广泛产业落地,助力我国半导体与 AI 产业实现全方位自主可控!
* 免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第 4344 内容,欢迎关注。
推荐阅读
加星标第一时间看推送
求点赞
求分享
求推荐