存算一体芯片迭代进入冲刺期
6月20日,华中科技大学信息存储系统教育部重点实验室里,电流嗡鸣声不绝于耳。“喻家山二号”芯片研发进入关键期。
2024年11月底,全球存储容量最大的MRAM(磁性随机存储器)存算一体芯片“喻家山一号”芯片在此诞生。这款由华科大副校长、信息存储系统教育部重点实验室主任冯丹教授带领团队研发的芯片,突破了统治计算机架构70余年的冯·诺依曼技术瓶颈,将“存”与“算”融为一体,通过原位计算大幅降低数据移动能耗,算力高达每秒能做30.1万亿次AI运算,能效比超过高端边缘AI芯片。
冯丹表示,“喻家山二号”芯片将在“喻家山一号”技术基础上迭代升级,进一步提升算力与能效。

华科大信息存储系统教育部重点实验室存算一体芯片研发团队,前排右四为冯丹教授,前排右五为童薇教授。
“小个子,大能耐”
武汉光电国家研究中心展厅,两块银灰色“喻家山一号”芯片呈现在长江日报记者眼前,单芯片面积不足2厘米见方。

“喻家山一号”存算一体芯片。
“小个子,能耐大。”实验室童薇教授拿起其中一块,语气里带着自豪,“存储容量64Mb,算力达30.10TOPS,能效140.54TOPS/W。”
这组数字意味着什么?冯丹解释,在传统芯片上,数据必须像搬运工一样,从存储区长途跋涉到计算区,这个过程消耗了90%以上的能量和时间。而“喻家山一号”能让数据“原地办公”,直接在存储单元完成计算。这不仅让它每秒能完成30.1万亿次AI运算,更让每瓦功耗能驱动140.54万亿次运算。简而言之,它不仅算得快,而且还节能。
AI算力的“马力”越大,数值越大,跑大模型、图像识别、自动驾驶等AI任务越快。2024年11月底,冯丹教授拿到团队刚研发完成的“喻家山一号”封装芯片时,迫不及待放到板卡上测试其是否具备设计预期的超凡“马力”。

存算芯片板卡。
“当时我们研发了两款芯片,一款基于MRAM介质,另一款基于ReRAM(阻变存储器)介质,没想到两款都能点亮,非常顺利。”童薇介绍,首先确认是否能正常上电,随后测试读写等基本功能,包括存储容量是否达标、计算能力是否正常等。
测试过程中,ReRAM芯片比较顺利,能正常工作,但MRAM芯片连续一个月测试没有任何反应。
“示波器测量不到任何信号,输入激励后也没有输出,虽然能上电,但无法激活。”童薇回忆,那段时间实验室气氛压抑到了极点。冯丹带领团队一遍遍排查,最终发现是芯片的一个引脚定义弄反了,“那一刻,悬着的心才重重落下”。
随着ChatGPT和DeepSeek相继上线,2025年,冯丹决定做一个大胆的尝试:将1.5B(15亿)参数规模的模型部分计算任务,卸载到“喻家山一号”上运行。
“成功了!”测试结果验证了芯片具备支撑大模型推理的系统级能力。冯丹解释:“就像CPU需要编译器将高级语言转化为机器码一样,我们的存算一体芯片也需要一套专用编译工具链,将目标操作转换为芯片可理解的指令。”
“完全符合设计预期!”冯丹带领团队完成了存算一体芯片的设计到软件工具链的全套工作。但是团队却异常平静,第二天的实验室依然安静如昨,因为他们前面还有更大的目标。
“要做就做最好的”
1987年,17岁的冯丹考入华中工学院(现华中科技大学)计算机专业,她首次系统学习了冯·诺依曼架构。那时的她未曾预料到,未来自己会成为这一经典理论的突破者。
2006年,已在该校任教十载的冯丹,投身国家973计划“下一代互联网信息存储的组织模式和核心技术研究”。在探索“多层次、可扩展的存储对象”模式的过程中,她认识到冯·诺依曼架构的局限性,脑海中萌生出存算一体的创新构想。
“存算一体的核心,是把计算功能迁移到存储端,让数据在存储位置就地运算,彻底消除搬运开销。”冯丹向记者阐释道。这一构想在2009年看到曙光——惠普实验室发现忆阻器效应,为存算一体的物理实现奠定了理论基础。存算一体旨在最大限度降低乃至消除数据传输的能耗。其实质是让数据与计算单元尽可能贴近,理想状态下,数据可在存储位置直接运算,无需任何移动。
2014年,他们研发的“主动对象海量存储系统及关键技术”获得国家技术发明奖二等奖。这项技术让存储系统具备了一定的处理能力,被视为存算一体的早期雏形。
“距离实现存算一体芯片的目标近在咫尺,我们必须突破这一关键瓶颈。”凝视着实验室陈列的主动对象存储卡,冯丹为团队定下了新的攻关方向。
研发之路布满荆棘。当时,存算一体芯片主要有两条技术路线:SRAM(静态随机存储器)和MRAM(磁性随机存储器)。国内同行多选择SRAM路线,因为更易适配现有工艺。但SRAM断电数据即失,且存储密度受限,难以承载大模型时代对海量数据的需求。
“要做就做最好的!”冯丹毅然选择了更难走的路——MRAM非易失性存储技术。这种技术兼具断电数据保存、读写速度快、功耗低、寿命长、抗干扰强等优势,更适配存算一体芯片的应用需求,是未来高端存储芯片的核心方向。
从材料特性研究到单元结构设计,再到阵列集成与算法优化,这支四五十人的团队埋头苦干了10年。“很多人的黑发熬成了白发。”童薇感慨道。正是这份坚持,让“喻家山一号”在算力与能效上达到全球领先水平,一举打破国外对高端存储技术的长期垄断。
“要打破生态壁垒”
“喻家山一号”问世后,冯丹团队马不停蹄地推进产业化进程,他们对接产业链上下游企业,开展应用测试与市场推广,致力于让顶尖技术走出实验室,赋能千行百业。
“存算一体技术短期内必将大规模应用。”童薇描述了应用前景——该芯片采用异构计算架构,并非要取代CPU或GPU,而是将基础CPU改造为更适应智能处理的计算单元。通过在存算一体芯片外围集成更多逻辑模块,可将其打造为功能全面的通用芯片。
目前,团队正与多家行业领军企业合作,推进芯片的小批量试产与场景化应用,着力解决工艺适配、成本优化及批量生产等关键问题,加速实现商业化落地。“AI发展的主要瓶颈是能耗,而存算一体技术凭借其高能效比,必将在各层级应用中大放异彩。”冯丹表示。
但在落地过程中,一道无形的“生态壁垒”横亘在前。长期以来,全球集成电路技术标准多由国外主导,我国产业发展受制于人。
“技术创新离不开标准引领。”冯丹深知,要实现存算一体规模化发展,必须建立自主可控的标准体系。去年,她牵头组织高校、科研院所及龙头企业,启动存算一体技术国家标准的制定工作。项目组系统梳理了技术架构、性能指标、测试方法等核心要素,形成了完整科学的国标草案。
目前,团队已正式提交国家标准申报材料。冯丹表示,这将彻底改变国内产业“无标可依”的局面,破除技术生态壁垒,构建自主可控的存算一体产业生态。
“喻家山一号”芯片问世仅一年,“喻家山二号”芯片的研发已进入冲刺阶段。冯丹透露,“喻家山二号”芯片将在现有技术基础上,进一步提升算力与能效,优化存储容量与集成度,拓展更多应用场景,攻克更高精度的原位计算、多场景适配等核心技术,推动存算一体技术向更高水平、更宽领域迈进。

鄂公网安备42018502006943号