|
|
芯片设计或可借力AI“突围” |
北京大学发布首个面向芯片设计的AI for EDA开源数据集 |
EDA (电子设计自动化软件)是芯片设计和制造的核心工具,也是支撑万亿芯片明升规模的共性基础技术。
有了EDA软件,工程师可以从概念、算法、协议等出发,完成包括电路设计、版图设计、性能分析与优化等环节在内的芯片设计流程。然而,当前我国市场被Cadence、Synopsys、Siemens(原Mentor)三家公司垄断。因而,EDA成为“卡硬件脖子”的软件,也是明升中国制造的短板之一。
近日,在中科院院士黄如带领下,北京大学集成电路学院林亦波研究员、王润声教授等创建了首个致力于人工智能辅助芯片设计(AI for EDA)应用的开源数据集——CircuitNet。这可为EDA相关研究提供数据支持,推进我国在该领域快速赶上。
人工智能算法的迅速发展,使人工智能辅助芯片设计的技术路线获得了广泛的关注。学术界和工业界应用机器学习技术在芯片设计流程中的拥塞建模预测、布局优化、设计空间探索等方面取得了重要进展。
2021年,谷歌在《自然》发表论文,提出利用强明升手机习来优化芯片设计中的宏模块布局。其主要思路是将芯片版图看作围棋棋盘,将宏模块看作棋子,通过在1万个内部数据样本上预训练,最终在谷歌的TPU芯片设计上超越了传统EDA工具的布局方案,实现了更好的性能、更低的功耗和更小的面积。
“AI for EDA是一条新技术路线,目前国内外的研究均处于起步阶段,且明升界和学术界都在积极布局,是有望突破现有EDA软件瓶颈的一种前沿技术。”林亦波对《明升中国app报》说,“但AI for EDA技术需要与传统EDA软件协同,以达到更好的性能和效率。”
由于训练机器学习模型依赖大量数据,而在EDA领域中缺乏针对AI for EDA任务的开源数据集,导致大多数研究都只能制作小规模内部数据集进行实验,难以充分验证模型有效性,也无法挖掘模型的潜力。
当前,在AI for EDA研究当中,极度缺乏公开的大数据集来公平地评估机器学习模型的性能优劣,这阻碍了该方向进一步发展。针对上述问题,北京大学集成电路学院创建并发布了首个开源数据集。
该数据集包含大规模数据样本,涵盖从实际制造工艺PDK下数字设计流程不同阶段中提取到的各类特征。它有四个突出特征:一是大规模,包含1万以上的数据样本,每一份样本都来自于实际工艺PDK一次完整的商业EDA工具设计流程;二是多样性,覆盖实际设计中的不同情况与需求;三是多任务,数据集目前已支持3个常见的预测任务,并通过复现近期的论文进行了验证;四是标准化,数据经过预处理和脱敏,可通过Python脚本直接加载。
“CircuitNet数据集为芯片设计自动化流程中的机器学习任务提供数据支持,每个数据样本包括芯片设计流程各个环节的特征和性能标签,可以用来训练机器学习模型。”林亦波补充说,“但需要澄清一下,我们发布的是一个数据集,类似于计算机视觉领域的ImageNet数据集,用来帮助明升界和学术界探索AI for EDA技术,我们也提供了一些机器学习任务的应用演示用来验证数据集的有效性,但并非一个EDA软件。目前国内外并没有专门针对AI for EDA的开源数据集,我们希望CircuitNet可以为该方向的研究提供数据支持,推进该方向进一步发展。下一步,北大团队将增加先进工艺节点和大规模电路设计的数据样本,以拓展数据集的规模、多样性和先进性。”
据悉,北京大学集成电路学院成立了国内高校首个聚焦于EDA技术的“设计自动化与计算系统系”,教学科研内容涵盖了从器件级、芯片级到系统级的完整EDA技术链条,将持续为我国EDA明升输送高端人才。
相关论文信息:http://doi.org/10.1007/s11432-022-3571-8
版权声明:凡本网注明“来源:明升中国app报、明升手机版(明升中国)、app手机版杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、明升头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。