Fusion + DSO.ai + DesignDash打造芯片数字孪生：AI助力RISC-V内核5nm大数据加速4nm设计

作者: James Chuang, EDA Group, Synopsys 会议: SNUG China 2023 / China Developer Conference 2023 页数: 31（含282张图片的PPT演示文稿） 源文件: SNUG_CN_Chuang_Fusion + DSO.ai + De_paper.pdf

Page 1

Fusion + DSO.ai + DesignDash打造芯片数字孪生

AI助力RISC-V内核5nm大数据加速4nm设计

James Chuang, EDA Group, Synopsys China Developer Conference 2023

Page 2

人工智能——创新之道

各市场领域的IC均包含AI能力：

- 移动：所有智能手机都集成了AI处理能力 - 数据中心：超过50%的企业正在其服务器基础设施中部署AI加速器 - 物联网（IoT）：利用AI的IoT设备预计将以每年28%的复合年增长率增长 - 汽车：L3级自动驾驶汽车的批量生产将于2024年开始

Page 3

疫苗研发（AI加速）

Page 4

定制芯片助力癌症研究

Page 5

虚拟现实：将学习与探索提升到新高度

Page 6

环境：地球数字孪生

Page 7

模型发展超越摩尔定律

- 摩尔定律：2年翻一番 - AI训练计算量年复合增长率（2012-2021年）：694%（10年内增长10亿倍） - 当代模型规模呈指数级增长 - 第一代：感知机（Perceptron）→ 第二代：ALVINN, NETtalk, TD-Gammon → 现代：AlexNet, ResNets, AlphaGoZero, DQN, Neural Machine Translation

Page 8

硬件是AI革命的核心

Page 9

设计生产力提升107倍，但设计仍需时间

- 架构设计 → 结构设计 → 逻辑设计 → 布局设计 - 需要数十到数百名工程师，24个月以上的开发周期 - 离散的优化领域，长迭代循环，无反向流程

Page 10

Gartner调查显示人才短缺是新兴技术应用的最大障碍

各类学科招聘困难的公司占比： - 电气工程：~65% - 计算机科学：~60% - 机械工程：~40% - 计算机工程：~45% - 材料科学：~35% - 运营：~25%

美国人才短缺达10年最高，全球人才短缺加剧压力

Page 11

数字化创新，交付更多算力、更快速度

- 先进节点PPA 功耗性能面积：无缝新节点启用；开箱即用的PPA能力和优化的成本效率（PPA-C） - 超融合：100+核心可扩展性实现最快设计吞吐量；全局RTL到GDSII RTL-to-GDSII收敛，扩展左移优化；原生高级signoff、测试和验证融合 - AI/ML增强PPA与生产力：第二代DSO.ai强化学习引擎；AI引导的动态实现流程；ML驱动的预测流程和大数据分析 - 数字设计重定向：AI驱动的数字设计重定向；提高工程生产力和计算效率

Page 12

物理综合对混合行设计至关重要

启用全流程混合site-row密度和单元使用优化： - 混合行感知的综合与优化 - 更好的PPA 功耗性能面积，更快的周转时间（TAT） - 减少布线拥塞 - 改善流程收敛

案例：亚洲某移动半导体公司，Fusion Compiler物理综合 - 布局与综合交错并发 - 频率：2.5GHz（比参考提升+150MHz） - 面积：-12%（比参考缩小） - 快速启用：7周完成 - 首个3nm项目，大型HPC 高性能计算核心—3M实例，激进排期 - Quickstart kit和mega switches可用

Page 13

AI挑战我们重新思考可能性——使用Synopsys AI进行设计重定向

- 原始设计 → 通过AI功能实现 → 衍生设计（重定向的"数字孪生"） - 完全重制 vs 强化学习 vs AI驱动的重新优化

Page 14

Synopsys DSO.ai — AI驱动的数字设计

- 突破性强化学习：能够搜索数万亿种RTL到GDSII设计排列组合以获取最佳结果 - 快速上手：与数字设计家族完全集成——业界最丰富的技术基础 - 云端就绪：支持本地、公有云和混合云快速部署

Page 15

今日演示——使用DSO.ai交付"数字孪生"

AI驱动的数字设计PPA优化： - 传统EDA开箱即用 → 基线实现 - → 自主PPA优化（AI驱动优化） - → 自主节点迁移与优化（AI驱动"数字孪生"）

Page 16

今日案例：RISC-V高性能CPU内核

基线实现： - 基于RISC-V的"大核"，面向数据中心应用 - 尺寸：426um x 255um（仅单核） - 工艺：5nm

	基准	目标	用户期望
性能	1.75GHz	MET	1.95GHz
功耗	29.8mW	MET	30mW
面积	OOTB参考流程	-	-

预估达成目标时间：2名专家工程师 x 1个月

Page 17

DSO.ai执行流程 — 冷启动配置

无先前训练数据库的AI驱动优化： - 计算配置：1x DSO.ai AI驱动优化主机 + 30个Fusion Compiler作业并行进行3次迭代 - 排列组合（共25个）：RISC-V HPC工具箱、优化策略、时序优化策略、合法化策略、功耗策略 - 理论搜索空间：10^8（1亿）

基线 → 3次迭代 → 优化

Page 18

今日案例：RISC-V高性能CPU内核 — AI驱动优化结果

	基准（OOTB RISC-V）	DSO.ai AI驱动	目标
性能	1.75GHz	1.95GHz	1.95GHz
功耗	29.8mW	27.9mW	30mW
面积	-	MET	MET

2天，90次运行，零人工！ 全部PPA目标达成！

Page 19

今日演示——使用DSO.ai达成PPA目标

AI驱动的数字设计PPA优化总结：

阶段	结果
基线实现（OOTB）	性能~90%，功耗未达标，面积未达标
预估人工达成时间	2人 x 1个月
AI驱动优化	0人工 x 2天（90次运行）
全部PPA目标	已达成！

Page 20

DSO.ai — 应用跨设计学习实现项目复用

提升设计团队生产力，提高计算效率：

- 项目1：衍生品设计（相同工艺，不同特性/约束） - 参考设计(A) [节点1] → 下一代设计(B) [节点1] - "热启动"（利用相关性复用） - 项目2：工艺迁移（相似设计风格，不同技术节点） - 设计(A) [节点1] → 迁移设计(A') [节点2] - "热启动" vs "冷启动"

Page 21

"数字孪生"：RISC-V高性能CPU（迁移版本）

- 基于RISC-V的"大核"，面向数据中心应用 - 尺寸：404um x 242um（缩小10%） - 工艺：5nm → 4nm

	基准	目标
性能	1.85GHz	2.1GHz
功耗	28.4mW	30mW
面积	-10%	-10%

预估达成目标时间：2名专家工程师 x 1个月

Page 22

DSO.ai配置 — "数字孪生"热启动

利用先前训练数据库的AI驱动优化： - 计算配置：1x DSO.ai AI驱动优化主机 + 来自5nm DSO.ai运行的训练数据库 + 15个Fusion Compiler作业，单次迭代 - 排列组合（共25个）：RISC-V HPC工具箱 + 其他策略 - 理论搜索空间：10^8（1亿）

DSO.ai执行流程：基线 → 单次迭代 → 优化（训练数据库来自5nm） 相比冷启动减少6倍

Page 23

迁移今日案例：RISC-V高性能CPU结果

	基准	DSO.ai AI驱动	目标
性能	1.85GHz	2.15GHz	2.1GHz
功耗	28.4mW	29.4mW	30mW
面积	-10%	-10%	-10%

1天，15次运行，零人工！

Page 24

总结 — 使用DSO.ai自主实现"数字孪生"

阶段	方法	结果
基线实现	传统EDA OOTB	PPA部分达标
AI驱动优化	冷启动（5nm）	0人工 x 2天（90次运行），全部达标
AI驱动数字孪生	热启动（5nm→4nm）	0人工 x 1天（15次运行），全部达标

DSO.ai在数天内自主达成PPA目标 vs 数周的人工工作量！

Page 25

Synopsys DesignDash — 数字设计大数据分析

- 捕获（Capture）：无缝集成，云端就绪的数据服务器 - 分析（Analyze）：识别问题的度量指标 - 可视化（Visualize）：加速结果诊断 - 行动（Act）：ML驱动的指导以实现更好的PPA 功耗性能面积

Page 26

分析：将大数据转化为更好的决策

挖掘、整理和融合海量数据集，提取关键设计洞察：

大数据 → 定向分析 → 更好的决策 - 是什么（WHAT）→ 为什么（WHY）→ 何时（WHEN）

- 智能专家工作流：高效捕捉领域特定知识 - 开箱即用（OOTB） - 描述性洞察 → 预测性优化 → 规范性指导

Page 27

DSO.ai快速找到跨架构的最优解

帕累托前沿 — 架构的极限

架构性帕累托前沿：展示可实现PPA 功耗性能面积的极限边界

Page 28

传统架构优化缓慢且不透明

需要加速发现限制可达成PPA的架构极限：

- v0.01 早期RTL 寄存器传输级 → 有限的可见性 → 临时性逐层分析 → 有限的历史背景 - 架构1：优化缺失的时序约束，改进IO位置 - 架构2：重新架构算术数据通路/重新流水线 - 架构3：新的存储器阵列尺寸 — 更快、新边界 - 架构4：重新架构缓存和控制逻辑 - 数月之后 → v0.9

Page 29

Fusion + DSO.ai + DesignDash — AI设计进化

加速通往最优PPA 功耗性能面积的路径：

从数周缩短到显著减少的迭代： - 360度项目可见性 - + 快速洞察 - + 自动因果关系分析 - + 智能建议 - + 高效知识捕捉

v0.01 早期RTL → DSO.ai更少迭代找到最优解 → 架构1→4同时快速探索

Page 30

谢谢！Thank You

Page 31

（空白页）

图片索引

本文共 282 张图片，存放于 SNUG_CN_Chuang_Fusion + DSO.ai + De_paper_images/ 目录。由于图片数量众多，以下按页码列出文件名。

Page 1: p1_1_08ff4db6.png, p1_2_9fd25215.png, p1_3_847e0947.png, ... Page 2-31: 完整图片列表请参见 _images/ 目录。

注：本演示文稿为PPT格式，每页包含大量图片素材（平均每页约9张），总计282张图片。译文中已嵌入各页首张代表性图片引用。

Fusion + DSO.ai + DesignDash打造芯片数字孪生：AI助力RISC-V内核5nm大数据加速4nm设计

📑 目录