Fusion + DSO.ai + DesignDash打造芯片数字孪生:AI助力RISC-V内核5nm大数据加速4nm设计
📑 目录
- 1. 
- 2. 
- 3. 
- 4. 
- 5. 
- 6. 
- 7. 
- 8. 
- 9. 
- 10. 
- 11. 
- 12. 
- 13. 
- 14. 
- 15. 
- 16. 
- 17. 
- 18. 
- 19. 
- 20. 
- 21. 
- 22. 
- 23. 
- 24. 
- 25. 
- 26. 
- 27. 
- 28. 
- 29. 
- 30. 
- 31. (空白页)
Fusion + DSO.ai + DesignDash打造芯片数字孪生:AI助力RISC-V内核5nm大数据加速4nm设计
作者: James Chuang, EDA Group, Synopsys
会议: SNUG China 2023 / China Developer Conference 2023
页数: 31(含282张图片的PPT演示文稿)
源文件: SNUG_CN_Chuang_Fusion + DSO.ai + De_paper.pdf
Page 1
Fusion + DSO.ai + DesignDash打造芯片数字孪生
AI助力RISC-V内核5nm大数据加速4nm设计
James Chuang, EDA Group, Synopsys China Developer Conference 2023
Page 2
人工智能——创新之道
各市场领域的IC均包含AI能力:
- 移动:所有智能手机都集成了AI处理能力 - 数据中心:超过50%的企业正在其服务器基础设施中部署AI加速器 - 物联网(IoT):利用AI的IoT设备预计将以每年28%的复合年增长率增长 - 汽车:L3级自动驾驶汽车的批量生产将于2024年开始
Page 3
疫苗研发(AI加速)
Page 4
定制芯片助力癌症研究
Page 5
虚拟现实:将学习与探索提升到新高度
Page 6
环境:地球数字孪生
Page 7
模型发展超越摩尔定律
- 摩尔定律:2年翻一番 - AI训练计算量年复合增长率(2012-2021年):694%(10年内增长10亿倍) - 当代模型规模呈指数级增长 - 第一代:感知机(Perceptron)→ 第二代:ALVINN, NETtalk, TD-Gammon → 现代:AlexNet, ResNets, AlphaGoZero, DQN, Neural Machine Translation
Page 8
硬件是AI革命的核心
Page 9
设计生产力提升107倍,但设计仍需时间
- 架构设计 → 结构设计 → 逻辑设计 → 布局设计 - 需要数十到数百名工程师,24个月以上的开发周期 - 离散的优化领域,长迭代循环,无反向流程
Page 10
Gartner调查显示人才短缺是新兴技术应用的最大障碍
各类学科招聘困难的公司占比: - 电气工程:~65% - 计算机科学:~60% - 机械工程:~40% - 计算机工程:~45% - 材料科学:~35% - 运营:~25%
美国人才短缺达10年最高,全球人才短缺加剧压力
Page 11
数字化创新,交付更多算力、更快速度
- 先进节点PPA 功耗性能面积:无缝新节点启用;开箱即用的PPA能力和优化的成本效率(PPA-C) - 超融合:100+核心可扩展性实现最快设计吞吐量;全局RTL到GDSII RTL-to-GDSII收敛,扩展左移优化;原生高级signoff、测试和验证融合 - AI/ML增强PPA与生产力:第二代DSO.ai强化学习引擎;AI引导的动态实现流程;ML驱动的预测流程和大数据分析 - 数字设计重定向:AI驱动的数字设计重定向;提高工程生产力和计算效率
Page 12
物理综合对混合行设计至关重要
启用全流程混合site-row密度和单元使用优化: - 混合行感知的综合与优化 - 更好的PPA 功耗性能面积,更快的周转时间(TAT) - 减少布线拥塞 - 改善流程收敛
案例:亚洲某移动半导体公司,Fusion Compiler物理综合 - 布局与综合交错并发 - 频率:2.5GHz(比参考提升+150MHz) - 面积:-12%(比参考缩小) - 快速启用:7周完成 - 首个3nm项目,大型HPC 高性能计算核心—3M实例,激进排期 - Quickstart kit和mega switches可用
Page 13
AI挑战我们重新思考可能性——使用Synopsys AI进行设计重定向
- 原始设计 → 通过AI功能实现 → 衍生设计(重定向的"数字孪生") - 完全重制 vs 强化学习 vs AI驱动的重新优化
Page 14
Synopsys DSO.ai — AI驱动的数字设计
- 突破性强化学习:能够搜索数万亿种RTL到GDSII设计排列组合以获取最佳结果 - 快速上手:与数字设计家族完全集成——业界最丰富的技术基础 - 云端就绪:支持本地、公有云和混合云快速部署
Page 15
今日演示——使用DSO.ai交付"数字孪生"
AI驱动的数字设计PPA优化: - 传统EDA开箱即用 → 基线实现 - → 自主PPA优化(AI驱动优化) - → 自主节点迁移与优化(AI驱动"数字孪生")
Page 16
今日案例:RISC-V高性能CPU内核
基线实现: - 基于RISC-V的"大核",面向数据中心应用 - 尺寸:426um x 255um(仅单核) - 工艺:5nm
| 基准 | 目标 | 用户期望 | |
| 性能 | 1.75GHz | MET | 1.95GHz |
| 功耗 | 29.8mW | MET | 30mW |
| 面积 | OOTB参考流程 | - | - |
预估达成目标时间:2名专家工程师 x 1个月
Page 17
DSO.ai执行流程 — 冷启动配置
无先前训练数据库的AI驱动优化: - 计算配置:1x DSO.ai AI驱动优化主机 + 30个Fusion Compiler作业并行进行3次迭代 - 排列组合(共25个):RISC-V HPC工具箱、优化策略、时序优化策略、合法化策略、功耗策略 - 理论搜索空间:10^8(1亿)
基线 → 3次迭代 → 优化
Page 18
今日案例:RISC-V高性能CPU内核 — AI驱动优化结果
| 基准(OOTB RISC-V) | DSO.ai AI驱动 | 目标 | |
| 性能 | 1.75GHz | 1.95GHz | 1.95GHz |
| 功耗 | 29.8mW | 27.9mW | 30mW |
| 面积 | - | MET | MET |
2天,90次运行,零人工! 全部PPA目标达成!
Page 19
今日演示——使用DSO.ai达成PPA目标
AI驱动的数字设计PPA优化总结:
| 阶段 | 结果 |
| 基线实现(OOTB) | 性能~90%,功耗未达标,面积未达标 |
| 预估人工达成时间 | 2人 x 1个月 |
| AI驱动优化 | 0人工 x 2天(90次运行) |
| 全部PPA目标 | 已达成! |
Page 20
DSO.ai — 应用跨设计学习实现项目复用
提升设计团队生产力,提高计算效率:
- 项目1:衍生品设计(相同工艺,不同特性/约束) - 参考设计(A) [节点1] → 下一代设计(B) [节点1] - "热启动"(利用相关性复用) - 项目2:工艺迁移(相似设计风格,不同技术节点) - 设计(A) [节点1] → 迁移设计(A') [节点2] - "热启动" vs "冷启动"
Page 21
"数字孪生":RISC-V高性能CPU(迁移版本)
- 基于RISC-V的"大核",面向数据中心应用 - 尺寸:404um x 242um(缩小10%) - 工艺:5nm → 4nm
| 基准 | 目标 | |
| 性能 | 1.85GHz | 2.1GHz |
| 功耗 | 28.4mW | 30mW |
| 面积 | -10% | -10% |
预估达成目标时间:2名专家工程师 x 1个月
Page 22
DSO.ai配置 — "数字孪生"热启动
利用先前训练数据库的AI驱动优化: - 计算配置:1x DSO.ai AI驱动优化主机 + 来自5nm DSO.ai运行的训练数据库 + 15个Fusion Compiler作业,单次迭代 - 排列组合(共25个):RISC-V HPC工具箱 + 其他策略 - 理论搜索空间:10^8(1亿)
DSO.ai执行流程:基线 → 单次迭代 → 优化(训练数据库来自5nm) 相比冷启动减少6倍
Page 23
迁移今日案例:RISC-V高性能CPU结果
| 基准 | DSO.ai AI驱动 | 目标 | |
| 性能 | 1.85GHz | 2.15GHz | 2.1GHz |
| 功耗 | 28.4mW | 29.4mW | 30mW |
| 面积 | -10% | -10% | -10% |
1天,15次运行,零人工!
Page 24
总结 — 使用DSO.ai自主实现"数字孪生"
| 阶段 | 方法 | 结果 |
| 基线实现 | 传统EDA OOTB | PPA部分达标 |
| AI驱动优化 | 冷启动(5nm) | 0人工 x 2天(90次运行),全部达标 |
| AI驱动数字孪生 | 热启动(5nm→4nm) | 0人工 x 1天(15次运行),全部达标 |
DSO.ai在数天内自主达成PPA目标 vs 数周的人工工作量!
Page 25
Synopsys DesignDash — 数字设计大数据分析
- 捕获(Capture):无缝集成,云端就绪的数据服务器 - 分析(Analyze):识别问题的度量指标 - 可视化(Visualize):加速结果诊断 - 行动(Act):ML驱动的指导以实现更好的PPA 功耗性能面积
Page 26
分析:将大数据转化为更好的决策
挖掘、整理和融合海量数据集,提取关键设计洞察:
大数据 → 定向分析 → 更好的决策 - 是什么(WHAT)→ 为什么(WHY)→ 何时(WHEN)
- 智能专家工作流:高效捕捉领域特定知识 - 开箱即用(OOTB) - 描述性洞察 → 预测性优化 → 规范性指导
Page 27
DSO.ai快速找到跨架构的最优解
帕累托前沿 — 架构的极限
架构性帕累托前沿:展示可实现PPA 功耗性能面积的极限边界
Page 28
传统架构优化缓慢且不透明
需要加速发现限制可达成PPA的架构极限:
- v0.01 早期RTL 寄存器传输级 → 有限的可见性 → 临时性逐层分析 → 有限的历史背景 - 架构1:优化缺失的时序约束,改进IO位置 - 架构2:重新架构算术数据通路/重新流水线 - 架构3:新的存储器阵列尺寸 — 更快、新边界 - 架构4:重新架构缓存和控制逻辑 - 数月之后 → v0.9
Page 29
Fusion + DSO.ai + DesignDash — AI设计进化
加速通往最优PPA 功耗性能面积的路径:
从数周缩短到显著减少的迭代: - 360度项目可见性 - + 快速洞察 - + 自动因果关系分析 - + 智能建议 - + 高效知识捕捉
v0.01 早期RTL → DSO.ai更少迭代找到最优解 → 架构1→4同时快速探索
Page 30
谢谢!Thank You
Page 31
(空白页)
图片索引
本文共 282 张图片,存放于 SNUG_CN_Chuang_Fusion + DSO.ai + De_paper_images/ 目录。由于图片数量众多,以下按页码列出文件名。
Page 1: p1_1_08ff4db6.png, p1_2_9fd25215.png, p1_3_847e0947.png, ...
Page 2-31: 完整图片列表请参见 _images/ 目录。
注:本演示文稿为PPT格式,每页包含大量图片素材(平均每页约9张),总计282张图片。译文中已嵌入各页首张代表性图片引用。