使用 IC Compiler II CCD 流程在 8M 实例扁平化设计中更快实现时序收敛
使用 IC Compiler II CCD 流程在 8M 实例扁平化设计中更快实现时序收敛
会议: SNUG Taiwan 2017
作者: Ted Hong (VATICS INC.)
页数: 36
源文件: SNUG_TPC_CCD_Dorso_Untitled_paper_1.pdf
1. 议程
- 引言 - ICC II 运行时间总结与时序 QoR - 8M 实例扁平化设计 CCD 流程 - ICC II 与 PT-SI 的相关性 - CCD 流程的保持时间结果 - 结论
2. 公司介绍
VATICS INC. 成立于 2007年9月7日,资本 1040万美元,主要产品为多媒体通信 SoC (H.264, H.265等)。管理理念:诚信、服务、创新。已实现从 180nm 到 28nm 的多个项目,拥有多项专利。
3. 设计挑战
- 8M 实例扁平化设计(28nm) - 高速接口 - 分离电压域 - 约 1000 个宏单元 - 有用偏斜 - P&R 阶段无 LVT - 运行时间 - 与 PT-SI 的时序相关性
4. ICC II 扁平化运行优势
- 面积:节省分区间通道面积,节省模块与顶层之间的间距规则 - 资源:不需要分区迭代时间,模块间无馈通,PT-SI 分析无馈通网络 SI 问题 - 运行时间:扁平化运行中,只需一人处理 8M 设计 - 有用偏斜:可对芯片级所有内部路径应用有用偏斜
5. ICC II 扁平化 CCD 流程优势
- 高 QoR:基于扁平化设计计算有用偏斜,不仅计算各子模块内部路径 - 高容量:支持百万级设计扁平化运行 - 快速 TAT:从 place_opt 到 clock_opt 使用 CCD 流程改善时序 QoR,无需 ignore/exclude/skew group 设置;原生分布式任务启动;运行贯穿 place_opt 到 route_opt
6. 场景与运行时间总结
| 阶段 | 耗时 | 场景数 |
| place_opt | 2.3 天 | 8 (4模式, 2 RC) |
| clock_opt | 2.3 天 | 16 (5模式, 2 RC) |
| route_opt | 0.92 天 | 16 |
| 总计 | 5.52 天 |
8M 扁平化设计总 TTR 时间为 5.52 天。无需手动设置 skew group,仅使用从 place_opt 阶段开始的自动 CCD 流程。
7. 时序 QoR 与运行时间详情
| 阶段 | WNS (内部路径) | TNS | 利用率 | 运行时间 (hrs) |
| 00_init | - | - | 58.05% | - |
| 01_place_opt | -0.10 | -120.7 | 59.63% | 55.2 |
| 02_cts | -3.01 | -9374.3 | 59.42% | 17.5 |
| 03_clock_opt | -0.26 | -996.2 | 58.37% | 38 |
| 04_route_auto | -0.88 | -16240 | 58.37% | 8 |
| 05_route_opt | -0.36 | -1163.5 | 59.43% | 14 |
| 06_PT (starRC) | -0.26 | - | 59.43% | - |
良好的 PT 时序相关性,节省 1 个月时序修复时间。
8. CCD vs Non-CCD 对比
| 指标 | Non-CCD | CCD | 改善 |
| WNS | -0.33ns | -0.10ns | 改善 230ps |
| TNS | -902.2ns | -120.7ns | 修复 86% TNS |
| VP | 28960 | 4751 | 修复 84% VP |
- 迭代时间:节省一周人工努力 - 无需设置 ignore 和 exclude 引脚 - 无需设置任何 skew group - 无需基于每次 clock_opt 结果细化 skew group
9. 什么是 CCD?
CCD 并发时钟数据优化 (Concurrent Clock and Data Optimization):交错优化时钟路径与数据路径以获取精确偏斜值。轻量级数据优化后进行有用偏斜计算和优化。
有用偏斜 Useful Skew:调整时钟延迟,包括时钟单元调整大小、缓冲、缓冲移除、重新设置父级、FF 调整大小等,保持时间感知。
10. ICC2 实现流程
ICC2 版本: 2016.12-SP3。LVT 单元不在 ICC2 中使用。
流程:Initial Data In → place_opt with CCD → CTS → clock_opt with CCD → route_opt → StarRC → PT sign-off
自动 CCD 流程:无需设置 skew group;自动计算有用偏斜并为 CTS 保存平衡点信息;使用 VATICS 签核环境验证结果。
11. 从 place_opt 到 clock_opt 使用自动 CCD 流程
- 从 place_opt 阶段到 clock_opt 阶段应用 CCD 流程 - 无需设置 skew group,在 clock_opt 阶段获得 WNS -0.26ns - 节省 "cts + postCTS opt" 迭代时间和手动更新 skew group 规格文件的时间 - CTS 无 CCD,将采用时钟平衡点设置实现 CTS
12. place_opt CCD 实现细节
- 2 pass place_opt 流程:create_placement(带所有 bounds)→ place_opt from initial_drc to final_opto(带 DDR soft bounds)→ 开启 place_opt CCD 选项 → place_opt from final_opto(带 CCD) - place_opt 的 CCD 运行多次(final_opto),而 clock_opt 仅一次(build_clock) - 后续数据优化基于改善的时序 QoR - 有用偏斜计算的时钟延迟变化存储为时钟平衡点,供 CTS 实施
13. CTS 和 clock_opt CCD
CTS 无 CCD:有用偏斜已在 place_opt 阶段计算;CTS 将基于这些 place_opt 时钟平衡点信息构建时钟树。
clock_opt with CCD:基于 CTS 结果,执行 clock_opt -final_opto;根据 VATICS 规范添加保持时间场景。
14. route_opt 和签核
route_opt 无 CCD(clock_opt with CCD 时序已足够好,获得良好 QoR 和 TTR);route_opt 启用 SI 降低。
使用 VATICS 签核 StarRC 和 PT 环境 + 脚本检查时序 QoR。
15. 时序相关性 -- ICC2 与 StarRC + PT
ICC2 与 PT 比较(同一路径): - ICC2: -0.09ns, StarRC+PT: -0.09ns(route_opt 阶段,完全一致)
最差路径组 100th WNS: - ICC2: -0.36ns - PT(GBA): -0.27ns - PT(PBA): -0.23ns
VATICS 签核标准(PT w/ PBA exhaustive):所有均为正余量!
使用 StarRC SPEF: - PT(StarRC + PBA) 结果全部优于 ICC2,无需调整任何 RC 因子。
16. PT ECO 结果
第一次 PT ECO(仅 size_cell):仅使用 size_cell 方法,仅 1 次迭代,时序清洁且面积减少。
| 阶段 | WNS | TNS | VP |
| ICC2 初始 | -0.36 | -175.01 | 4034 |
| PT PBA 初始 | -0.23 | -6.96 | 111 |
| 1st PT ECO 后 ICC2 | -0.14 | -94.26 | 3458 |
| 1st PT ECO 后 PT PBA | 0 | 0 | 0 |
流程:PT ECO → ICC2 legalize_placement → route_eco → StarRC → PT
17. 保持时间结果
带保持修复的 clock_opt 参考结果:WNS=-0.31ns, TNS=-1271.3ns, VP=23689 保持时间 buf (x16/x13/x11) 仅 231 个单元(占总保持时间 buf 的 0.1%),ICC2 使用小缓冲器单元修复大部分保持时间。 CCD 在使用有用偏斜修复建立时间时,始终检查保持时间,保持时间不受影响!
18. 结论
- 自动化使流程简单易用:节省 CTS 阶段周转时间,无需设置 ignore/exclude 引脚或任何 skew group;CCD 可自动解决 ICG 相关路径 - CCD 流程从 place_opt 到 clock_opt 提供良好 QoR 和更快的运行时间:place_opt CCD 计算有用偏斜并按场景保存为时钟平衡点 - 保持时间不受 CCD 流程影响:CCD 在计算建立时间有用偏斜时检查保持时间路径时序 - 与 PT 的良好时序相关性,改善设计收敛运行时间:ICC II 时序结果略差于 PT 结果(无额外时钟不确定性);加速设计收敛运行时间
19. 致谢
感谢 Synopsys AC 支持团队:Queenie Wang, Tony Wang, Jocelyn Lee 和 Eric Shih。
图片索引
共 459 张图片,存放于 SNUG_TPC_CCD_Dorso_Untitled_paper_1_images/ 目录。本文为 PPT 型论文,大部分内容在图片中。
第 1 页:标题页 第 2-3 页:议程 第 4-5 页:公司介绍和成就 第 6-8 页:设计挑战、ICC II 扁平化运行优势、CCD 流程优势 第 10-11 页:场景与运行时间总结、时序 QoR 表格 第 12 页:CCD vs Non-CCD 对比 第 14-21 页:CCD 原理和 ICC2 实现流程图 第 24-27 页:ICC2 与 PT 时序相关性数据和表格 第 28 页:相关性曲线图 第 29 页:PT ECO 结果 第 31-32 页:保持时间结果 第 34-36 页:结论、致谢