使用 IC Compiler II CCD 流程在 8M 实例扁平化设计中更快实现时序收敛

SNUG Taiwan 2017 2017 36 页

使用 IC Compiler II CCD 流程在 8M 实例扁平化设计中更快实现时序收敛

会议: SNUG Taiwan 2017 作者: Ted Hong (VATICS INC.) 页数: 36 源文件: SNUG_TPC_CCD_Dorso_Untitled_paper_1.pdf


1. 议程

- 引言 - ICC II 运行时间总结与时序 QoR - 8M 实例扁平化设计 CCD 流程 - ICC II 与 PT-SI 的相关性 - CCD 流程的保持时间结果 - 结论

2. 公司介绍

VATICS INC. 成立于 2007年9月7日,资本 1040万美元,主要产品为多媒体通信 SoC (H.264, H.265等)。管理理念:诚信、服务、创新。已实现从 180nm 到 28nm 的多个项目,拥有多项专利。

3. 设计挑战

- 8M 实例扁平化设计(28nm) - 高速接口 - 分离电压域 - 约 1000 个宏单元 - 有用偏斜 - P&R 阶段无 LVT - 运行时间 - 与 PT-SI 的时序相关性

4. ICC II 扁平化运行优势

- 面积:节省分区间通道面积,节省模块与顶层之间的间距规则 - 资源:不需要分区迭代时间,模块间无馈通,PT-SI 分析无馈通网络 SI 问题 - 运行时间:扁平化运行中,只需一人处理 8M 设计 - 有用偏斜:可对芯片级所有内部路径应用有用偏斜

5. ICC II 扁平化 CCD 流程优势

- 高 QoR:基于扁平化设计计算有用偏斜,不仅计算各子模块内部路径 - 高容量:支持百万级设计扁平化运行 - 快速 TAT:从 place_opt 到 clock_opt 使用 CCD 流程改善时序 QoR,无需 ignore/exclude/skew group 设置;原生分布式任务启动;运行贯穿 place_opt 到 route_opt

6. 场景与运行时间总结

阶段耗时场景数
place_opt2.3 天8 (4模式, 2 RC)
clock_opt2.3 天16 (5模式, 2 RC)
route_opt0.92 天16
总计5.52 天

8M 扁平化设计总 TTR 时间为 5.52 天。无需手动设置 skew group,仅使用从 place_opt 阶段开始的自动 CCD 流程。

7. 时序 QoR 与运行时间详情

阶段WNS (内部路径)TNS利用率运行时间 (hrs)
00_init--58.05%-
01_place_opt-0.10-120.759.63%55.2
02_cts-3.01-9374.359.42%17.5
03_clock_opt-0.26-996.258.37%38
04_route_auto-0.88-1624058.37%8
05_route_opt-0.36-1163.559.43%14
06_PT (starRC)-0.26-59.43%-

良好的 PT 时序相关性,节省 1 个月时序修复时间。

8. CCD vs Non-CCD 对比

指标Non-CCDCCD改善
WNS-0.33ns-0.10ns改善 230ps
TNS-902.2ns-120.7ns修复 86% TNS
VP289604751修复 84% VP

- 迭代时间:节省一周人工努力 - 无需设置 ignore 和 exclude 引脚 - 无需设置任何 skew group - 无需基于每次 clock_opt 结果细化 skew group

9. 什么是 CCD?

CCD 并发时钟数据优化 (Concurrent Clock and Data Optimization):交错优化时钟路径与数据路径以获取精确偏斜值。轻量级数据优化后进行有用偏斜计算和优化。

有用偏斜 Useful Skew:调整时钟延迟,包括时钟单元调整大小、缓冲、缓冲移除、重新设置父级、FF 调整大小等,保持时间感知。

10. ICC2 实现流程

ICC2 版本: 2016.12-SP3。LVT 单元不在 ICC2 中使用。

流程:Initial Data In → place_opt with CCD → CTS → clock_opt with CCD → route_opt → StarRC → PT sign-off

自动 CCD 流程:无需设置 skew group;自动计算有用偏斜并为 CTS 保存平衡点信息;使用 VATICS 签核环境验证结果。

11. 从 place_opt 到 clock_opt 使用自动 CCD 流程

- 从 place_opt 阶段到 clock_opt 阶段应用 CCD 流程 - 无需设置 skew group,在 clock_opt 阶段获得 WNS -0.26ns - 节省 "cts + postCTS opt" 迭代时间和手动更新 skew group 规格文件的时间 - CTS 无 CCD,将采用时钟平衡点设置实现 CTS

12. place_opt CCD 实现细节

- 2 pass place_opt 流程:create_placement(带所有 bounds)→ place_opt from initial_drc to final_opto(带 DDR soft bounds)→ 开启 place_opt CCD 选项 → place_opt from final_opto(带 CCD) - place_opt 的 CCD 运行多次(final_opto),而 clock_opt 仅一次(build_clock) - 后续数据优化基于改善的时序 QoR - 有用偏斜计算的时钟延迟变化存储为时钟平衡点,供 CTS 实施

13. CTS 和 clock_opt CCD

CTS 无 CCD:有用偏斜已在 place_opt 阶段计算;CTS 将基于这些 place_opt 时钟平衡点信息构建时钟树。

clock_opt with CCD:基于 CTS 结果,执行 clock_opt -final_opto;根据 VATICS 规范添加保持时间场景。

14. route_opt 和签核

route_opt 无 CCD(clock_opt with CCD 时序已足够好,获得良好 QoR 和 TTR);route_opt 启用 SI 降低。

使用 VATICS 签核 StarRC 和 PT 环境 + 脚本检查时序 QoR。

15. 时序相关性 -- ICC2 与 StarRC + PT

ICC2 与 PT 比较(同一路径): - ICC2: -0.09ns, StarRC+PT: -0.09ns(route_opt 阶段,完全一致)

最差路径组 100th WNS: - ICC2: -0.36ns - PT(GBA): -0.27ns - PT(PBA): -0.23ns

VATICS 签核标准(PT w/ PBA exhaustive):所有均为正余量!

使用 StarRC SPEF: - PT(StarRC + PBA) 结果全部优于 ICC2,无需调整任何 RC 因子。

16. PT ECO 结果

第一次 PT ECO(仅 size_cell):仅使用 size_cell 方法,仅 1 次迭代,时序清洁且面积减少。

阶段WNSTNSVP
ICC2 初始-0.36-175.014034
PT PBA 初始-0.23-6.96111
1st PT ECO 后 ICC2-0.14-94.263458
1st PT ECO 后 PT PBA000

流程:PT ECO → ICC2 legalize_placement → route_eco → StarRC → PT

17. 保持时间结果

带保持修复的 clock_opt 参考结果:WNS=-0.31ns, TNS=-1271.3ns, VP=23689 保持时间 buf (x16/x13/x11) 仅 231 个单元(占总保持时间 buf 的 0.1%),ICC2 使用小缓冲器单元修复大部分保持时间。 CCD 在使用有用偏斜修复建立时间时,始终检查保持时间,保持时间不受影响!

18. 结论

- 自动化使流程简单易用:节省 CTS 阶段周转时间,无需设置 ignore/exclude 引脚或任何 skew group;CCD 可自动解决 ICG 相关路径 - CCD 流程从 place_opt 到 clock_opt 提供良好 QoR 和更快的运行时间:place_opt CCD 计算有用偏斜并按场景保存为时钟平衡点 - 保持时间不受 CCD 流程影响:CCD 在计算建立时间有用偏斜时检查保持时间路径时序 - 与 PT 的良好时序相关性,改善设计收敛运行时间:ICC II 时序结果略差于 PT 结果(无额外时钟不确定性);加速设计收敛运行时间

19. 致谢

感谢 Synopsys AC 支持团队:Queenie Wang, Tony Wang, Jocelyn Lee 和 Eric Shih。


图片索引

共 459 张图片,存放于 SNUG_TPC_CCD_Dorso_Untitled_paper_1_images/ 目录。本文为 PPT 型论文,大部分内容在图片中。

第 1 页:标题页 第 2-3 页:议程 第 4-5 页:公司介绍和成就 第 6-8 页:设计挑战、ICC II 扁平化运行优势、CCD 流程优势 第 10-11 页:场景与运行时间总结、时序 QoR 表格 第 12 页:CCD vs Non-CCD 对比 第 14-21 页:CCD 原理和 ICC2 实现流程图 第 24-27 页:ICC2 与 PT 时序相关性数据和表格 第 28 页:相关性曲线图 第 29 页:PT ECO 结果 第 31-32 页:保持时间结果 第 34-36 页:结论、致谢