Design Compiler
工具概述
定位与起源
定位与起源:Design Compiler(DC)是Synopsys的逻辑综合工具——将RTL(Verilog/VHDL/SystemVerilog)转换为优化的门级网表。DC是数字IC设计中最核心的一环——RTL设计师和物理设计工程师通过DC的网表"握手"。DC在1986年由Synopsys创始人Aart de Geus博士开发——是EDA行业第一个成功的商业产品——直接定义了"RTL→门级自动综合"这个品类。
DC的核心价值:优秀的RTL+优秀的约束→DC生成优秀的门级网表→物理设计只需局部优化。而差的约束或差的设计→DC生成的网表物理设计很难补救。DC综合的质量直接决定芯片PPA的天花板。
核心技术
两阶段综合:elaboration(编译RTL为GTECH——Synopsys的通用逻辑表示)→optimization(将GTECH映射到具体标准单元库——同时优化时序/面积/功耗)。optimization在约束指导下做多目标优化。
拓扑综合(Topographical):DC Ultra在综合时读入floorplan信息——预估线延迟——避免产生物理不可行的逻辑结构。拓扑综合将placement后的WNS恶化从-80ps降到-20ps。
功耗感知综合:自动插入clock gating——分析RTL的使能逻辑——识别"这组寄存器的值何时不需要更新"——自动插入门控。Multi-Vt分配——关键路径用LVT(快但漏电)——非关键路径用HVT(慢但省电)。
DFT Compiler共享引擎:DC和DFT Compiler共享综合引擎——可以在综合的同时插入扫描链——不需要单独的DFT综合步骤。
主要功能
* RTL→门级综合:DC读入RTL+SDC约束+标准单元库→生成门级网表。支持Verilog/VHDL/SystemVerilog混合输入。 * 约束驱动优化:DC在约束指导下优化——时钟周期→setup优化。输入/输出延迟→IO时序优化。面积约束→area优化。约束质量=综合质量。 * 时序/面积/功耗多目标:DC同时优化三个目标——权重由约束配置决定。高effort做更多优化iteration——更好的QoR——但更长runtime。 * 等价性检查集成:DC输出网表后自动调用Formality做等价性检查——确保综合没有改变功能。
实战案例
- 某DSP的综合约束翻车:时钟周期约束1.2ns太紧→DC狂插大驱动buffer→面积+30%→物理设计后WNS才-5ps(约束太紧白费了)。松约束到1.5ns→面积正常→物理设计轻松收敛。 - 拓扑综合节省2周:传统DC产生网表→物理设计WNS=-80ps→ECO 2周。改用DC Ultra拓扑综合→WNS=-20ps→ECO 2天。 - Multi-Vt省了20%漏电:DC自动分配HVT/LVT——关键路径用LVT(10%)——非关键用HVT(90%)——总漏电降20%——时序无恶化。
常见误区
误区一:DC=Verilog编译器。 DC不是编译器——是优化引擎。编译器只是翻译——DC做的是在标准单元库中搜索最优的logic structure——这是AI/搜索问题——不是编译问题。
误区二:DC的默认配置最优。 默认配置是"安全"的——不是最优的。调整effort level、优化策略、约束精确性——可以将QoR提升15-30%。
误区三:DC综合面积=芯片面积。 DC面积是cell总面积——不包括物理实现的空白区域、电源网格、IO pad。芯片实际面积通常是DC面积的1.3-1.6倍。
版本演进
- 1986:DC诞生:Aart de Geus开发了SOCRATES——后改名Design Compiler。定义了"RTL综合"品类。 - 1990s:DC成为标准:DC被几乎所有IC设计公司采用。成为Synopsys的旗舰产品。 - 2000s:拓扑综合(DC Ultra):综合时考虑物理信息。功耗感知综合加入clock gating和Multi-Vt。 - 2010s–2020s:Fusion Compiler时代:DC引擎融入Fusion Compiler——综合和物理设计融合——DC作为独立产品持续发展但重心移向FC。
相关论文
- DC Graphical百万门设计:Jung经验 - 百万门设计构建:DC Graphical实战经验 - 百万门设计:DC Topographical最佳实践 - 百万门设计:DC Graphical优化策略 - 用户开发UPF低功耗流程的经验 - 百万门设计构建:Boston案例研究 - DC Graphical:承诺与现实 - 使用可综合 SystemVerilog 构造构建多态模块 - 使用UPF的低功耗实现流程 - 高级IC设计流程优化与自动化策略 - 使用SNPS DesignWare组件和Galaxy Test进行先进DFT实现 - 使用片上PLL优化跳变故障测试向量生成及其对压缩技术的影响 - 定制片上时钟控制器与扫描压缩插入的全层次化At-Speed测试流程 - DFTCMax模块化实现:确保低面积开销与高测试质量 - 以可承受的 TAT 完成超大型 65nm ASIC 设计的流片 - 寄存器克隆加速设计收敛 - 使用IC Compiler进行45nm高性能处理器设计 - Intel多电压设计早期验证方法 - 使用IC Compiler设计45nm高性能处理器 - 先进设计方法论 - 层次化设计流程中的布局规划与版图优化:案例研究 - 纳米级设计中的时序与功耗协同优化方法 - 状态保持设计:策略与案例研究 - 同步设计方法论 - 综合与布局相关性:DC-Topography是解决综合布局失配的圣杯吗? - 经济高效的金属掩膜ECO流程 - DFT MAX扫描压缩流程实践经验 - 百万门设计:台湾SNUG经验 - UMC-Synopsys 65nm低功耗UPF参考设计流程 - 低功耗IP与UPF:高性能低功耗CPU设计的使能技术 - 构建百万门级设计方法论 - 双模GPS接收器的实现方法论 - 相信我,我是Design Compiler:综合行为与变化的Slack - 电源门控设计——UPF能为你做什么,以及不能做什么 - 打破层次规则:面向 5 百万触发器设计的高级层次化 DFT 策略 - 使用IC Compiler进行复杂SoC的层次化设计实现 - 使用更多生成时钟来简化约束 - 与设计同步的DFT:层次化扫描压缩 - 漏电功耗优化:一种改进的综合方法学 - 降低高性能可综合处理器核心功耗的自动化设计流程 - 使用Design Compiler Graphical进行拥塞预测与缓解 - 使用 UPF/CPF 的低功耗设计流程 - Synopsys实现工具的高效统一降额方法 - UPF 2.0:期望与经验 - 层次化设计实现策略的最佳实践 - 先进Fusion Compiler综合与布局布线技术驱动性能与周转时间提升 - 利用RTL Architect构建更优IP——Arteris NoC IP物理探索 - 重定时流水线多种低功耗方法的优异权衡 - 一种可以自动完善物理约束的快速综合设计方法 - 7nm设计的性能、功耗和面积优化技巧 - 面向布局布线的 RTL 改进 - 玄铁RISC-V CPU的Synopsys设计流程与性能优化 - 级联浮点DesignWare IP的高精度设计与实现技术 - 先进Fusion Compiler综合与布局布线技术推动性能和周转时间 - 多比特寄存器组优化技术 - 利用多位寄存器合并技术提升芯片设计功耗效率 - 全面的 CTS 与物理感知多位寄存器综合方法学 - 比特币低功耗流程与方法学 — 实现篇:一个'完全酷'的案例研究 - Socionext UPF设计流程的演进——Socionext与Synopsys的成功合作 - 使用UPF进行低功耗设计的原则 - 比特币低功耗流程与方法学——实现篇:‘完全酷’案例研究 - 使用BAM和ETM混合方法的SoC层次化实现框架 - 约束开发与时序收敛:使用SDC约束的最佳实践 - 一种加速设计收敛的有效时序约束方法学 - 加速复杂IP在SoC设计中的快速集成 - 一种有效的时序约束方法学加速设计收敛 - 编写高效时序约束并加速时序收敛 - RTL 可测试性与设计分析:SpyGlass DFT ADV - SpyGlass DFT ADV早期可测试性分析:满足汽车电子严苛的可测试性要求 - Synopsys 汽车测试解决方案:ISO 26262 认证 - 基于DFTMAX-Ultra实现low-pin、low-cost、low-power DFT设计 - DFTMAX Ultra:面向小型数字混合信号器件 - 使用Synopsys测试自动化工具降低DPPM并测试安全关键电路 - RTL DFT 违规与覆盖率分析方法学 - 基于DFTMAX-Ultra实现低引脚数、低成本、低功耗DFT设计 - 使用LogicBIST与用户定义OCC实现固定型和跳变故障测试 - 快速DFT开发的运行时间缩减 - ARM Cortex-A72处理器在16FF+工艺中的高性能高能效实现 - 在 GF 22FDX 上使用 Synopsys 设计平台实现 ARM Cortex-A53 四核 - 16nm节点复杂全芯片低功耗实现案例研究 - IC Compiler II中降低功耗的几种方法 - 面向布局布线的RTL改进 - POCV:从综合、实现到签核的全流程OCV解决方案 - 面向功耗受限 SoC 的 2.1GHz ARM Cortex-A55 实现流程 - 2.1GHz ARM Cortex-A55 实现流程:面向功耗受限的存储 SoC - 多位寄存器组化的实现流程 - 使用 Synopsys Galaxy 设计平台在 16FF+ 工艺中实现 ARM Cortex-A72 处理器的高性能节能实现 - 下一代RTL综合:未来十年的RTL综合