PrimeTime

工具概述

定位与起源

定位与起源:PrimeTime是Synopsys的业界标准静态时序分析(STA)工具——全芯片时序signoff的黄金标准。PrimeTime读入门级网表和标准延迟格式(SDF/SPEF),不依赖仿真向量——穷举分析所有时序路径的setup/hold——覆盖率100%。

PrimeTime由Synopsys于1995年发布,由时序分析领域的先驱(如Sachin Sapatnekar教授等)奠定算法基础。近30年来,PrimeTime从单corner STA演进为多corner MCMM→OCV/AOCV→POCV统计时序→IR-aware时序→AI加速——始终是STA领域的事实标准。

核心技术

基于路径的穷举分析:PrimeTime用PBA(Path-Based Analysis)对每条时序路径从发射FF到捕获FF做完整延迟计算。PBA比GBA(Graph-Based Analysis)精确——因为PBA考虑了路径上每个门的实际slew和负载——而GBA用最坏值近似。代价:PBA比GBA慢10-100倍——仅在signoff阶段开PBA。

MCMM(多角多模)并发分析:PrimeTime可以在一次run中分析所有PVT corner×所有工作模式。DMSA(Distributed Multi-Scenario Analysis)将MCMM分发到多台机器并行分析。

OCV/AOCV/POCV递进建模:固定OCV derating→AOCV(距离感知降额)→POCV(参数化统计降额)。POCV不再用固定derating——每个cell的延迟是一个高斯分布——STA计算的是slack的统计分布。

IR-Aware STA:读入RedHawk分析的IR Drop热力图→将局部电压降转换为局部延迟增加→在STA中精确建模IR Drop对时序的影响。3nm下IR Drop引起的延迟变化不可忽略。

主要功能

* Signoff STA:全corner PBA——最精确但最慢。只在tape-out前跑全signoff。设计迭代期间用GBA。 * ECO指导:PrimeTime输出violation报告→物理设计工具根据PTSI(PrimeTime SI)指导做ECO——插buffer/调驱动/修hold。 * what-if分析:在ECO前用PrimeTime快速评估不同修复方案的时序影响——选最优方案再实际执行ECO。 * 时序模型提取(ETM):从模块级STA结果提取接口时序模型(ILM)——给顶层STA使用——不需读入子模块全网表。

实战案例

- 某5nm手机AP的POCV signoff:初始AOCV signoff显示WNS=-50ps——但实际上AOCV过于悲观。改用POCV——WNS=+5ps——省了面积和schedule。 - DMSA把signoff从3天缩到6小时:某AI芯片的MCMM有50+个corner——单机跑STA要3天。DMSA在10台机器上并行→6小时完成。 - IR-Aware STA纠正了乐观signoff:某芯片在传统STA下signoff pass——但IR-Aware STA显示最热区域的WNS恶化到-30ps。修了电源网格后pass。硅片回来时序完全吻合IR-Aware STA预测。

常见误区

误区一:PrimeTime=跑一次就signoff。 STA需要在每个设计阶段都跑——综合后、placement后、CTS后、布线后、ECO后——每次的结果指导下一阶段的优化方向。

误区二:PrimeTime signoff pass=硅片一定pass。 STA用统计模型——模型和硅片之间有gap。Signoff需要叠加额外的guardband(如+5%延迟margin)——并和硅片实测数据持续correlate。

误区三:PrimeTime WNS/TNS可以完全相信。 WNS/TNS的准确性取决于SDC约束的正确性。如果时钟未正确设定——WNS/TNS数字全无意义。Signoff前必审计约束。

版本演进

- 1995:PrimeTime 1.0:业界第一个商用STA工具。单corner。基于GBA。 - 2000s:SI(信号完整性):加入crosstalk分析。MCMM支持多corner。 - 2010s:POCV+DMSA:统计时序替代固定derating。分布式分析加速MCMM。 - 2020s:IR-Aware+AI加速:IR Drop和STA融合分析。AI辅助ECO指导。HyperScale技术将STA扩展到数十亿门。

相关论文

- 电压感知静态时序分析实现精确时序收敛 - 小延迟缺陷 ATPG 的用户实践经验 - 复杂 SoC 上的小延迟缺陷实验 - 使用PrimeTime先进片上变异建模(AOCVM)减少全局降额的悲观性 - 以可承受的 TAT 完成超大型 65nm ASIC 设计的流片 - 使用Galaxy平台层次化实现Cortex-A9 MPCore多核处理器 - 应对全芯片功耗感知功能验证的挑战——基于MVSIM的解决方案 - 使用IC Compiler进行45nm高性能处理器设计 - 使用基于时序余量的动态桥接故障模型检测高阻桥接缺陷 - 使用IC Compiler设计45nm高性能处理器 - 使用IC Compiler收敛最后几皮秒:65nm案例研究 - 小延迟缺陷测试技术 - CCS与NLDM时序特征化及与Liberty-NCX的相关性验证 - 纳米级设计中的时序与功耗协同优化方法 - 状态保持设计:策略与案例研究 - 同步设计方法论 - 结构化方法:利用相对布局与时钟网格优化ARM Cortex-A8 NEON单元的延迟、功耗与变异——基于90纳米工艺的案例研究 - 实现SOC高测试覆盖率的策略 - 45nm CCS与NLDM时序模型比较 - 基于经验分析的跨电压PV收敛方法 - 经济高效的金属掩膜ECO流程 - 多时钟域跳变延迟故障ATPG测试:一种创新方法 - 使用经验分析的跨电压 PV 收敛 - DFT MAX扫描压缩流程实践经验 - UMC-Synopsys 65nm低功耗UPF参考设计流程 - DC Graphical:承诺与现实 - 使用PrimeTime分布式多场景分析缓解签核时序和SI收敛难题 - 双模GPS接收器的实现方法论 - SBPF性能与精度评估 - 使用 PrimeTime 分布式多场景分析进行 ECO 保持时间修复 - 高级时序分析技术:多模式多Corner下的时序优化策略 - CCS 复合电流源模型:面向精确设计签核 - 使用更多生成时钟来简化约束 - 使用PrimeTime实现一致的时序约束 - 与设计同步的DFT:层次化扫描压缩 - 电源门控设计 —— UPF 能为你做什么,以及不能做什么! - 复杂SoC使用IC Compiler的层次化设计实现 - 使用PrimeTime进行快速时序ECO经验分享 - Synopsys实现工具的高效统一降额方法 - 定制设计中的 STA:为什么仿真不够 - 跨时钟域的全方位解决方案 - 层次化设计实现策略的最佳实践 - 未来签核之路:使用层次化STA - 时钟网络仿真——早期偏斜与延迟收敛 - 低功耗设计方法论 - 先进Fusion Compiler综合与布局布线技术驱动性能与周转时间提升 - 应用SiliconSmart进行AOCV特性描述 - AOCV在时序分析及收敛中的高效使用方法研究——基于Synopsys EDA工具 - 改善ICC2与PrimeTime时序相关性的应用笔记 - 一种基于PT HyperScale适用于大规模设计的混合静态时序分析方法 - PrimeTime 签核领导力 —— 5nm 节点使能与 QoR 最大化 - 使用PrimeTime SimLink提高时序签核精度 - RTL Architect如何提升效率以实现最优PPA - Synopsys签核产品更新:更新,更快,更强,签核产品领航者 - 利用HyperScale技术实现层次化静态时序分析 - 炫铁RISC-V CPU IP参考流程:使用Fusion Compiler最大化每瓦性能 - 利用StarRC先进技术实现更快的周转时间:GPD金色寄生数据库与StarReduce - 面向先进工艺的签核创新:方寸之间的精确 - PrimePower -- 先进技术节点的晶圆厂合作与认证 - 级联浮点DesignWare IP的高精度设计与实现技术 - 无需RTL代码的Siloti (Verdi) 功耗分析加速方案 - 使用 SiliconSmart 的延迟灵敏度排序方法 - 顺序波形合并方案:最小化签核工作量 - 汽车 SoC 中多核处理器的电源完整性验证 - 先进Fusion Compiler综合与布局布线技术推动性能和周转时间 - 使用 IC Compiler II CCD 流程在 8M 实例扁平化设计中更快实现时序收敛/SNUG_TPC_CCD_Dorso_Untitled_paper_1.md) - 并发时钟与数据优化(CCD)技术亮点与瑞萨成功经验分享/SNUG_TPC_CCD_Gobok_2018_Synopsys_Inc_paper.md) - 高速内核实现的布局布线流程定制化/SNUG_TPC_CCD_高速内核实现的布局布线流程定制化.md) - 使用IC Compiler II加速设计收敛:拥塞驱动重构、并发时钟数据优化和多源时钟树综合/使用ICCII加速设计收敛_CDR_CCD_MSCTS.md) - Cortex-A55低功耗实现最佳实践——使用PrimeTime优化 - 复杂SoC的低功耗静态签核 - 不同设计的动态功耗优化策略 - 自动化拓扑时钟引脚约束生成流程 - 使用块抽象和时序提取模型进行复杂百万门级SOC的分层实现 - 统一约束实践:跨时钟域CDC与静态时序分析STA - 约束开发与时序收敛:使用SDC约束的最佳实践 - 合并模态时序约束以减少时序收敛迭代 - 一种加速设计收敛的有效时序约束方法学 - 使用PrimeTime自动化分析时钟约束质量 - 自底向上的时序约束集成方法 - 实现复杂IP在SoC设计中的快速集成 - 接口时序约束的数学原理 - 编写高效时序约束并利用PrimeTime加速时序收敛 - 一种有效的时序约束方法学加速设计收敛 - 源同步DDR接口时序约束:从零开始 - 编写高效时序约束并加速时序收敛 - 早期数字设计失效率估算工具链与工作负载老化时序分析 - Synopsys 汽车测试解决方案:ISO 26262 认证 - 在高度受限环境中同时使用DFTMAX与异步和同步片上时钟控制器(OCC)的用户经验 - 使用Synopsys测试自动化工具降低DPPM并测试安全关键电路 - 使用 IC Compiler II 以扁平化流程实现百万门级 GPU 模块 - IC Compiler II加速大规模电路物理实现收敛 - ARM Cortex-A72处理器在16FF+工艺中的高性能高能效实现 - 在 GF 22FDX 上使用 Synopsys 设计平台实现 ARM Cortex-A53 四核 - ICC2时序预算在大型层次化设计中的应用 - 利用有用偏斜增强技术加速IC Compiler II时序收敛 - 收敛时序预算:使用IC Compiler II改善时序预算的方法 - 使用 IC Compiler II 的有用偏斜增强实现时序收敛 - 2.1GHz ARM Cortex-A55功耗约束存储SoC的实现流程 - AOCV分析中Launch与Capture距离的区别 - 面向功耗受限 SoC 的 2.1GHz ARM Cortex-A55 实现流程 - 2.1GHz ARM Cortex-A55 实现流程:面向功耗受限的存储 SoC - 使用PrimeTime优化的Arm Cortex-A55 CPU低功耗实现最佳实践 - 使用 Fusion Compiler 实现 ARM 核处理器最优 PPA 的最佳实践 - 使用 Synopsys Galaxy 设计平台在 16FF+ 工艺中实现 ARM Cortex-A72 处理器的高性能节能实现 - 28nm Cortex-A7核心的时钟树实现策略