快速DFT开发的运行时间缩减

SNUG 2016 2016 17 页

快速DFT开发的运行时间缩减

会议: SNUG 2016 作者: Fabien Chiantia, Cédric Escallier (ST Microelectronics) 地点: 法国格勒诺布尔 (2016年6月28日) 页数: 17 源文件: SNUG_TPC_DFT_Dorso_Untitled_paper_3.pdf


Page 1

快速DFT开发的运行时间缩减

Fabien Chiantia / Cédric Escallier ST Microelectronics 2016年6月28日 法国格勒诺布尔

Page 2

引言

- 芯片越来越大 - 新功能 - 复杂度 - 上市时间 - 激进的进度安排 - DFT 可测试性设计影响可能很显著

TOP电路参数: - 约550万寄存器 - 1660个存储器 - 1个64位四核CPU - 超过10个并行接口 - 28FDSOI工艺

ATPG 自动测试向量生成分析和回归测试

Page 3

议程

- 更快的扫描插入步骤 - 更快的扫描插入验证 - 更快的ATPG分析和回归

Page 4

更快的扫描插入步骤

Page 5

更快的扫描插入步骤

- CPU运行时间对大型芯片来说非常长 - 特别是对于最终实现流程 - 为确保项目安全做出的决策 - 将顶层切分为多个部分 - 实现并行开发 - 寄存器数量被分割 - 降低CPU运行时间

分区方法: - 将硬核设计分为分区1-5 - 子分区进一步切分 - DRC提速6.5倍 - 扫描拼接提速3倍

Page 6

使用CTL的扫描插入——概念

- 使用模型进行插入流程 - CTL 核心测试语言 (Core Test Language) - 替代完整网表 Netlist并包含所有测试信息的模型 - 众多优势

Page 7

使用CTL的扫描插入——时间节省

- DRC 设计规则检查 - 检查所有寄存器是否被良好控制/观察 - 扫描拼接 Scan Stitching - 创建连接所有扫描寄存器的扫描链 Scan Chain

时间加速: - DRC提升3倍 - 扫描拼接提升42倍

Page 8

子分区

- 一些不成熟的IP可能在最终交付方面存在延迟 - 在基本方法中可能影响最终的扫描插入 - 使用共享I/O功能 → 创建子分区 - 全局扫描结构的灵活性 - 最终扫描生成时的IP交换

物理分区(共享I/O压缩): - 延迟调度的模块(使用经典扫描)+ 其他扫描逻辑 → 压缩器/解压缩器 → 扫描输入/输出

Page 9

更快的扫描验证步骤

Page 10

更快的扫描插入验证步骤——概述

- 在顶层进行验证 - 查看所有分区之间的所有交互(复位、测试控制、片上时钟控制器 OCC等) - DFT时钟树潜在问题 - 分区到分区的良好插入 - 潜在的级联OCC

OCC级联问题示意图: - 分区1的OCC → 分区2 → PLL - 分区1 → PLL → OCC1 → OCC2(分区2)

Page 11

更快的ATPG分析和回归步骤

Page 12

时钟DRC时间缩减

- 使用片上时钟控制器 OCC的DRC在TetraMAX中花费很长时间 - 约12小时运行时间(单处理器) - 一些检查仅针对测试机向量生成 - 可以降低DRC的精度以专注于"设计"质量

set_drc -nodisturb_clock_grouping
set_drc -suppress_group_clocks -clock -any
set_rule C41 warning

加速:5倍

Page 13

覆盖率估计

- 完全覆盖率估计非常耗时... - 减少故障字典可以大幅提升性能 - 覆盖率精度会降低,但是可预测的... - 完全覆盖率可以通过外推获得

ATPG运行测试覆盖率估计ATPG有效性经过运行时间
100%故障98.12%99.78%1,532,009秒
1%故障97.67%99.32%134,503秒
0.01%故障97.05%98.85%2,937秒

加速:512倍(5个CPU,从17天缩减到约48分钟)

Page 14

IDCard

- 使分析和回归更容易 - 将所有重要检查编译到一个文件中 - 基于TetraMAX报告: - DRC 设计规则检查 - 锁存锁存器 - 非扫描单元检查 - 片上时钟控制器 OCC报告 - 扫描链报告 - TCR TA约束检查 - 覆盖率检查 - 区分两次运行之间的差异

示例:IDCard

Page 15

结论

Page 16

结论

- 拥有良好的方法论可以大幅缩短开发时间 - 开发SoC 系统级芯片时不考虑这一方面是非常危险的

Page 17

谢谢!


图片索引

本文共65张图片,存放于 SNUG_TPC_DFT_Dorso_Untitled_paper_3_images/ 目录。

第2页:芯片规模参数概览 第5页:顶层切分为多个分区示意图 第6页:CTL模型概念图 第7页:DRC与扫描拼接时间对比 第8页:子分区与共享I/O压缩 第10页:OCC级联问题示意 第12页:时钟DRC缩减设置 第13页:覆盖率估计与运行时间对比 第14页:IDCard示例