基于Arm的数据中心SoC架构早期探索与优化

SNUG China 2022 2022 26 页

基于Arm的数据中心SoC架构早期探索与优化

会议: SNUG China 2022 作者: Qian Wang (Synopsys) 页数: 26 (PPT演示文稿) 源文件: SNUG_CN_Wang_Qian_Wang_Synopsys_CDC_2022_paper.pdf


概述 (Overview)

- 数据中心计算趋势和设计挑战 - 用于早期架构分析的虚拟原型 Virtual Prototyping - 案例研究:基于Arm Neoverse N2/CMN700设计的多Chase基准测试 - 总结


数据中心计算趋势

基于Arm的服务器由云服务提供商设计,具有工作负载特定优化、高核心数和高功耗特点: - 32-128+核心 - 80-350W TDP - 典型案例:AWS定制的64位Neoverse驱动的Graviton2/3 - 来自多家云服务提供商的基于Arm设计的更多案例即将出现

数据中心设计挑战

- 针对工作负载扩展SoC 系统级芯片架构 - 在扩展性能的同时平衡功耗 - 内存层次结构和互联拓扑优化 - 多芯片(multi-die)集成


用于早期架构分析的虚拟原型

虚拟原型 Virtual Prototyping使架构团队能够在RTL可用之前进行: - 系统级性能分析和瓶颈识别 - 工作负载特性分析 - 缓存和内存子系统优化 - 互联(CMN-700 互联)配置探索 - 功耗/性能权衡分析

使用Synopsys Platform Architect进行基于周期精确模型的SoC架构探索。


案例研究:Arm Neoverse N2 + CMN700多Chase基准测试

本案例研究展示了如何使用Platform Architect对基于Arm Neoverse N2处理器的数据中心SoC设计进行架构探索:

1. 系统配置:Neoverse N2核心 + CMN700网状互联 2. 工作负载:多Chase基准测试套件 3. 分析维度: - 缓存配置(L1/L2/L3大小和关联度) - 互联拓扑(网格大小、频率) - 内存控制器配置 - DDR带宽和延迟影响 4. 关键指标:吞吐量、延迟、功耗效率

架构探索的价值

- RTL开发前发现问题,避免后期昂贵的重新设计 - 缩短从架构定义到SoC 系统级芯片流片的时间 - 基于数据驱动的架构决策


总结

- 数据中心SoC设计复杂度持续增长,需要早期架构探索 - 虚拟原型 Virtual Prototyping通过Synopsys Platform Architect提供对Arm Neoverse N2/CMN700设计的准确架构分析 - 早期性能分析和瓶颈识别能够显著缩短产品上市时间 - 深度集成的Synopsys工具套件支持从架构到实现的完整设计流程


图片索引

本文为PPT演示文稿,共26页,196张图片,存放于_images/目录。主要图片按页分组:

第1-5页:封面、概述、数据中心趋势和设计挑战 第6-10页:虚拟原型概念和工具流程 第11-20页:案例研究——Arm Neoverse N2/CMN700设计和多Chase基准测试 第21-24页:结果分析和架构建议 第25-26页:总结