基于Arm的数据中心SoC架构早期探索与优化
基于Arm的数据中心SoC架构早期探索与优化
会议: SNUG China 2022
作者: Qian Wang (Synopsys)
页数: 26 (PPT演示文稿)
源文件: SNUG_CN_Wang_Qian_Wang_Synopsys_CDC_2022_paper.pdf
概述 (Overview)
- 数据中心计算趋势和设计挑战 - 用于早期架构分析的虚拟原型 Virtual Prototyping - 案例研究:基于Arm Neoverse N2/CMN700设计的多Chase基准测试 - 总结
数据中心计算趋势
基于Arm的服务器由云服务提供商设计,具有工作负载特定优化、高核心数和高功耗特点: - 32-128+核心 - 80-350W TDP - 典型案例:AWS定制的64位Neoverse驱动的Graviton2/3 - 来自多家云服务提供商的基于Arm设计的更多案例即将出现
数据中心设计挑战
- 针对工作负载扩展SoC 系统级芯片架构 - 在扩展性能的同时平衡功耗 - 内存层次结构和互联拓扑优化 - 多芯片(multi-die)集成
用于早期架构分析的虚拟原型
虚拟原型 Virtual Prototyping使架构团队能够在RTL可用之前进行: - 系统级性能分析和瓶颈识别 - 工作负载特性分析 - 缓存和内存子系统优化 - 互联(CMN-700 互联)配置探索 - 功耗/性能权衡分析
使用Synopsys Platform Architect进行基于周期精确模型的SoC架构探索。
案例研究:Arm Neoverse N2 + CMN700多Chase基准测试
本案例研究展示了如何使用Platform Architect对基于Arm Neoverse N2处理器的数据中心SoC设计进行架构探索:
1. 系统配置:Neoverse N2核心 + CMN700网状互联 2. 工作负载:多Chase基准测试套件 3. 分析维度: - 缓存配置(L1/L2/L3大小和关联度) - 互联拓扑(网格大小、频率) - 内存控制器配置 - DDR带宽和延迟影响 4. 关键指标:吞吐量、延迟、功耗效率
架构探索的价值
- RTL开发前发现问题,避免后期昂贵的重新设计 - 缩短从架构定义到SoC 系统级芯片流片的时间 - 基于数据驱动的架构决策
总结
- 数据中心SoC设计复杂度持续增长,需要早期架构探索 - 虚拟原型 Virtual Prototyping通过Synopsys Platform Architect提供对Arm Neoverse N2/CMN700设计的准确架构分析 - 早期性能分析和瓶颈识别能够显著缩短产品上市时间 - 深度集成的Synopsys工具套件支持从架构到实现的完整设计流程
图片索引
本文为PPT演示文稿,共26页,196张图片,存放于_images/目录。主要图片按页分组:
第1-5页:封面、概述、数据中心趋势和设计挑战 第6-10页:虚拟原型概念和工具流程 第11-20页:案例研究——Arm Neoverse N2/CMN700设计和多Chase基准测试 第21-24页:结果分析和架构建议 第25-26页:总结