加速SoC数据融合技术:高性能传感器、语音和音频处理

SNUG China 2018 2018 24 页

加速SoC数据融合技术:高性能传感器、语音和音频处理

会议: SNUG China 2018 作者: Rick Wang (rick.wang@synopsys.com), AE Manager 页数: 24 源文件: SNUG_CN_Dorso_Untitled_paper_2.pdf


Page 1

SNUG 2018

加速SoC数据融合技术 高性能传感器、语音和音频处理

Rick Wang (rick.wang@synopsys.com) AE Manager 2018年6月 SNUG China


Page 2

SNUG 2018

语音识别应用爆发式增长

基于自然语音的人机界面(HMI)快速普及

年复合增长率 31%

图:语音识别应用增长

Page 3

SNUG 2018

"Always-on"应用示例

MEMS麦克风 — 出货量年复合增长率13%(2015-2019)

图:Always-on应用

Page 4

SNUG 2018

IoT "Always-on"应用示例

- 移动和IoT设计正在向传感器集线器架构(片上)迁移 - 更高性能的接口对于新型传感器是必需的 - I3C标准由MIPI(移动标准)推动

移动传感器 — 出货量年复合增长率 >20%(2016-2019)


Page 5

SNUG 2018

可穿戴传感器趋势

"可穿戴传感器市场到2026年将达到61亿美元" 来源:IDTechEx研究报告 - "Wearable Sensors 2016-2026: Market Forecasts, Technologies, Players"


Page 6

SNUG 2018

IoT:巨大的机遇与挑战...

数十亿边缘设备

无线、电源管理、存储器、传感器、处理器等... 功能类型、连接性和能源使用决定成本 电池寿命期望延长,同时增加连接性 2017年需要担心的新黑客攻击:智能家居和互联汽车


Page 7

SNUG 2018

典型IoT设备及其功能

语音/讲话/传感器融合发挥关键作用

- 外设、I/O和安全性的嵌入式控制 - 低功耗和电源管理 - 低端音频DSP - 语音控制DSP - 无线连接 - 控制功能 - 9D传感器融合DSP和浮点 - 语音通信DSP

图:典型IoT设备功能框图

Page 8

SNUG 2018

"Always-on" IoT

应用: - IoT可穿戴设备、智能能源集线器 - 健康/健身设备 - 无线音频(蓝牙智能)

常见系统组件: - RTOS或裸机系统 - AA/纽扣电池、锂电池 - 蓝牙、802.15.4、Zigbee、Wi-Fi

独特技术和IP需求: - 嵌入式NVM (Flash/MTP) - 连接性、传感器和安全性... - 90nm向65nm、55nm或40nm迁移

共同特征:

数据融合IP子系统包含:ARC EMxD处理器、ADC、I2C、SPI、UART、定时器、ROM、GPIO、SRAM、硬件加速器、NVM(eFlash/MTP),以及USB 2.0 Host OTG带充电检测、安全模块、无线电(WiFi、蓝牙智能、802.15.4)

图:Always-on IoT系统框图

Page 9

SNUG 2018

基于ARC的子系统:利用可配置性和可扩展性

- 能耗降低10倍* - 周期数减少90%* - 逻辑面积减少40-60%*

*代表90nm工艺下的传感器融合应用

典型32位处理器"基于总线"的嵌入式系统 vs ARC + APEX集成的"无总线"嵌入式系统

图:ARC子系统对比

Page 10

SNUG 2018

ARC数据融合IP子系统:完整的硬件和软件解决方案

- 集成、预验证的Always-on应用子系统 - 减少面积和功耗:紧密耦合的存储器和外设(I2C、SPI、UART、GPIO、ADC接口) - 提高性能:EM DSP处理器提供高效的RISC和DSP性能 - 增强安全性:CryptoPack选项加速软件加密算法 - 扩展应用范围:新选项扩展支持AI语音和高性能传感器

为IoT显著节省上市时间和能源

子系统框图包含:ARC EM5/7/9/11D处理器、APEX加速器、快速数学加速器、软件库、D-Cache、I-Cache、SP/DP FPU、XY存储器、嵌入式ROM/SRAM、外设接口(I2C、UART、SPI、GPIO、ADC I/F)、定时器、中断控制器、调试接口、主机接口、DMA端口等。可授权选项包括:AHB Master/Slave、CryptoPack (AES/SHA/3DES)、mDMA、DSP Package (ARCv2DSP ISA)、设备驱动、DSP库、音频处理库、I2S、PDM、Voice/Speech选项等。

图:ARC数据融合IP子系统

Page 11

SNUG 2018

ARC EM DSP处理器

- ARCv2DSP ISA新增超过150条面向DSP的指令:向量/SIMD、矩阵、饱和、复数 - 针对超低功耗控制和DSP优化的内核: - 高能效3级RISC流水线 - 统一单周期32x32 MUL/MAC单元 - 高能效信号处理:语音/讲话、音频和传感器数据 - XY存储器提高DSP性能 - 可授权选项:FPU、MPU、RTT(实时跟踪)、microDMA、CryptoPack(加密软件加速)、ARConnect(多核) - 丰富的DSP软件库和C/C++编译器,软件开发简便

为Always-On IoT应用进行功耗-性能优化 融合高效控制与超低功耗DSP

处理器系列: - EM5D:最高2MB I&D CCM、DSP - EM7D:最高2MB I&D CCM、I&D Cache(最高32K)、DSP - EM9D:最高2MB I&D CCM、DSP、XY存储器 - EM11D:最高2MB I&D CCM、I&D Cache(最高32K)、DSP、XY存储器

架构特性:3级流水线、cJTAG/JTAG调试、实时跟踪、浮点单元、ARC处理器扩展(APEX)、指令CCM、指令Cache、数据Cache、数据CCM、32x32乘法器/MUL-MAC、XY存储器、Memory Protection Unit、中断控制器、NVM接口、uDMA、CryptoPack、增强安全/安全包

图:ARC EM DSP处理器架构

Page 12

SNUG 2018

EM9D将MAC/周期数提高3倍

DSP密集型应用的总能量显著改善

能量对比图(EM5D vs EM9D vs 处理器A在不同RISC/DSP比例下的表现): - 语音检测基准测试 - MP3解码基准测试

图:EM9D性能对比

Page 13

SNUG 2018

9D传感器融合基准测试

100Hz传感器融合频率需求对比(固定点 vs 浮点(CPU+FPU))

- EM5D vs 处理器A

Hillcrest MotionEngine在数据融合子系统(EM5D)上运行

- 传感器无关融合实现增加供应链灵活性,降低集成复杂性 - 自动磁校准动态消除硬铁和软铁效应,无需用户校准 - 无陀螺漂移:实时自动陀螺稳定消除陀螺漂移 - 最低延迟:系统优化实现最小延迟和响应感,具有可配置采样率

图:传感器融合基准测试

Page 14

SNUG 2018

语音激活基准测试

Sensory TrulyHandsfree在数据融合子系统(EM5D)上运行

工作流程:检测 -> 识别 -> 唤醒

基于ARC EM5D的数据融合子系统(TSMC 28nm HPM工艺):

模式频率需求功耗
检测模式(Sensory LPSD功能,16kHz麦克风输入)0.26 MHz0.9 uW*
识别模式(100%全周期识别,16kHz麦克风输入)7.6 MHz40 uW*

* 逻辑动态功耗,带后版图RC的门级仿真

功耗节省 > 20倍(检测模式 vs 识别模式)

图:语音激活基准测试

Page 15

SNUG 2018

音频处理软件库:数据融合子系统语音/讲话选项

- 带平滑的增益 - 混音器 - 自动增益控制(AGC) - 软限幅器 - DC去除滤波器 - 位宽转换器 - 均衡器 - FIFO - 上/下混音器 - 采样率转换器 - 通道路由器 - 单声道 <-> 立体声转换器

音频处理库补充ARCv2DSP库

图:音频处理软件库功能

Page 16

SNUG 2018

音频处理软件库基准测试

EM5D vs EM9D性能对比图

图:音频处理基准测试

Page 17

SNUG 2018

PDM麦克风用例:基于语音的人机界面

远场语音处理: - 检测 - 隔离 - 跟踪 - 识别

每增加一个麦克风提高隔离质量 所有麦克风应采样精确同步

图:PDM麦克风阵列

Page 18

SNUG 2018

为什么选择I3C?

I3C解决多传感器集成挑战: - I3C利用I2C和SPI两者的优势 - I2C的简单2线接口 - SPI的低功耗和速度 - I3C保持对传统I2C传感器的支持 - 额外功能:带内中断/命令支持、动态寻址、高级电源管理、更高数据速率 - 对比:12-18个SPI/I2C引脚(10+个传感器)vs 多个边带信号(中断、片选、电源管理等)

图:I3C与众总线对比

Page 19

SNUG 2018

典型I3C实现

图像传感器连接:图像传感器可以利用I3C更高性能的能力来通信控制信息并传输图像数据(替代I2C相机控制接口)

传感器集线器/级联传感器集线器:多个传感器设备根据其能力连接到I3C总线,可在不同模式和运行速度下操作。第二主设备(除主主设备外)连接到多个传感器,充当I3C集线器。

数据融合IP子系统(带集成I3C选项)

图:I3C实现方案

Page 20

SNUG 2018

CryptoPack

硬件扩展加速加密软件算法

支持加密算法:AES、3DES、ECC、SHA-256、RSA 提供面积优化和性能优化版本以适应系统目标

面积优化版:纯组合逻辑(无内核或辅助寄存器)、单周期、双操作数、面积小(<5%内核面积)但对性能影响较小

性能优化版:用于存储内部状态的额外寄存器、多周期、增加参数数量、高计算能力但更多门(<20%内核面积)


Page 21

SNUG 2018

可扩展的加密解决方案

决策因素非常因应用而异: - 性能需求:吞吐量、延迟 - 功耗(能耗):加密操作使用频率?特定应用是什么? - 面积预算:专用硬件引擎需要更多硅面积,但提供更高性能和能效

与Synopsys FAE讨论您的需求以选择最佳解决方案

常见哈希算法的相对性能:CryptoPack SHA-256增加ARC硅面积5%但性能提高7倍

图:加密方案对比

Page 22

SNUG 2018

ARC应对关键IoT挑战

挑战特性需求ARC实现
低功耗(电池运行要求最低功耗)最佳性能效率(DMIPS/mW),用户定义指令减少周期数和能耗同类最佳的性能效率
系统成本(空间受限应用需要紧凑面积、小代码尺寸)高度可配置性——不浪费门,优化工具链实现最大代码密度可配置性
集成(片上集成传感器控制、处理和通信)支持紧耦合存储器、外设和加速器实现"无总线"系统设计,预集成IP子系统紧耦合集成
安全性(敏感数据必须保护免受设备内和设备间攻击)SecureShield技术实现可信执行环境,CryptoPack为关键算法提供加密加速安全技术

Page 23

SNUG 2018

谢谢!


Page 24

SNUG 2018

问答环节


图片索引

本文共 398 张图片,为PPT型论文,存放于 _images/ 目录。

关键图表按页面分布: - 第1页:标题页 - 第2页:语音识别应用增长 - 第3页:Always-on应用示例(MEMS麦克风) - 第4页:IoT Always-on应用(移动传感器) - 第5页:可穿戴传感器趋势 - 第6页:IoT机遇与挑战 - 第7页:典型IoT设备功能框图 - 第8页:Always-on IoT系统框图 - 第9页:ARC子系统对比(总线 vs 无总线) - 第10页:ARC数据融合IP子系统详细架构 - 第11页:ARC EM DSP处理器架构 - 第12页:EM9D性能基准测试 - 第13页:9D传感器融合基准测试 - 第14页:语音激活基准测试 - 第15页:音频处理软件库 - 第16页:音频处理基准测试 - 第17页:PDM麦克风用例 - 第18页:I3C总线解决方案 - 第19页:典型I3C实现方案 - 第20页:CryptoPack加密扩展 - 第21页:可扩展加密解决方案对比 - 第22页:ARC应对IoT挑战总结 - 第23-24页:致谢和问答