周易aipu - file.elecfans.com

15
© 2018 Arm China 周易AIPU 赋能边缘AI 设备 杨磊 Alvin Yang AI 产品经理 深圳

Upload: others

Post on 12-Nov-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 周易AIPU - file.elecfans.com

© 2018 Arm China

周易AIPU赋能边缘AI设备

杨磊 Alvin Yang

AI 产品经理

深圳

Page 2: 周易AIPU - file.elecfans.com

2 © 2018 Arm China

Training in Cloud

X86+FPGA

Inference in DeviceTraining in Device

Inference in Cloud

TPUARM+GPU X86+AccARM+

GPU+Acc

Less need so far

TPU2

DSP

xPU

GPU

ARM

AI芯片基础技术的格局

Page 3: 周易AIPU - file.elecfans.com

3 © 2018 Arm China

人工智能向端侧迁移

算力 生态功耗 成本 安全

ISP/GPU/DPU

Page 4: 周易AIPU - file.elecfans.com

4 © 2018 Arm China

丰富的端侧AI 场景

Mobile

IOT

Surveillance

Home

Automotive

Robotics

Drones

VR/MR

Page 5: 周易AIPU - file.elecfans.com

5 © 2018 Arm China

芯片 产品

• Vision • Speech• Different Popular open

algorithms• SSD/Resnet/Segnet…

• CNN/RNN/LSTM…

• In-house and new algorithms• Customize layer

• High utilization to support all pre-define layer/OP

丰富的AI应用需要优秀的可编程性

可编程性

Page 6: 周易AIPU - file.elecfans.com

6 © 2018 Arm China

• 更高的性能, 从几百GOPS 到 几 TOPS

• Human/Obj detection. Face recognition.

• Tracking, behavior analysis….

• Speech Recognition

• 720P -> 1080p -> 4K 分辨率

• 功耗受限o 边缘设备SOC的功耗通常几 W

o 留给AI 运算部分 实际只有几百mW ,1,2 W左右

边缘AI需要更高的算力,更好的能效

要干的活很多

给的工钱尽可能少

需要新的技术来实现AI功能

Page 7: 周易AIPU - file.elecfans.com

7 © 2018 Arm China

周易人工智能平台

Page 8: 周易AIPU - file.elecfans.com

8 © 2018 Arm China

• 为人工智能设计的专用指令集

• 高性能 , 灵活可配置o 单核 : 0.5 / 1 / 2 / 4 TOPSo 支持多核

• 全栈解决方案o 硬件IPo 软件SDKo NBB

• 支持安全扩展

周易人工智能处理器 Zhouyi AIPU

Crypto Engine

AI Fix Function

Local Mem System

Zhouyi AIPU

Tensor Exe. Cell

Scalar Unit

Tensor Exe. CellTensor Exe.

CellTensor Exe. Cell

Page 9: 周易AIPU - file.elecfans.com

9 © 2018 Arm China

• 为人工智能/神经网络设计的专用指

令集

• 一套指令集包含不同粒度的指令o 灵活性满足不同神经网络操作

o 高性能、高能效, 粗粒度指令负责大块计算

• 支持用户自定义扩展指令o 满足定制化/差异化需求

优秀的可编程性

粗粒度

AI Fix Function

中粒度

Vector

细粒度 Scalar

Tensor

Branch

Page 10: 周易AIPU - file.elecfans.com

10 © 2018 Arm China

• 满足客户差异化需求o 针对特定场景 自定义扩展 AI Fix Function

• 友好的开发流程o 周易AIPU 指令集扩展o 复用现有周易AIPU成熟的软件开发工具

用户自定义扩展

TPC

FF

Instruction Decoder/Dispatch

AIPU Flexible Architecture

Scalar

CustomizeFF

Page 11: 周易AIPU - file.elecfans.com

11 © 2018 Arm China

• 完整的软件工具链o Build Tool/Driver

o 性能优化库

o 软件仿真器

o AI算法示例

• 简单、易用o 一键从算法模型到周易可执行文件

“一键式”周易 软件工具链

NNModels

ZhouyiExecutable

Rich

Libraries

Tensor

Vector

FF

ISA-ext.

Page 12: 周易AIPU - file.elecfans.com

12 © 2018 Arm China

参考芯片框架

AIprocessor

Cortex-A

AXI CCI + NIC-450

DDRC

Recommend :• Cortex-A75 + Cortex-A55

• big.Little • Zhouyi AIPU• Mali-GPU G52 or G76• CCI-550 + NIC-450

• AXI/AHB/APB bus • Mali-ISP

• HDR, NR• Video Codec

• Mali-V52/V76,4K, H.265,H264• Content Protection

• DRM

Mali-ISP

Parallel/MIPI

SensorDDR

Mali-GPU Mali-Video

Page 13: 周易AIPU - file.elecfans.com

13 © 2018 Arm China

周易赋能各种AI设备

Mobile

IOT

Surveillance

Home

Automotive

Robotics

Drones

VR/MR AIPU SDK

AI Frameworks (TensorFlow/TF Lite, Caffe/Caffe2…)

Neural-based Building Blocks

AI APP / Custom AI App(Face | Human | Vehicles | Robotics | Scenes…)

AI Domain Front End

AIPU Hardware

Page 14: 周易AIPU - file.elecfans.com

14 © 2018 Arm China

谢谢

For More Information : [email protected]

Page 15: 周易AIPU - file.elecfans.com

The Arm China trademarks featured in this presentation are registered trademarks or trademarks of Arm China (or its subsidiaries) in China and/or elsewhere. All rights reserved. All other marks featured may be trademarks of their respective owners.

www.armchina.com

15 © 2018 Arm China