论坛风格切换切换到宽版
发帖 回复
返回列表  提醒:不能用迅雷等P2P下载,否则下载失败标(二级)的板块,需二级才能下载,没二级不要购买,下载不了
  • 772阅读
  • 3回复

[最新新闻]Cadence发布业界首款面向汽车、监控、无人机和移动市场的神经网络DSP IP [复制链接]

上一主题 下一主题
离线xzcxnihd
 

性别:
帅哥
发帖
4636
金币
1
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看楼主 倒序阅读 使用道具 0楼 发表于: 2017-05-04
具备1TMAC/秒计算能力的完整独立 DSP解决方案 %e[E@H7  
;HCK iHC  
内容提要: 5BA:^4zr?  
yf*'=q  
完整独立的DSP核心,全面支持各级神经网络层 r\QV%09R  
Fa h6 &a  
芯片面积不到1mm2,计算速度可达每秒1 TeraMAC(TMAC) 8d$|JN;)  
kB?/_a`]  
通用的可编程解决方案,为未来而生,满足不断演进的技术需求 gdCit-3  
*04}84?:  
为视觉设备、雷达/光学雷达和融合传感器应用度身优化 .<vXj QE  
p9jC-&:  
楷登电子(美国Cadence公司,NASDAQ: CDNS)今日正式公布业界首款独立完整的神经网络DSP —Cadence®Tensilica® Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。如需了解更多内容,请参访www.cadence.com/go/visionc5 E-^(VZ_Xj  
~rb]u Ny-  
随着神经网络应用的日益深入和复杂,对计算的要求也与日俱增;同时,神经网络的自身架构在不断更新换代,新网络、新应用和新市场也层出不穷。上述趋势之下,业界亟需一款针对嵌入式系统量身定制的高性能、通用型神经网络解决方案,不仅应该具备极低的功耗,还应拥有高度的可编程能力,以适应未来变化,降低风险。 tQG'f*4  
<b'*GBw$  
神经网络DSP vs. 神经网络加速器 X> 98`  
+UWv}|  
基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。 z#Qe$`4&  
xyo~p,(~t  
Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。 p8XvfM  
UU(Pg{DA 6  
“我们的很多客户都在纠结如何选择理想的神经网络平台,毕竟一款产品的开发可能耗时数年,”Cadence公司Tensilica事业部市场高级总监Steve Roddy表示。“随时在线(always-on)嵌入式系统的神经网络处理器不仅需要低功耗和较快的图像处理速度,灵活性和永不过时(future-proof)的前瞻性也必不可少。目前的平台都不够理想,客户亟需一个全新的解决方案。Vision C5 DSP通用型神经网络DSP应运而生,它集成方便、使用灵活,功耗能效较CNN加速器、GPU和CPU也更为出色。” [^GBg>k  
v5@4 |u3ds  
“现实世界中的深度学习应用数量庞大,种类繁多,对计算的要求非常苛刻,”嵌入视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“Vision C5 DSP作为神经网络专用编程处理器,可以帮助我们在低成本、低功耗设备上应用深度学习技术。” NL:dyV }  
,~,q 0PA7J  
Vision C5 DSP的参数与性能 V5-!w0{  
b5MU$}:  
依托独立引擎,Vision C5 DSP具备领先的神经网络性能: IG|u;PH<  
7Cp /{l;d  
不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量 gJp6ReZ#  
1.u^shc&|  
1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能 iOIq2&sV  
_R|_1xa=  
128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构 dn}EM7:Z  
"c} en[  
专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力 &0f/F:M  
/JRZ?/<1  
内置iDMA和AXI4总线接口 qi/k`T  
OmkJP  
使用与Vision P5和P6 DSP一致的经验证软件工具包 S0OL;[*.  
}fk3a9j9u  
基于业界知名的AlexNet CNNBenchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。 yp4[EqME  
Ohgu*5!o  
Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。 J<H]vs  
8&HBR #  
Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。 &\ca ? #  
lH?jqp  
Cadence正与多家早期客户展开合作。如需了解Vision C5 DSP的详细内容,请联系您的Cadence销售代表。


评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

一般

差劲
离线fengxz

性别:
人妖
发帖
4513
金币
2070
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看该作者 1楼 发表于: 2017-05-05
1TMAC/秒计算能力


在线wcjcn

性别:
人妖
发帖
4201
金币
3344
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看该作者 2楼 发表于: 2017-05-05
厉害了。。。科技进步太快了



性别:
帅哥
发帖
1010
金币
944
提示:会员销售的附件,下载积分 = 版块积分 + 销售积分       只看该作者 3楼 发表于: 2017-05-05
cadence还做芯片?


快速回复
限150 字节
 
上一个 下一个