张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

Flex Logix公司称它解决了深度学习的DRAM问题

IEEE电气电子工程师学会 2018-11-08 14:12 次阅读
深度学习有一个DRAM问题。设计用来实时处理复杂任务(比如,在汽车的备份摄像头视频流中分辨猫和孩子)的系统,不断地将构成神经网络内容的数据从存储器传送到处理器。 根据初创公司Flex Logix的说法,问题并不是缺乏存储这些数据的空间,而是处理器和存储器之间缺乏带宽。为了将数百千兆比特的数据提供给处理器,有些系统需要4个甚至8个DRAM芯片,这既使占用的空间增加了不少,又消耗了大量的电能。Flex Logix表示,它为可重构芯片开发的互连技术和tile-based架构将使AI系统只需要1个DRAM芯片的带宽,且功耗仅为十分之一。 图片来源:Flex Logix NMAX512 tile的架构。 位于加州山景城的Flex Logix公司已经开始将一种新的嵌入式现场可编程门阵列(eFPGA)架构商业化。但经过一番探索后,其创始人之一Cheng C. Wang意识到,这项技术可以加快神经网络的速度。 神经网络由连接和表示连接强度的“权重”组成。另一位创始人Geoff Tate解释说,一个好的AI芯片需要两样东西。一种是一些做关键“推断”计算(即乘法和累加)的电路。“但更困难的是,你必须非常擅长引入所有这些权重,以便其乘法器总能得到它们需要的数据,从而进行所需的数学运算。Wang意识到我们在FPGA的互连方面所拥有的技术,他可以对它做适应性改造,来创建一种非常擅长快速高效地加载权重、高性能和低功耗的架构。” 需要快速连续地将数百万个权重加载到网络中,这就是每秒要做数万亿次到数十万亿次运算的AI系统为什么需要那么多DRAM芯片的原因。DRAM芯片上的每个引脚每秒最多可以传输4Gb数据,因此要达到所需的每秒数百Gb的数据传输速度,就需要多个芯片。 在为FPGA开发最初的技术时,Wang注意到,这些芯片有约80%的面积互连,因此他寻求一种能够缩小互连面积并考虑到更多逻辑的架构。他和他在加州大学洛杉矶分校的同事对一种称为folded-Beneš网络的电信架构做了适应性改造来完成这项工作。这使得FPGA架构看起来像一堆逻辑和SRAM的瓦片(tile)。 图片来源:Flex Logix Flex Logix公司表示,在芯片中构建分布式SRAM可加快计算速度并降低功耗。 Tate说,在这种专用互连方案中使用分布式SRAM最终会对深度学习的DRAM带宽问题产生重大影响。“我们正在用芯片上的SRAM取代DRAM带宽。” 图片来源:Flex Logix 若干NMAX tile可以置于一个芯片上并连在一起,以扩大计算能力。 用于Flex Logix的AI产品的tile称为NMAX,采用了台积电的16纳米技术,面积不到2平方毫米。每个tile都由一组核心组成,这些核心这些核心负责关键的乘法和累加计算、控制数据的处理和流动的可编程逻辑以及SRAM。这涉及三种不同类型的互连技术。一种tile上的所有零件连接在一起。另一种将tile与位于tile之间的附加SRAM及外部的DRAM相连接。第三种将相邻的tile连接在一起。 在深度学习领域,很难进行真正的横向比较。但Flex Logix的分析显示,将使用1个DRAM芯片的模拟的6×6tile的NMAX512阵列与使用8个DRAM 的Nvidia Tesla T4进行比较,结果是新架构每秒能识别4,600张图像,而Nvidia每秒识别3,920张图像。在一项名为YOLOv3的实时视频处理测试中,同样大小的NMAX阵列可达到每秒22万亿次运算,而使用的DRAM带宽是其他系统的十分之一。 Tate表示,首批NMAX芯片的设计将于2019年下半年送至代工厂以便进行制造 Flex Logix将波音公司视作其高吞吐量嵌入式FPGA产品的客户之一。但Tate承认,与神经网络相比,嵌入式FPGA是个很难卖的产品。“嵌入式FPGA是一项很好的业务,但是推理可能很快就会超越它。”Tate说。
原文标题:Flex Logix公司称它解决了深度学习的DRAM问题 文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

深度学习和神经网络

David,加州大学物理博士,美国著名电商数据科学家。本课程介绍什么是深度学习, 深度学习与机器学习的关系,几种神经网络
发表于 11-08 00:00 7724次 阅读
深度学习和神经网络

什么是AI?AI转型指南

第一章主要介绍了与AI相关的一些概念, 例如机器学习, 数据科学,深度学习以及其他的一些工具,对于入....
的头像 电子发烧友网工程师 发表于 03-27 09:01 72次 阅读
什么是AI?AI转型指南

在库存尚未去化完成的影响下 DRAM均价跌势恐将持续至第三季

集邦咨询半导体研究中心(DRAMeXchange)指出,受库存过高影响,DRAM第一季合约价跌幅持续....
发表于 03-26 17:27 32次 阅读
在库存尚未去化完成的影响下 DRAM均价跌势恐将持续至第三季

人工智能深度学习未必走进死胡同 值得商榷

深度学习作为一类机器学习方法,是实现人工智能的重要基础。近日有学者认为,随着人工智能的发展,深度学习....
发表于 03-26 16:32 29次 阅读
人工智能深度学习未必走进死胡同 值得商榷

70年来,人们在AI领域“一直连续犯着同样的错误”

就像在棋类游戏中一样,研究人员总是试图让系统按照他们心目中的人类的思维方式工作,试图把这些知识放进计....
的头像 人工智能 发表于 03-26 15:42 161次 阅读
70年来,人们在AI领域“一直连续犯着同样的错误”

“易航智能”宣布获得广汽资本旗下基金的1亿元人民币B+轮融资

在自动驾驶这个领域,主要有两种不同的路径,一种是像Waymo一样,直接做L4和L5的全自动驾驶,另一....
的头像 MEMS 发表于 03-25 15:44 839次 阅读
“易航智能”宣布获得广汽资本旗下基金的1亿元人民币B+轮融资

汽车背后的故事,通过深度学习提高和发展车辆感知

当今自动驾驶领域最热门的话题之一是“深度学习”,这是机器学习的一个子集。深度学习是一种计算方法,用于....
的头像 德州仪器 发表于 03-25 14:42 287次 阅读
汽车背后的故事,通过深度学习提高和发展车辆感知

NVIDIA深度学习学院正在推出包括讲师指导和自定进度在线课程在内的全新课程

Microsoft Azure营销高级总监Talal Alqinawi表示:“我们与NVIDIA的合....
的头像 英伟达NVIDIA中国 发表于 03-25 14:18 100次 阅读
NVIDIA深度学习学院正在推出包括讲师指导和自定进度在线课程在内的全新课程

前馈网络:如何让深度学习工作更像人脑

计算神经科学是一门超级跨学科的新兴学科,几乎综合信息科学,物理学, 数学,生物学,认知心理学等众多领....
的头像 人工智能学家 发表于 03-25 11:22 298次 阅读
前馈网络:如何让深度学习工作更像人脑

NVIDIA公布了其最新的图像处理研究成果—GauGAN

“GauGAN”收集了超过100万张图片作为数据基础,使用深度算法让AI进行学习,最终能够在像素级的....
的头像 科技美学 发表于 03-25 10:38 310次 阅读
NVIDIA公布了其最新的图像处理研究成果—GauGAN

D801A 8 寸人脸识别一体机的详细资料说明

D801A 人脸抓拍识别一体机是一款高性能、高可靠性的人脸识别类产品。 依托深度学习算法扩展人脸库....
发表于 03-25 08:00 25次 阅读
D801A 8 寸人脸识别一体机的详细资料说明

深度学习在计算机视觉领域的应用一览

图像处理,还有视频处理,曾经是很多工业产品的基础,现在电视,手机还有相机/摄像头等等都离不开,是技术....
的头像 电子发烧友网工程师 发表于 03-23 10:16 387次 阅读
深度学习在计算机视觉领域的应用一览

深度学习的方法总结

训练之前一定要执行参数初始化,否则可能减慢收敛速度,影响训练结果,或者造成Nan数值溢出等异常问题。
的头像 Imagination Tech 发表于 03-23 10:10 287次 阅读
深度学习的方法总结

使用TensorFlow开发的一款通用深度学习框架,侧重于针对语言相关任务的序列模型

在构建 Lingvo 时,我们秉持着协作研究的理念,通过在不同任务之间共享公共层的实现来提升代码复用....
的头像 TensorFlow 发表于 03-22 16:59 264次 阅读
使用TensorFlow开发的一款通用深度学习框架,侧重于针对语言相关任务的序列模型

NAND Flash价格综合季跌幅近20% 第二季或有扭转

集邦咨询半导体研究中心(DRAMeXchange)调查指出,受到服务器需求疲弱、智能手机换机周期延长....
发表于 03-22 16:45 76次 阅读
NAND Flash价格综合季跌幅近20% 第二季或有扭转

杰出女性探讨AI创新、社会影响和多样性,为AI下一代领导者铺平道路

由知名咨询公司博思艾伦(Booz Allen Hamilton)赞助的女性早期职业加速计划汇集了来自....
的头像 英伟达NVIDIA中国 发表于 03-22 16:19 471次 阅读
杰出女性探讨AI创新、社会影响和多样性,为AI下一代领导者铺平道路

数据科学家们将能够借助NVIDIA全新CUDA-X AI库实现速度的大幅提升

CUDA-X AI包含十几个专用加速库,能够将机器学习和数据科学工作负载加速至高达50倍。它已经在通....
的头像 英伟达NVIDIA企业解决方案 发表于 03-22 15:16 298次 阅读
数据科学家们将能够借助NVIDIA全新CUDA-X AI库实现速度的大幅提升

比尔·盖茨:人工智能对我们来说是一项福音,我们应该利用AI来改善健康和教育

但事实并非一成不变。他指出,医疗和教育是AI可以给人类带来福祉的两大领域。“这是促进社会科学的一次大....
的头像 人工智能 发表于 03-22 14:22 406次 阅读
比尔·盖茨:人工智能对我们来说是一项福音,我们应该利用AI来改善健康和教育

Nvidia Research开发的深度学习模型,轻松地将粗糙的涂鸦变成照片级的写实杰作

GauGAN 可以为从建筑师、城市规划者到景观设计师和游戏开发商的每个人提供一个强大的工具来创建虚拟....
的头像 人工智能 发表于 03-22 14:19 300次 阅读
Nvidia Research开发的深度学习模型,轻松地将粗糙的涂鸦变成照片级的写实杰作

三星突破DRAM的扩展极限 成功研发10nm级DDR4内存

据消息,作为先进存储器技术的全球领导者,三星电子今(21)日宣布第三代10纳米级(1z-nm)8GB....
发表于 03-21 17:30 149次 阅读
三星突破DRAM的扩展极限 成功研发10nm级DDR4内存

深度学习模型帮助预测优势品种,人工智能让育种“物美价廉”

自从作物被驯化以来,培育集抗性强、优质、高产等性状为一体的作物品种一直是育种家的梦想。DNA分子结构....
的头像 人工智能学家 发表于 03-21 16:58 569次 阅读
深度学习模型帮助预测优势品种,人工智能让育种“物美价廉”

三星宣布开发出业内首款基于第三代10nm级工艺的DRAM内存芯片

3月21日,三星电子宣布开发出业内首款基于第三代10nm级工艺的DRAM内存芯片,将服务于高端应用场....
的头像 半导体动态 发表于 03-21 16:43 591次 阅读
三星宣布开发出业内首款基于第三代10nm级工艺的DRAM内存芯片

三家厂商寡占95% 市场,存储器是景气循环产业

2017 年下半年到2018 上半年,除了前述两项市场趋势持续升温之外,运算加密货币演算法所需的绘图....
的头像 电子发烧友网工程师 发表于 03-21 15:09 3313次 阅读
三家厂商寡占95% 市场,存储器是景气循环产业

美光:库存金额季增逾一成 DRAM晶圆投片量拟减5%

美国存储器大厂美光科技(Micron Technology Inc.)20 日美国股市盘后公布 20....
发表于 03-21 10:16 134次 阅读
美光:库存金额季增逾一成 DRAM晶圆投片量拟减5%

深度学习加持,四足机器人ANYMAL 横空出世

ANYMAL与被植入了硬性程序的机器人不同,在深度强化学习的加持下,ANYMAL具有自我学习、自我升....
的头像 机器人前沿 发表于 03-21 10:07 338次 阅读
深度学习加持,四足机器人ANYMAL 横空出世

英伟达的黑魔法:GauGAN

这张图真实的体现了在通常情况下,学生面对老师传授知识、或者技能时候的一种状态。很多人对此深有同感:在....
的头像 新智元 发表于 03-21 09:16 1209次 阅读
英伟达的黑魔法:GauGAN

Google AI的研究人员的最新研究提出一个全新概念:刚度(Stiffness)

学习率的选择对学习函数的刚度特性有显著影响。高学习率会导致函数逼近在更大的距离上“更刚”(stiff....
的头像 新智元 发表于 03-21 09:14 192次 阅读
Google AI的研究人员的最新研究提出一个全新概念:刚度(Stiffness)

亚马逊神经网络类图书中最受欢迎的10本书

本书揭示神经网络背后的概念,并介绍如何通过Python实现神经网络。全书分为3章和两个附录。第1章介....
的头像 电子发烧友网工程师 发表于 03-20 15:23 338次 阅读
亚马逊神经网络类图书中最受欢迎的10本书

探索可解释的人工智能推理

推理是人类智能活动的重要组成部分。
的头像 中国人工智能学会 发表于 03-20 15:00 337次 阅读
探索可解释的人工智能推理

调试神经网络所遵循的五项原则

其次,在单个数据节点上训练模型:可以使用一两个训练数据点(data point)以确认模型是否过度拟....
的头像 电子发烧友网工程师 发表于 03-20 09:33 168次 阅读
调试神经网络所遵循的五项原则

GTC十年,英伟达开了一场“三无”发布会

CUDA-X AI能够将机器学习和数据科学工作负载加速多达50倍,由十几个专用加速库组成。这些库包括....
的头像 新智元 发表于 03-20 09:13 597次 阅读
GTC十年,英伟达开了一场“三无”发布会

必读!生成对抗网络GAN论文TOP 10

这篇 GAN 论文来自 NVIDIA Research,提出以一种渐进增大(progressive ....
的头像 新智元 发表于 03-20 09:02 150次 阅读
必读!生成对抗网络GAN论文TOP 10

一些优秀的Github仓库源码与框架

对图结构数据的预处理比较麻烦。例如在处理异构网络时,有时需要对每种类型的节点进行独立地编号、为每种关....
的头像 新智元 发表于 03-20 08:50 132次 阅读
一些优秀的Github仓库源码与框架

内存芯片跌幅在扩大 三星面临着新考验

作为手机行业的上游内存芯片企业一度因为智能手机的火爆而赚了个盆满钵满,不过随着智能手机销量的停滞或略....
发表于 03-19 17:14 142次 阅读
内存芯片跌幅在扩大 三星面临着新考验

针对端到端自主驾驶模型的简单对抗实例

智能机器学习系统极易受到干扰的问题引发了广泛的担忧。这些研究成果及其理论框架无疑为以后的研究提供了有....
的头像 电子发烧友网工程师 发表于 03-19 17:10 304次 阅读
针对端到端自主驾驶模型的简单对抗实例

科研革命来了:AI在改变科学家的研究方式

从2007年开始,普通计算机用户可以记录下自己关于某个星系属于哪个类别的最佳猜测,来帮助天文学家完成....
的头像 电子发烧友网工程师 发表于 03-19 15:42 219次 阅读
科研革命来了:AI在改变科学家的研究方式

神经协同过滤NCF原理及实战

上面的示例显示了MF因为使用一个简单的和固定的内积,来估计在低维潜在空间中用户-项目的复杂交互,从而....
的头像 电子发烧友网工程师 发表于 03-19 15:28 150次 阅读
神经协同过滤NCF原理及实战

什么是Transition-based基于转移的框架?

用在生成依存句法树上,则具体表示为从空状态开始,通过动作转移到下一个状态,一步一步生成依存句法树,最....
的头像 电子发烧友网工程师 发表于 03-19 13:40 137次 阅读
什么是Transition-based基于转移的框架?

人工智能会不会取代我们甚至统治我们?

由于技术的进步引发的新话题层出不穷,我们不断被动地接收新的理念。越来越多的人发现,人类开始进入“无人....
的头像 电子发烧友网工程师 发表于 03-19 10:33 454次 阅读
人工智能会不会取代我们甚至统治我们?

期待贾扬清在阿里有所作为,做出更成功的框架和落地的产品。

随后,贾扬清离职Facebook的消息在知乎上被爆料,Facebook软件工程师晓飞在知乎上确认了贾....
的头像 电子发烧友网工程师 发表于 03-19 10:20 302次 阅读
期待贾扬清在阿里有所作为,做出更成功的框架和落地的产品。

【PYNQ-Z2试用体验】基于PYNQ-Z2的神经网络图形识别[结项]

前言前面我们简单讲解了神经网络的基本概念和工作原理,接下来,将通过具体的python代码来完成基于神经网络的图形识别。这里使用...
发表于 03-18 21:51 178次 阅读
【PYNQ-Z2试用体验】基于PYNQ-Z2的神经网络图形识别[结项]

三星将批量生产史上最大容量的移动式DRAM

三星电子14日表示,将批量生产史上最大容量的移动式DRAM“12GB LPDDR4X”(Low Po....
发表于 03-18 16:52 164次 阅读
三星将批量生产史上最大容量的移动式DRAM

2019年是人工智能产业发展的重要一年

“在人工智能领域,我国多项技术处于世界领先地位。”张颐介绍说,在基础研究方面,我国已拥有人工智能研发....
的头像 高工智能未来 发表于 03-18 15:59 468次 阅读
2019年是人工智能产业发展的重要一年

NVDIMM的几种实现方式, NVDIMM-P的性能所做的硬件上的优化和支持

这是一个目前还没有发布的标准 (Under Development)。预计将与DDR5 标准一同发布....
的头像 ssdfans 发表于 03-18 15:04 155次 阅读
NVDIMM的几种实现方式, NVDIMM-P的性能所做的硬件上的优化和支持

日本的科技公司在研发一款有效预防偷窃行为的人工智能系统

这套人工智能预防犯罪系统基于人工智能复杂的算法,该算法对超10万个小时的监控视频进行深度学习,可以分....
的头像 机器人创新生态 发表于 03-18 14:32 205次 阅读
日本的科技公司在研发一款有效预防偷窃行为的人工智能系统

百度认证的深度学习工程师考试将于2019年3月正式开考

Apollo 线上感知模块提供基于深度学习的点云动态障碍物的检测,通过集联多层的神经网络,使其提取出....
的头像 Apollo开发者社区 发表于 03-18 14:23 210次 阅读
百度认证的深度学习工程师考试将于2019年3月正式开考

深度学习在汽车中的应用

作者:德州仪器Joe Folkens    在未来的某个时候,人们必定能够相对自如地运用人工智能,安全地驾车出行。这个时刻...
发表于 03-13 06:45 137次 阅读
深度学习在汽车中的应用

【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车-搭建神经网络

在之前的帖子中,我们完成了神经网络自动驾驶小车的硬件搭建与底盘控制。当小车通过WiFi无线连接到网络后,已经可以对其进行远...
发表于 03-09 22:10 213次 阅读
【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车-搭建神经网络

请问TS201的核电压、I/O电压、DRAM电压、时钟电压上电顺序怎么管理?

TS201的核电压1。05V,I/O电压2.5V,DRAM电压1.5V的上电顺序应该谁先谁后啊?如果两个电压间隔几十ms建立可不可以? ...
发表于 03-08 08:04 59次 阅读
请问TS201的核电压、I/O电压、DRAM电压、时钟电压上电顺序怎么管理?

AI工程师 10 个深度学习方法

过去十年里,人们对机器学习的兴趣经历了爆炸式的整长。我们几乎每天都可以在计算机程序、行业会议和媒体上看到机器学习的身影。...
发表于 03-07 20:17 111次 阅读
AI工程师 10 个深度学习方法

【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车-多路电机控制

在上一篇帖子中,我们完成了“基于PYNQ的神经网络自动驾驶小车”的硬件搭建。本文我们将继续完善小车的软件框架,为小车的底...
发表于 03-07 16:57 441次 阅读
【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车-多路电机控制

【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车 - 硬件搭建

根据项目规划,本篇帖子将详解“基于PYNQ的神经网络自动驾驶小车”的硬件搭建。 一、材料清单 制作小车所需的主要部件与...
发表于 03-05 18:11 345次 阅读
【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车 - 硬件搭建

深度学习应用和图像论文相关笔记

[水博文]论文杂读
发表于 03-05 14:24 44次 阅读
深度学习应用和图像论文相关笔记

【PYNQ-Z2试用体验】神经网络基础知识

前言前面我们通过notebook,完成了在PYNQ-Z2开发板上编写并运行python程序。我们的最终目的是基于神经网络,完成手写的数字...
发表于 03-03 22:10 272次 阅读
【PYNQ-Z2试用体验】神经网络基础知识

【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车 - 项目规划

本次试用PYNQ-Z2的目标作品是“基于PYNQ的神经网络自动驾驶小车”。 在之前的一个多月内,已经完成了整个项目初步实...
发表于 03-02 23:10 358次 阅读
【PYNQ-Z2试用体验】基于PYNQ的神经网络自动驾驶小车 - 项目规划