【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

Flex Logix公司称它解决了深度学习的DRAM问题

IEEE电气电子工程师学会 2018-11-08 14:12 次阅读
深度学习有一个DRAM问题。设计用来实时处理复杂任务(比如,在汽车的备份摄像头视频流中分辨猫和孩子)的系统,不断地将构成神经网络内容的数据从存储器传送到处理器。 根据初创公司Flex Logix的说法,问题并不是缺乏存储这些数据的空间,而是处理器和存储器之间缺乏带宽。为了将数百千兆比特的数据提供给处理器,有些系统需要4个甚至8个DRAM芯片,这既使占用的空间增加了不少,又消耗了大量的电能。Flex Logix表示,它为可重构芯片开发的互连技术和tile-based架构将使AI系统只需要1个DRAM芯片的带宽,且功耗仅为十分之一。 图片来源:Flex Logix NMAX512 tile的架构。 位于加州山景城的Flex Logix公司已经开始将一种新的嵌入式现场可编程门阵列(eFPGA)架构商业化。但经过一番探索后,其创始人之一Cheng C. Wang意识到,这项技术可以加快神经网络的速度。 神经网络由连接和表示连接强度的“权重”组成。另一位创始人Geoff Tate解释说,一个好的AI芯片需要两样东西。一种是一些做关键“推断”计算(即乘法和累加)的电路。“但更困难的是,你必须非常擅长引入所有这些权重,以便其乘法器总能得到它们需要的数据,从而进行所需的数学运算。Wang意识到我们在FPGA的互连方面所拥有的技术,他可以对它做适应性改造,来创建一种非常擅长快速高效地加载权重、高性能和低功耗的架构。” 需要快速连续地将数百万个权重加载到网络中,这就是每秒要做数万亿次到数十万亿次运算的AI系统为什么需要那么多DRAM芯片的原因。DRAM芯片上的每个引脚每秒最多可以传输4Gb数据,因此要达到所需的每秒数百Gb的数据传输速度,就需要多个芯片。 在为FPGA开发最初的技术时,Wang注意到,这些芯片有约80%的面积互连,因此他寻求一种能够缩小互连面积并考虑到更多逻辑的架构。他和他在加州大学洛杉矶分校的同事对一种称为folded-Beneš网络的电信架构做了适应性改造来完成这项工作。这使得FPGA架构看起来像一堆逻辑和SRAM的瓦片(tile)。 图片来源:Flex Logix Flex Logix公司表示,在芯片中构建分布式SRAM可加快计算速度并降低功耗。 Tate说,在这种专用互连方案中使用分布式SRAM最终会对深度学习的DRAM带宽问题产生重大影响。“我们正在用芯片上的SRAM取代DRAM带宽。” 图片来源:Flex Logix 若干NMAX tile可以置于一个芯片上并连在一起,以扩大计算能力。 用于Flex Logix的AI产品的tile称为NMAX,采用了台积电的16纳米技术,面积不到2平方毫米。每个tile都由一组核心组成,这些核心这些核心负责关键的乘法和累加计算、控制数据的处理和流动的可编程逻辑以及SRAM。这涉及三种不同类型的互连技术。一种tile上的所有零件连接在一起。另一种将tile与位于tile之间的附加SRAM及外部的DRAM相连接。第三种将相邻的tile连接在一起。 在深度学习领域,很难进行真正的横向比较。但Flex Logix的分析显示,将使用1个DRAM芯片的模拟的6×6tile的NMAX512阵列与使用8个DRAM 的Nvidia Tesla T4进行比较,结果是新架构每秒能识别4,600张图像,而Nvidia每秒识别3,920张图像。在一项名为YOLOv3的实时视频处理测试中,同样大小的NMAX阵列可达到每秒22万亿次运算,而使用的DRAM带宽是其他系统的十分之一。 Tate表示,首批NMAX芯片的设计将于2019年下半年送至代工厂以便进行制造。 Flex Logix将波音公司视作其高吞吐量嵌入式FPGA产品的客户之一。但Tate承认,与神经网络相比,嵌入式FPGA是个很难卖的产品。“嵌入式FPGA是一项很好的业务,但是推理可能很快就会超越它。”Tate说。
原文标题:Flex Logix公司称它解决了深度学习的DRAM问题 文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

李开复:AI的强大和人类对它的误解,以及我们能做什么来保护员工

虽然机器人可能不会用来将把健康诊断的消息传递给病人,但人工智能已经被用来辅助医生的工作。例如,斯坦福....
的头像 OFweek工控 发表于 01-16 17:32 38次 阅读
李开复:AI的强大和人类对它的误解,以及我们能做什么来保护员工

人工智能医生如何看脸识病

DeepGestalt首先识别患者面部的五官,然后将图像裁剪成100×100像素大小的区域。接下来,....
的头像 人工智能 发表于 01-16 17:02 38次 阅读
人工智能医生如何看脸识病

嵌入式工程师到底有没有前途应该如何规划就业之路

嵌入式一直冠以高门槛的名号,相较于软件开发逊色的起步薪资也被网友调侃“饿肚子”。热情投入嵌入式的人比....
发表于 01-16 16:53 5次 阅读
嵌入式工程师到底有没有前途应该如何规划就业之路

CNN中卷积都有些什么作用

在传统的神经网络中,比如多层感知机(MLP),其输入通常是一个特征向量。需要人工设计特征,然后将用这....
的头像 Imagination Tech 发表于 01-16 14:41 55次 阅读
CNN中卷积都有些什么作用

为稳定DRAM价格并平衡市场供需环境 2019年各厂计划减少资本支出

根据集邦咨询半导体研究中心(DRAMeXchange)调查,2018年12月正值欧美年节时期,DRA....
发表于 01-16 14:31 19次 阅读
为稳定DRAM价格并平衡市场供需环境 2019年各厂计划减少资本支出

DRAM面临的问题不是供给端的增加 而是因进入淡季所导致的库存攀高

1月15日,DRAMeXchange最新报告指出,今(2019)年第一季度DRAM的合约价将由原先预....
发表于 01-16 14:26 11次 阅读
DRAM面临的问题不是供给端的增加 而是因进入淡季所导致的库存攀高

改进粒子群优化神经网络的葡萄酒质量识别

随着我国经济的崛起,葡萄酒业也搭上了我国经济崛起的快速列车。葡萄酒产业规模不断壮大,但葡萄酒质量评定....
发表于 01-16 14:25 5次 阅读
改进粒子群优化神经网络的葡萄酒质量识别

三个研究小组在“破译”大脑语言密码上取得了一定进展

随着病人们听到故事录音以及0至9数字录音,他们的神经网络同步分析其听觉皮层(该皮层在语音和听力过程中....
的头像 电子发烧友网工程师 发表于 01-16 11:42 166次 阅读
三个研究小组在“破译”大脑语言密码上取得了一定进展

人工智能深度学习算法在工业机械臂上的应用

从功能上来说,你这个应用非常适合采用深度学习,事实上,深度学习本质上就是用来做分类识别的,尤其是针对....
的头像 IOT万物互联 发表于 01-16 10:55 255次 阅读
人工智能深度学习算法在工业机械臂上的应用

2018年全球前25大半导体厂商的总营收增加16.3%

在内存领域中NAND Flash市场成长趋缓,全年多数时间的平均售价都因为供过于求而下滑,不过这个类....
的头像 电子发烧友网工程师 发表于 01-16 10:33 164次 阅读
2018年全球前25大半导体厂商的总营收增加16.3%

基于神经网络的计算模型,将大脑中的脑电数据转化为语言

而且众所周知:使用的数据越精确,模型的运行效果就越好,但是精准的模型需要开颅手术后才能获得,这样严苛....
的头像 将门创投 发表于 01-16 09:27 68次 阅读
基于神经网络的计算模型,将大脑中的脑电数据转化为语言

Gartner:2018年全球半导体营收达4767亿美元,2019内存芯片需求下滑

本文来自Gartner报告,本文作为转载分享。 内存芯片成为近两年半导体领域增长最快的产品,但是最新....
发表于 01-16 09:26 54次 阅读
Gartner:2018年全球半导体营收达4767亿美元,2019内存芯片需求下滑

又一代码清库的惨案发生了,不过这次要背锅是AI

神经网络算法的这一波操作,让人不禁想起郭德纲的一个相声段子,“我心善,见不得穷人,于是把自己目之所及....
的头像 电子发烧友网工程师 发表于 01-16 09:12 93次 阅读
又一代码清库的惨案发生了,不过这次要背锅是AI

Gartner发布2018年全球半导体市场初步报告

因此,就半导体而言,内存在2018年收入增长27.2%。除2018年第四季度外,全年大部分时间DRA....
的头像 电子发烧友网工程师 发表于 01-15 17:49 390次 阅读
Gartner发布2018年全球半导体市场初步报告

如何在Hadoop上运行这些深度学习工作

典型的深度学习工作流程:数据从各个终端(或其他来源)汇聚到数据湖中。数据科学家可以使用笔记本进行数据....
的头像 电子发烧友网工程师 发表于 01-15 16:29 165次 阅读
如何在Hadoop上运行这些深度学习工作

探索了神经科学技术的相关应用,以确定人工神经网络中信息是如何结构化的

在 Mayes Meisen 和他同事的研究中,研究人员希望以破坏神经网络的特定区域的方法,观察该区....
的头像 电子发烧友网工程师 发表于 01-15 16:06 172次 阅读
探索了神经科学技术的相关应用,以确定人工神经网络中信息是如何结构化的

机器学习算法基本概念及选用指南

本文对机器学习的一些基本概念给出了简要的介绍,并对不同任务中使用不同类型的机器学习算法给出一点建议。
的头像 Imagination Tech 发表于 01-15 15:55 118次 阅读
机器学习算法基本概念及选用指南

如何使用MS-KCF模型进行图像序列中人脸快速稳定检测

为快速稳定地检测图像序列中角度变化较大、遮挡较为严重的人脸,结合快速精确的目标检测模型MobileN....
发表于 01-15 15:44 14次 阅读
如何使用MS-KCF模型进行图像序列中人脸快速稳定检测

没有技术的无奈!美光垄断案硬是成了晋华窃取技术案

而对于DRAM价格持续上涨的原因,此前业界认为是由于DRAM市场需求持续增长,以及各大存储厂商积极转....
的头像 电子发烧友网工程师 发表于 01-15 14:51 755次 阅读
没有技术的无奈!美光垄断案硬是成了晋华窃取技术案

李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构

简单地移植图像分类的方法不足以进行语义分割。在图像分类中,NAS 通常使用从低分辨率图像到高分辨率图....
的头像 电子发烧友网工程师 发表于 01-15 13:51 240次 阅读
李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构

剖析一下现代高科技企业尤其是互联网公司如何设置一个成功的研究院

我们先来说说为什么「比较成熟的产品」适合搭配研究院。成熟的产品,已经有了比较成熟的数据链条(Data....
的头像 电子发烧友网工程师 发表于 01-15 10:08 262次 阅读
剖析一下现代高科技企业尤其是互联网公司如何设置一个成功的研究院

腾讯鹅漫U品如何基于LSTM模型进行中文文本情感分析?

我们基于 40 多万条真实的鹅漫用户评论数据建立了语料库,为了让正面和负面的学习样本尽可能均衡,我们....
的头像 电子发烧友网工程师 发表于 01-15 09:58 224次 阅读
腾讯鹅漫U品如何基于LSTM模型进行中文文本情感分析?

深入“万人迷”小冰的核心技术与聊天机器人技术的发展趋势!

基于检索的方法的关键在于如何根据上下文对话、语义理解与候选回复等信息设计并构建 Matching M....
的头像 电子发烧友网工程师 发表于 01-15 09:56 144次 阅读
深入“万人迷”小冰的核心技术与聊天机器人技术的发展趋势!

UCLA研究人员用三个实验表明,AI网络实在太好骗了

有AI技术的支持者表示,非常愿意使用这些神经网络网络来完成多种多样的个人任务,甚至完成通常要由人完成....
的头像 新智元 发表于 01-15 09:19 168次 阅读
UCLA研究人员用三个实验表明,AI网络实在太好骗了

请问stm32 stop模式下DRAM断电吗

比如L4+我知道SRAM和寄存器是能正常供电的,但是DRAM stop模式下是正常供电的吗??...
发表于 01-15 08:19 111次 阅读
请问stm32 stop模式下DRAM断电吗

一种深度学习应用Face2Gene,可以帮助医生识别罕见基因疾病

和大多数消费产品一样,Face2Gene 的 APP 可以搭载在智能手机里,其识别遗传病的 top-....
的头像 机器人大讲堂 发表于 01-14 17:05 203次 阅读
一种深度学习应用Face2Gene,可以帮助医生识别罕见基因疾病

人工智能为我们的生活带来的惊奇改变

NVIDIA “I Am AI” (《我是AI》)系列纪录片讲述了一些人工智能为我们的生活带来惊奇改....
的头像 英伟达NVIDIA中国 发表于 01-14 15:12 239次 阅读
人工智能为我们的生活带来的惊奇改变

研究人员开发一种神经网络,能够读取食谱并生成烹饪完成后的熟食产品的图像

值得一提的是,与CUB和Oxford102数据集中的图像相比,recipe1M数据集中的图像质量较低....
的头像 人工智能 发表于 01-14 14:35 212次 阅读
研究人员开发一种神经网络,能够读取食谱并生成烹饪完成后的熟食产品的图像

互联网大脑模型中类脑神经元网络发育的两条路径之争

今日头条的崛起第一次在中国消费级社交网络对腾讯的统治产生挑战,未来的发展趋势需要观察用户沟通还是内容....
的头像 人工智能学家 发表于 01-14 13:52 206次 阅读
互联网大脑模型中类脑神经元网络发育的两条路径之争

机器学习算法概念介绍及选用建议

在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题。虽然有很多有关机器学习算法的文章....
的头像 通信信号处理研究所 发表于 01-14 13:49 498次 阅读
机器学习算法概念介绍及选用建议

探讨AI的历史和现在及深度学习的局限性

许多人认为,算法可以利用认知意识来超越人类。机器可以在没有人类干预的情况下识别和学习任务。他们完全可....
的头像 人工智能学家 发表于 01-14 13:32 190次 阅读
探讨AI的历史和现在及深度学习的局限性

基于深度学习的人脸识别技术的广泛应用

自20世纪下半叶,计算机视觉技术逐渐地发展壮大。同时,伴随着数字图像相关的软硬件技术在人们生活中的广....
的头像 机器人大讲堂 发表于 01-14 10:43 891次 阅读
基于深度学习的人脸识别技术的广泛应用

CMU、谷歌大脑的研究者最新提出万用NLP模型Transformer的升级版

为了将Transformer或self-attention应用到语言建模中,核心问题是如何训练Tra....
的头像 新智元 发表于 01-14 09:17 203次 阅读
CMU、谷歌大脑的研究者最新提出万用NLP模型Transformer的升级版

一份过冬存粮:算法工程师必备的面试技能雷达图

当然,上面只是让大家体会一下什么是这四项素质,真实的计算广告算法工程师面试中,你不一定要都掌握,也不....
的头像 新智元 发表于 01-14 09:13 188次 阅读
一份过冬存粮:算法工程师必备的面试技能雷达图

近三年技术和产业发展的回顾,再论“深度学习已死

康奈尔大学的Gary Marcus写了一篇关于深度学习局限性的文章,并提出了几个发人深省的观点。Ro....
的头像 新智元 发表于 01-14 08:58 293次 阅读
近三年技术和产业发展的回顾,再论“深度学习已死

PyTorch官网教程PyTorch深度学习:60分钟快速入门中文翻译版

“PyTorch 深度学习:60分钟快速入门”为 PyTorch 官网教程,网上已经有部分翻译作品,....
的头像 人工智能头条 发表于 01-13 11:53 461次 阅读
PyTorch官网教程PyTorch深度学习:60分钟快速入门中文翻译版

新一代视频编码标准VVC和AVS3的进展及关键技术特色等介绍

本次我将从以下四个方面为大家分享有关最新一代VVC与AVS3视频编码标准的进展及关键技术特色等内容,....
的头像 LiveVideoStack 发表于 01-13 11:42 385次 阅读
新一代视频编码标准VVC和AVS3的进展及关键技术特色等介绍

探究深度学习在目标视觉检测中的应用与展望

目标视觉检测是计算机视觉领域的一个重要问题,在视频监控、自主驾驶、人机交互等方面具有重要的研究意义和....
的头像 人工智能学家 发表于 01-13 10:59 682次 阅读
探究深度学习在目标视觉检测中的应用与展望

STM32CubeMX将增加先进的人工智能AI功能

意法半导体借助STM32系列微控制器的市场领导地位,扩展了STM32微控制器开发生态系统STM32C....
的头像 嵌入式资讯精选 发表于 01-13 10:26 461次 阅读
STM32CubeMX将增加先进的人工智能AI功能

什么是机器学习?机器学习是如何工作的呢?

为了更清楚地理解机器学习的过程,我们将以开发能够识别手写数字的机器为具体例子来考虑模式识别的问题。这....
的头像 IEEE电气电子工程师学会 发表于 01-12 10:05 254次 阅读
什么是机器学习?机器学习是如何工作的呢?

通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义

最近研究人员们通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义,包括....
的头像 将门创投 发表于 01-12 09:48 270次 阅读
通过机器学习和深度学习的手段,成功的从老鼠的“吱吱”声中解读出20多种不同的含义

人工智能看脸识病 准确率达90%

约有8%的世界人口受到遗传综合征的困扰,此类患者往往具有可识别的面部特征。然而,遗传综合征的诊断过程....
的头像 1号机器人网 发表于 01-11 16:49 469次 阅读
人工智能看脸识病 准确率达90%

如何进行双侧空间窗的异常检测详细方法概述

针对现有异常检测方法难以解释异常属性的问题,本文提出基于双侧空间窗的异常检测方法。首先,在前景检测的....
发表于 01-11 15:17 23次 阅读
如何进行双侧空间窗的异常检测详细方法概述

三星存储器芯片和手机市场艰难主要有以下原因

1月8日,全球最大的芯片和智能手机制造商三星电子称,公司2018年最后三个月的营业利润为10.8万亿....
发表于 01-11 14:04 808次 阅读
三星存储器芯片和手机市场艰难主要有以下原因

tf.data API的功能和最佳实践操作

tf.data API 通过 tf.data.Dataset.prefetch 转换提供了一个软件 ....
的头像 TensorFlow 发表于 01-11 13:51 149次 阅读
tf.data API的功能和最佳实践操作

2019国家智能产业峰会智能驾驶平行论坛在青岛成功召开

智能网联汽车已成为世界各国解决日益严峻的道路交通安全、提升交通效率、提高汽车行业环保的重要途径,美欧....
的头像 智车科技 发表于 01-11 13:36 487次 阅读
2019国家智能产业峰会智能驾驶平行论坛在青岛成功召开

如何解决聊天机器人中用户就医意图识别方法

传统的聊天机器人中用户意图识别一般采用基于模板匹配或人工特征集合等方法,针对其费时费力而且扩展性不强....
发表于 01-11 11:51 33次 阅读
如何解决聊天机器人中用户就医意图识别方法

2019年存储产业下滑的最大因素

相较于稳定的DRAM产业,NANDFlash产业则明显惨烈的许多,在各家64层堆栈的3D-NAND ....
的头像 CINNO 发表于 01-11 11:47 506次 阅读
2019年存储产业下滑的最大因素

晋华在美力争摆脱禁运清单

国内自主存储DRAM技术阵营“福建晋华案”持续发酵,美方提出可能最高超过200亿美元的罚金,成为全球....
的头像 DIGITIMES 发表于 01-11 10:00 473次 阅读
晋华在美力争摆脱禁运清单

6678开发板DDR3布线约束的问题

大家好, 为了能够leveling成功,DDR3的布线约束需要规定到每一片DRAM的CLK长度与DQS长度差值不能超过一定范围。 ...
发表于 01-02 15:21 122次 阅读
6678开发板DDR3布线约束的问题

主流深度学习框架比较

DL:主流深度学习框架多个方向PK比较
发表于 12-26 11:10 105次 阅读
主流深度学习框架比较

Win10系统进行深度学习时系统C盘满了,正确卸载一些非必要的内容的方法

C盘:当Win10系统进行深度学习的时候发现系统C盘满了,大神教你如何正确卸载一些非必要的内容——Jason niu...
发表于 12-26 10:45 89次 阅读
Win10系统进行深度学习时系统C盘满了,正确卸载一些非必要的内容的方法

神经网络DNN知识点总结

DNN:关于神经网络DNN的知识点总结(持续更新)
发表于 12-26 10:41 82次 阅读
神经网络DNN知识点总结

神经网络初始化方法Xavier

Paper之DL之BP:《Understanding the difficulty of training deep feedforward neural networks》...
发表于 12-25 17:23 81次 阅读
神经网络初始化方法Xavier

深度学习框架TensorFlow&TensorFlow-GPU详解

TensorFlow&TensorFlow-GPU:深度学习框架TensorFlow&TensorFlow-GPU的简介、安装、使用方法详细攻略...
发表于 12-25 17:21 146次 阅读
深度学习框架TensorFlow&TensorFlow-GPU详解

想测试一个MT48LC16M16A2 SYNCHRONOUS DRAM

大家好,我想测试MT48LC16M16A2 SYNCHRONOUS DRAM。 知识? 关于JR 以上来自于谷歌翻译 &nbs...
发表于 12-24 17:00 48次 阅读
想测试一个MT48LC16M16A2 SYNCHRONOUS DRAM

计算机视觉神经网络资料全集

CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录(第二次)——Jason niu...
发表于 12-24 11:52 138次 阅读
计算机视觉神经网络资料全集

计算机视觉神经网络资料全集

CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录(第二次)——Jason niu...
发表于 12-24 11:52 138次 阅读
计算机视觉神经网络资料全集