深度学习在图像识别领域的四大方向

智车科技 2018-12-01 08:54 次阅读
在计算机视觉领域,图像识别这几年的发展突飞猛进。例如,在PASCAL VOC物体检测基准测试中,检测器的性能从平均准确率30%飙升到了今天的超过90%。对于图像分类,在极具挑战性的ImageNet数据集上,目前先进算法的表现甚至超过了人类。 图像识别技术的高价值应用就发生在你我身边,例如视频监控、自动驾驶和智能医疗等,而这些图像识别最新进展的背后推动力是深度学习。深度学习的成功主要得益于三个方面:大规模数据集的产生、强有力的模型的发展以及可用的大量计算资源。对于各种各样的图像识别任务,精心设计的深度神经网络已经远远超越了以前那些基于人工设计的图像特征的方法。 尽管到目前为止深度学习在图像识别方面已经取得了巨大成功,但在它进一步广泛应用之前,仍然有很多挑战需要我们去面对。与此同时,我们也看到了很多具有未来价值的研究方向。 挑战一:如何提高模型的泛化能力 图像识别技术在可以被广泛应用之前,一个重要的挑战是,怎样才能知道一个模型对未曾出现过的场景仍然具有很好的泛化能力。 在目前的实践中,数据集被随机划分为训练集和测试集,模型也相应地在这个数据集上被训练和评估。需要注意的是,在这种做法中,测试集拥有和训练集一样的数据分布,因为它们都是从具有相似场景内容和成像条件的数据中采样得到的。 然而,在实际应用中,测试图像或许会来自不同于训练时的数据分布。这些未曾出现过的数据可能会在视角、大小尺度、场景配置、相机属性等方面与训练数据不同。 一项研究表明,数据分布上的这种差异会导致各种深度网络模型的准确率产生明显的下降 。当前模型对数据分布自然变化的敏感性可能成为自动驾驶等关键应用的一个严重问题。 挑战二:如何利用小规模和超大规模数据 我们需要面对的另一个重要的挑战是如何更好地利用小规模训练数据。虽然深度学习通过利用大量标注数据在各种任务中都取得了巨大的成功,但现有的技术通常会因为只有很少的标记实例可用而在小数据情景中崩溃。这个情景通常被称为“少样本学习(few-shot learning)”,并需要在实际应用中仔细考虑。例如,一个家庭机器人被期望可以完成这样的任务:向它展示一个新物体,且只展示一次,之后它便可以识别这个物体。一个人可以很自然地完成这个任务,即使这个物体之后又被操作过了,例如一个毛毯被折叠起来了。如何赋予神经网络像人类这样的泛化能力是一个开放的研究问题。 另一个极端是如何利用超大规模数据有效地提高识别算法的性能。对于像自动驾驶这样的关键应用,图像识别的出错成本非常高。因此,研究者们创造出了非常庞大的数据集,这些数据集包含了数以亿计的带有丰富标注的图像,并且他们希望通过利用这些数据使模型的准确度得到显著提高。 然而,目前的算法并不能很好地利用这种超大规模数据 。在包含了3亿张标注图片的JFT数据集上,各种深度网络的性能随着训练数据量的增加,仅仅呈现出对数级的提高(图一)。在大规模数据的情况下,继续增加训练数据带来的收益会变得越来越不明显,这是一个有待解决的重要问题。 一  目标检测在JFT-300M数据集上的性能随训练样例的增多呈对数倍的提高。x轴是对数尺度下的数据大小。y轴是目标检测的性能。左图使用COCO minival测试集上的mAP@[0.5,0.95]  指标,右图使用PASCAL VOC 2007测试集上的mAP@0.5指标 。红蓝两条曲线分别代表两种不同的模型。 挑战三:全面的场景理解 除了这些与训练数据和泛化能力相关的问题外,还有一个重要的研究课题是全面的场景理解。除了识别和定位场景中的物体之外,人类还可以推断物体和物体之间的关系、部分到整体的层次、物体的属性和三维场景布局。 获得对场景的更广泛的理解将会帮助例如机器人交互这样的应用,因为这些应用通常需要物体标识和位置以外的信息。这个任务不仅涉及到对场景的感知,而且还需要对现实世界的认知理解。要实现这一目标,我们还有很长的路要走。全面的场景理解的一个例子为全景分割,见图二。 图二 (a)原图;(b)语义分割:识别天空、草地、道路等没有固定形状的不可数材质(stuff),标记方法通常是给每个像素加上标签 ;(c)实例分割:分割人、动物或工具等可数且独立的物体实例(object instance),通常用包围盒或分割掩码标记目标;(d)全景分割:生成统一的、全局的分割图像,既识别材质,也识别物体。 挑战四:自动化网络设计 最后一个值得一提的挑战是使网络设计自动化。近年来,图像识别这一领域的重心从设计更好的特征转向了设计更新的网络架构。然而,设计网络架构是一个冗长乏味的过程,它需要处理大量的超参数和设计选择。调优这些元素需要有经验的工程师花费大量的时间和精力。 更重要的是,一个任务的最优架构和另一个任务的最优架构可能是完全不同的。尽管我们对自动神经架构搜索的研究已经开始了,但它们仍然处于早期阶段并且仅适用于图像分类任务。当前方法的搜索空间非常狭窄,因为它们寻找的是现有网络模块的局部最优组合(例如深度可分离卷积和恒等连接),并且无法发现新的模块。目前还不清楚这些现有的方法是否足以胜任更复杂的任务。 图三 神经架构搜索算法的抽象图解。搜索策略首先从事先定义好的搜索空间中选择一个架构A,这个构架接着被评估策略进行评估,并将评估的A的性能传递给搜索策略 。 尽管在图像识别领域存在上述诸多挑战,但我们仍然相信深度学习在图像识别领域的巨大潜力。解决这些问题的机会比比皆是,下面我们看看这其中的几个研究方向: 方向一:整合常识 图像识别领域有一个重要的研究方向是将常识融入到深度学习中。目前,深度学习主要作为一种纯粹的数据驱动技术被使用。在深度学习中,神经网络利用训练集中的标注样本学习一个非线性函数,之后在测试时则将这个学习到的函数作用到图片像素上。训练集之外的信息则一点也没有被用到。 相比之下,人类识别物体不仅基于已经看到的样本,还基于他们有关真实世界的常识。人们能够对他们所看到的东西进行推理,以避免不合逻辑的识别结果。此外,当遇到新的或超出预期的东西时,人类可以迅速调整他们的知识来解释这次的新经历。如何在深度网络中获取、表示常识以及利用常识进行推理是一个挑战。 方向二:几何推理 联合执行图像识别和几何推理则是另一个有潜力的方向。图像识别的主要模型只考虑了二维外观,而人类可以感知三维场景布局以及推断其内在的语义类别。三维布局不仅可以从双目视觉中获得,还可以从二维输入的几何推理中得到,就像人们看照片时所做的那样。联合图像识别和几何推理为双方都提供了好处。 从几何推理中确定的三维布局可以帮助在看不见的视角、变形和外观的情况下引导识别。它还可以消除不合理的语义布局,并帮助识别由其三维形状或功能定义的类别。例如,沙发中存在着巨大的类内外观差异。然而,它们拥有共同的属性,可以帮助识别它们。比如它们都有一个水平面用来坐,一个背面用于支撑。另一方面,识别出来的语义可以规范化几何推理的解空间。例如,如果一只狗在一个场景中被识别,它相应的三维结构应该符合狗的三维形状模型。 图四 从视频的两个不同视角的帧重建出复杂动态场景的点云  方向三:对关系建模 关系建模也有很大的研究潜力。想要全面理解一个场景,对场景中存在的目标实体之间的关系和相互作用的建模非常重要(图四)。考虑两张图片,每个图片都包含一个人和一匹马。如果一张展示的是骑着马的人,另一张展示的是踩着人的马,显然这两张图片表达了完全不同的意思。此外,通过关系建模提取的底层场景结构可以帮助补偿当前深度学习方法因数据有限而出现的模糊不确定等问题。尽管人们已经在努力解决关系建模这个问题,但这项研究仍然是初步的,并且还有很大的探索空间。 图五 目标检测中的关系网络。表示物体的外表特征,表示物体的几何特征  方向四:学习如何学习 这里还有一个值得一提的方向是元学习,它的目标是学习学习过程。这个课题最近引起了相当多的关注,而且神经架构搜索也可以被认为是它的一种应用。 然而,由于目前对学习过程建模的机制、表示和算法还比较初级,元学习的研究仍处于早期阶段。以神经架构搜索为例,它只局限于现有网络模块的简单组合。元学习者无法捕捉到创作新网络模块所需的微妙的直觉和敏锐的洞察力。随着元学习的进步,自动架构设计的潜力可能会被完全释放出来,进而得到远超手工设计的网络结构。 图六 元学习近期的进展。自左至右分别为元学习的超参数优化 、神经架构搜索 、少样本图像分类 。 这是一个激动人心的从事图像识别的时代,一个充满了推动领域发展、影响未来应用的机会时代。我们热切盼望即将到来的进步,并期待这些新技术以深刻而神奇的方式改变我们的生活。
原文标题:图像识别的未来:机遇与挑战并存 文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

传统社交数据爆发式增长 Facebook AI实验室利用AI技术5年逆袭

“没有深度学习,现在的Facebook就无法正常运营,因为它已经深入到Facebook的方方面面了。....
发表于 12-10 14:45 17次 阅读
传统社交数据爆发式增长 Facebook AI实验室利用AI技术5年逆袭

分析医疗大数据未来发展过程中的主要挑战和趋势

在数据存储、加工、分析等中游环节,以云存储、云计算为代表的云技术,为医疗大数据价值挖掘提供了基础性技....
的头像 通信信号处理研究所 发表于 12-10 14:31 135次 阅读
分析医疗大数据未来发展过程中的主要挑战和趋势

PyTorch 1.0 稳定版终于正式发布了!

PyTorch 1.0 提供了两种方法使现有代码与 JIT 兼容的方法,torch.jit.trac....
的头像 新智元 发表于 12-10 09:44 110次 阅读
PyTorch 1.0 稳定版终于正式发布了!

2018年深度学习预测的回顾,目的是量化深度学习的快速发展

我现在开始认为,无监督学习和元学习实际上是同一个问题。进化解决这个问题的方法是通过踏脚石(stepp....
的头像 新智元 发表于 12-10 09:31 140次 阅读
2018年深度学习预测的回顾,目的是量化深度学习的快速发展

人工智能明年的五个重要发展方向的预测概述

今年,人工智能这个话题依旧火热,尤其是机器学习和深度学习,并且在接下来的一年我们相信这种关注度依旧不....
的头像 高工智能未来 发表于 12-08 10:34 469次 阅读
人工智能明年的五个重要发展方向的预测概述

人工智能技术在电力系统中的应用现状和发展方向

随着人工智能技术的兴起,人工智能技术应用在电力系统的运行、控制、管理等领域。人工智能技术在电力系统中....
的头像 集成电路应用杂志 发表于 12-08 10:29 553次 阅读
人工智能技术在电力系统中的应用现状和发展方向

NVIDIA迁移学习工具包 :用于特定领域深度学习模型快速训练的高级SDK

对于设计和集成智能视频分析(IVA)端应用程序(如停车管理、安全基础设施、零售分析、物流管理和访问控....
的头像 中国人工智能学会 发表于 12-07 14:45 236次 阅读
NVIDIA迁移学习工具包 :用于特定领域深度学习模型快速训练的高级SDK

TensorFlow Extended如何帮助开发者快速落地项目

TensorFlow Extended 可以分为四个部分。我们知道在机器学习中,有人工智能、机器学习....
的头像 TensorFlow 发表于 12-07 11:05 309次 阅读
TensorFlow Extended如何帮助开发者快速落地项目

一种基于点云的Voxel(三维体素)特征的深度学习方法

特征学习网络的结构如下图所示,包括体素分块(Voxel Partition),点云分组(Groupi....
的头像 电子发烧友网工程师 发表于 12-07 09:32 233次 阅读
一种基于点云的Voxel(三维体素)特征的深度学习方法

深度学习遭批判 AI未来如何发展

在刚刚结束的CCF-GAIR大会上,来自清华、加州大学伯克利、斯坦福、哈工大等多所国内外顶级理工科院....
的头像 悟空智能科技 发表于 12-07 09:09 389次 阅读
深度学习遭批判 AI未来如何发展

卷积神经网络的权值反向传播机制和MATLAB的实现方法

深度学习是多层神经网络运用各种学习算法解决图像、文本等相关问题的算法合集。卷积神经网络作为深度学习的....
发表于 12-06 15:29 34次 阅读
卷积神经网络的权值反向传播机制和MATLAB的实现方法

利用深度学习的方法得到了一种能够最大化非线性计算成像系统的实验设计

同时可将显微镜的照相光源替换为可编程的LED阵列,在不同LED照明模式下的成像将会把样本的相位信息(....
的头像 将门创投 发表于 12-06 10:27 235次 阅读
利用深度学习的方法得到了一种能够最大化非线性计算成像系统的实验设计

NeurIPS 2018最佳论文公布,4篇最佳论文中有一篇一作是陈天琦

根据大会主席在Opening Remarks透露,本届会议参会(注册)人数直逼9000人大关,投稿超....
的头像 新智元 发表于 12-06 09:46 545次 阅读
NeurIPS 2018最佳论文公布,4篇最佳论文中有一篇一作是陈天琦

DeepMind推出的AI工具AlphaFold以优异成绩碾压了人类专家

预测“蛋白质折叠”的结构,对科学家来说是很有用的,可以通过这种方式了解蛋白质在人体内的作用,对阿尔茨....
的头像 新智元 发表于 12-06 09:36 309次 阅读
DeepMind推出的AI工具AlphaFold以优异成绩碾压了人类专家

智擎信息:利用深度学习预警工业设备故障,将隐患遏止于萌芽

如今,智策平台已经在多个类型的制造业企业落地应用。以风电行业为例,通过大数据技术,基于风机的海量历史....
的头像 英伟达NVIDIA企业解决方案 发表于 12-05 16:30 1086次 阅读
智擎信息:利用深度学习预警工业设备故障,将隐患遏止于萌芽

1360亿美元!亚太地区AI市场规模于2025年或将实现全球领先

Tractica的分析表明,亚太地区的人工智能市场,包括软件、硬件和服务,将从2017年的60亿美元....
的头像 e星球 发表于 12-05 16:17 1344次 阅读
1360亿美元!亚太地区AI市场规模于2025年或将实现全球领先

视频分析以及数据处理能力技术的提升正在重塑这一市场

测速设备现在能提供比以往更多的功能,诸如车辆人员安全带检测、摩托车驾驶人员头盔检测等,它们通过机器学....
的头像 安全自动化 发表于 12-05 15:30 445次 阅读
视频分析以及数据处理能力技术的提升正在重塑这一市场

如何为实时音视频设计小且优的深度学习模型?

超分是我们后处理的一步,作为跟前面的处理不相关的一个处理,这一步放在最后。视频源经过编码在网络上传输....
的头像 声网Agora 发表于 12-05 15:16 652次 阅读
如何为实时音视频设计小且优的深度学习模型?

借助摄影测量方法以及GPU赋力的深度学习

如果不去除陵墓中的现代人工痕迹,就不可能参观到“真正”的古墓。为了实现这一目标,realityvir....
的头像 英伟达NVIDIA企业解决方案 发表于 12-05 13:35 269次 阅读
借助摄影测量方法以及GPU赋力的深度学习

深度学习给人工智能以璀璨的未来

深度学习是机器学习的一种形式,所采用的神经网络在输入节点和输出节点之间具有许多“深度”层。
的头像 传感器技术 发表于 12-04 15:46 321次 阅读
深度学习给人工智能以璀璨的未来

Phiar获得300万美元种子轮融资,推出AR+AI导航解决方案

据悉,Phiar于2017年6月在美国加利福尼亚州的帕洛阿尔托成立,在今年初加入Y Combinat....
的头像 VR陀螺 发表于 12-04 09:57 452次 阅读
Phiar获得300万美元种子轮融资,推出AR+AI导航解决方案

NIPS 2018 AutoML挑战赛公布了最终结果,清华大学计算机系朱文武团队斩获第二,高校排名雄踞第一!

首先是宏观方法论层面的平衡。AutoML比赛和传统的数据挖掘比赛有很多相似之处,但也有本质的不同。相....
的头像 新智元 发表于 12-04 09:21 512次 阅读
NIPS 2018 AutoML挑战赛公布了最终结果,清华大学计算机系朱文武团队斩获第二,高校排名雄踞第一!

23位顶尖AI专家预测:通用人工智能可能在2099年实现

从调查结果看,对这个问题的态度和年龄之间可能存在一些相关性。福特指出,有些接受采访的研究人员已经70....
的头像 新智元 发表于 12-04 09:04 715次 阅读
23位顶尖AI专家预测:通用人工智能可能在2099年实现

TensorFlow的30个主要功能总结

TensorFlow 是目前最流行的深度学习库,它是 Google 开源的一款人工智能学习系统。
的头像 人工智能 发表于 12-03 16:41 491次 阅读
TensorFlow的30个主要功能总结

半定制化的FPGA芯片和全定制化的ASIC芯片

目前以深度学习为代表的人工智能计算需求,主要采用 GPU、FPGA 等已有的适合并行计算的通用芯片来....
的头像 智车科技 发表于 12-03 11:14 372次 阅读
半定制化的FPGA芯片和全定制化的ASIC芯片

华为云刷新深度学习加速纪录

华为云ModelArts在国际权威的深度学习模型基准测试平台斯坦福DAWNBenchmark上取得了....
的头像 人工智能 发表于 12-03 10:29 494次 阅读
华为云刷新深度学习加速纪录

AGI(通用人工智能)和深度学习之间的关系

Gary Marcus 在纽约大学教授心理学和神经科学,这使他成为人工智能方面的专家。他写过一篇严厉....
的头像 新智元 发表于 12-03 09:30 364次 阅读
AGI(通用人工智能)和深度学习之间的关系

AI起航 协助多项领域落地

人工智能热潮由深度学习技术推动,如今智能客服、语音识别等领域已经与商业场景应用相结合,赋能各个行业,....
的头像 人间烟火123 发表于 12-02 10:29 1005次 阅读
AI起航 协助多项领域落地

深度学习陷困境_人工智能遇瓶颈

现在,深度学习面临着无法进行推理的困境,这也就意味着,它无法让机器具备像人一样的智能。但是真正的推理....
的头像 悟空智能科技 发表于 12-01 09:41 406次 阅读
深度学习陷困境_人工智能遇瓶颈

深度学习面临着无法进行推理的困境

那时,深度学习背后的策略和现在是一样的。比方说,你想要一台机器来自己学习识别雏菊。首先,你需要编写一....
的头像 机器人大讲堂 发表于 11-30 15:19 364次 阅读
深度学习面临着无法进行推理的困境

智能植物识别软件让你轻松变成农作物达人

通过深度学习算法,生物学家戴维·休斯和作物流行病学家马塞尔·萨拉斯将关于植物叶子的5万多张照片导入计....
的头像 机器人博览 发表于 11-30 15:03 543次 阅读
智能植物识别软件让你轻松变成农作物达人

基于深度学习的CTR模型包DeepCTR

对于刚接触这方面的同学来说,可能对这些方法的细节还不太了解,虽然网上有很多介绍,但是代码却没有统一的....
的头像 人工智能头条 发表于 11-30 14:47 237次 阅读
基于深度学习的CTR模型包DeepCTR

一份CS230课程知识点的归纳总结,在Reddit上引发热议

Anchor boxing是一种用于预测重叠边界框的技术。在实际应用中,网络可以同时预测多个box,....
的头像 新智元 发表于 11-30 08:49 358次 阅读
一份CS230课程知识点的归纳总结,在Reddit上引发热议

扇贝是如何实现深度追踪模型并运用到英语学习者词汇水平评估中去

基于先前大量线上词汇量测试记录,我们的总序列数量已经累积到千万级别,这为使用深度学习模型提供了坚实的....
的头像 TensorFlow 发表于 11-29 17:36 651次 阅读
扇贝是如何实现深度追踪模型并运用到英语学习者词汇水平评估中去

清华刘洋与邓力合著一书系统介绍深度学习在NLP常见问题中的应用

本书提供了深度学习在自然语言处理中的一个全面介绍。它由一群经验丰富的深度学习和自然语言处理专家写成,....
的头像 悟空智能科技 发表于 11-29 16:57 299次 阅读
清华刘洋与邓力合著一书系统介绍深度学习在NLP常见问题中的应用

将深度学习用于这些影像进行识别和区分,以便快速的筛查出病症的细微信息

为了研究提取帧的特征空间,研究人员用重建损失训练了一个无监督卷积自动编码器。自动编码器由编码器和解码....
的头像 将门创投 发表于 11-29 10:30 529次 阅读
将深度学习用于这些影像进行识别和区分,以便快速的筛查出病症的细微信息

阿里巴巴首次公开深度学习框架——X-Deep Learning

阿里巴巴首次公开深度学习框架——X-Deep Learning,可提升广告、推荐、搜索场景效率XDL....
的头像 电子发烧友网工程师 发表于 11-29 10:02 514次 阅读
阿里巴巴首次公开深度学习框架——X-Deep Learning

从四个方面详细解析自动驾驶感知环节

自动驾驶感知的实现需要软硬件结合,本文从传感器和算法的角度带大家来了解一下自动驾驶的感知。
的头像 智车科技 发表于 11-29 09:41 681次 阅读
从四个方面详细解析自动驾驶感知环节

阿里巴巴最具商业价值的深度学习框架X-Deep Learning要开源了

对于难以与BAT研发能力比肩的众多互联网公司而言,工业级深度学习框架XDL及内置算法方案的开源,将助....
的头像 新智元 发表于 11-29 09:29 416次 阅读
阿里巴巴最具商业价值的深度学习框架X-Deep Learning要开源了

专访Keras之父:从何开始对深度学习感兴趣、Keras的创建背后的动机

我研究人工智能已经有很长一段时间了,但在我还是学生时,我对学习视觉感知的层叠、模块化、层次化表示的这....
的头像 人工智能 发表于 11-28 17:30 718次 阅读
专访Keras之父:从何开始对深度学习感兴趣、Keras的创建背后的动机

波多黎各一项研究有望通过深度学习大大地降低蚊子给人类带来的致命威胁

自从去年飓风“玛利亚”重创波多黎各之后,Wovenware 的这一项目的重要性显得尤其突出。飓风之后....
的头像 英伟达NVIDIA企业解决方案 发表于 11-28 11:50 558次 阅读
波多黎各一项研究有望通过深度学习大大地降低蚊子给人类带来的致命威胁

八大现象论证人工智能威胁论真的存在AI警告!

深度学习于2011年开始流行,在语音和计算机视觉方面塑造了创世纪的模式。如今,已经有足够的论证证明专....
的头像 Thundersoft中科创达 发表于 11-28 11:25 622次 阅读
八大现象论证人工智能威胁论真的存在AI警告!

无人驾驶汽车最新消息:苹果坚持自主系统 深度学习使得摄像头具备3D能力

在苹果宣布停止公布手机销量,以富士康和和硕为代表的供应商下调新款iPhone销售预期,市场一致看衰的....
发表于 11-26 16:51 1139次 阅读
无人驾驶汽车最新消息:苹果坚持自主系统 深度学习使得摄像头具备3D能力

使用Google TPU v3 Pod训练ResNet-50,在识别率没有降低的情况下2分钟搞定ImageNet训练

训练模型过程中,输入管道包括了数据读取、数据分析、预处理、旋转和批量化等操作。如果输入管道的吞吐量不....
的头像 新智元 发表于 11-26 09:30 271次 阅读
使用Google TPU v3 Pod训练ResNet-50,在识别率没有降低的情况下2分钟搞定ImageNet训练

深度学习在各个领域有什么样的作用深度学习网络的使用示例分析

深度学习网络作为一个功能多样的工具,虽然最初仅用于图像分析,但它已逐渐被应用到各种不同的任务和领域中....
的头像 智车科技 发表于 11-25 11:41 600次 阅读
深度学习在各个领域有什么样的作用深度学习网络的使用示例分析

利用深度学习来帮助眼科医生和验光师进一步检测眼部图像的新方法

在最近的一篇论文中,研究人员详细介绍了一种新的深度学习框架,该框架直接从原始光学相干断层扫描(OCT....
的头像 将门创投 发表于 11-24 10:53 581次 阅读
利用深度学习来帮助眼科医生和验光师进一步检测眼部图像的新方法

在不使用任何额外数据的情况下,COCO数据集上物体检测结果为50.9 AP的方法

实验中,我们发现当只使用 COCO 数据集时,从头开始训练的模型性能是能够匹配预训练模型的性能。我们....
的头像 电子发烧友网工程师 发表于 11-24 10:42 384次 阅读
在不使用任何额外数据的情况下,COCO数据集上物体检测结果为50.9 AP的方法

中国大陆高校AI实力到底如何?

近年来,深度学习技术广泛应用于自然语言处理,不仅在文本分类、序列标注、机器翻译和自动问答等许多任务中....
的头像 电子发烧友网工程师 发表于 11-24 10:38 5040次 阅读
中国大陆高校AI实力到底如何?

何恺明、Ross Girshick等大神深夜扔出“炸弹”:ImageNet预训练并非必须

ImageNet预训练方式加快了收敛速度,特别是在训练早期,但随机初始化训练可以在训练一段时间后赶上....
的头像 新智元 发表于 11-24 10:09 354次 阅读
何恺明、Ross Girshick等大神深夜扔出“炸弹”:ImageNet预训练并非必须

如何使用布谷鸟搜索和深度信念网络提出一个肺部肿瘤图像识别算法

针对深度信念网络(DBN)权值随机初始化易使网络陷入局部最优的问题,在传统DBN模型中引入布谷鸟搜索....
发表于 11-23 19:17 56次 阅读
如何使用布谷鸟搜索和深度信念网络提出一个肺部肿瘤图像识别算法

图像识别技术在印刷线路板精密测试中的应用

  0 引言   随着信息产业和电子技术的发展,PCB(PrintedCircuit Board)线路板的制造技术得到了发展。传统光学显微镜目...
发表于 11-22 11:01 79次 阅读
图像识别技术在印刷线路板精密测试中的应用

CNN之卷积层

前言 卷积神经网络在深度学习领域是一个很重要的概念,是入门深度学习必须搞懂的内容。 CNN图像识别的关键——卷积 当...
发表于 10-17 10:15 206次 阅读
CNN之卷积层

高通Vuforia SDK 2.8的Extended Tracking功能

高通Vuforia SDK 2.8已经正式推出了,此次SDK更新的亮点:增加Extended Tracking功能,即使目标离开视野仍能继续进行图...
发表于 09-20 10:13 238次 阅读
高通Vuforia SDK 2.8的Extended Tracking功能

刚开始进行深度学习的同学怎么选择合适的机器配置

怎么为自己的深度学习机器选择合适的GPU配置呢?对于那些一直想进行深度学习研究的同学来说,一直是个比较纠结的问题,既要考...
发表于 09-19 13:56 512次 阅读
刚开始进行深度学习的同学怎么选择合适的机器配置

天睿视迅深度学习 nvidia tk1 开发板

产品概述:Tir-TK1V200是基于NVIDIA CD575M开发的一款AI深度学习模块。其NVIDIA处理器带有4+1的ARM Co...
发表于 09-17 16:42 487次 阅读
天睿视迅深度学习 nvidia tk1 开发板

深度学习神经网络海思Hi3559A硬件AI盒子

深度学习_神经网络_海思Hi3559A硬件AI盒子 ...
发表于 09-11 09:56 853次 阅读
深度学习神经网络海思Hi3559A硬件AI盒子

M60可以用于深度学习

我已经获准使用M60,并希望对人工智能进行一些培训,我知道它主要针对的是GRID& vGPU,但我在许可pdf中注意到它提...
发表于 09-06 09:56 525次 阅读
M60可以用于深度学习

人工智能深度学习发展迅速,智能科技公司都已经涉足人工智能产品的研发!

深度学习(Deep Learning)核心技术开发与应用 1,Deep Learning—循环神经网络         ...
发表于 09-05 10:22 464次 阅读
人工智能深度学习发展迅速,智能科技公司都已经涉足人工智能产品的研发!

计算机视觉/深度学习领域常用数据集汇总

深度学习领域的“Hello World!”,入门必备!MNIST是一个手写数字数据库,它有60000个训练样本集和10000个测试样本集,...
发表于 08-29 10:36 478次 阅读
计算机视觉/深度学习领域常用数据集汇总

人工智能和机器学习的前世今生

摘要: 阅读本文以了解更多关于人工智能、机器学习和深度学习方面的知识,以及它们对商业化意味着什么。 如果正确的利用模式识...
发表于 08-27 10:16 466次 阅读
人工智能和机器学习的前世今生