【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

基于深度学习模型的点云目标检测及ROS实现

2018-11-05 16:47 次阅读
近年来,随着深度学习在图像视觉领域的发展,一类基于单纯的深度学习模型的点云目标检测方法被提出和应用,本文将详细介绍其中一种模型——SqueezeSeg,并且使用ROS实现该模型的实时目标检测。 传统方法VS深度学习方法 实际上,在深度学习方法出现之前,基于点云的目标检测已经有一套比较成熟的处理流程:分割地面->点云聚类->特征提取->分类,典型的方法可以参考Velodyne的这篇论文:LIDAR-based 3D Object Perception ▌那么传统方法存在哪些问题呢? 1.第一步的地面分割通常依赖于人为设计的特征和规则,如设置一些阈值、表面法线等,泛化能力差; 2.多阶段的处理流程意味着可能产生复合型错误——聚类和分类并没有建立在一定的上下文基础上,目标周围的环境信息缺失; 3.这类方法对于单帧激光雷达扫描的计算时间和精度是不稳定的,这和自动驾驶场景下的安全性要求(稳定,小方差)相悖。 因此,近年来不少基于深度学习的点云目标检测方法被提出,本文介绍的SqueezeSeg就是其中一种,这类方法使用深度神经网络提取点云特征,以接近于端到端的处理流程实现点云中的目标检测。 论文:SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud,  https://arxiv.org/pdf/1710.07368.pdf SqueezeSeg理论部分 ▌概括 SqueezeSeg使用的是CNN(卷积神经网络)+CRF(Conditional Random Field,条件随机场)这样的结构。 其中,CNN采用的是Forrest提出的SqueezeNet网络(详情见论文:“SqueezeNet: Alexnet-level accuracy with 50x fewer parameters and < 0.5mb model size”, https://arxiv.org/pdf/1602.07360.pdf ), 该网络使用远少于AlexNet的参数数量便达到了等同于AlexNet的精度,极少的参数意味着更快的运算速度和小的内存消耗,这是符合车载场景需求的。 被预处理过的点云数据(二维化)将被以张量的形式输入到这个CNN中,CNN输出一个同等宽高的标签映射(label map),实际上就是对每一个像素进行了分类,然而单纯的CNN逐像素分类结果会出现边界模糊的问题,为解决该问题,CNN输出的标签映射被输入到一个CRF中,这个CRF的形式为一个RNN,其作用是进一步的矫正CNN输出的标签映射。最终的检测结果论文中使用了DBSCAN算法进行了一次聚类,从而得到检测的目标实体。 下面我们从预处理出发,首先理解这一点云目标检测方法。 ▌点云预处理 传统的CNN设计多用于二维的图像模式识别(宽 × \times× 高 × \times× 通道数),三维的点云数据格式不符合该模式,而且点云数据稀疏无规律,这对特征提取都是不利的,因此,在将数据输入到CNN之前,首先对数据进行球面投影,从而到一个稠密的、二维的数据,球面投影示意图如下: 其中,ϕ和θ分别表示点的方位角(azimuth)和顶角(altitude),这两个角如下图所示: 通常来说,方位角是相对于正北方向的夹角,但是,在我们Lidar的坐标系下,方位角为相对于x方向(车辆正前方)的夹角,ϕ和θ的计算公式为: 其中,(x,y,z) 为三维点云中每一个点的坐标。所以对于点云中的每一个点都可以通过其 (x,y,z) 计算其 (θ,ϕ)  ,也就是说我们将三维空间坐标系中的点都投射到了一个球面坐标系,这个球面坐标系实则已经是一个二维坐标系了,但是,为了便于理解,我们对其角度进行微分化从而得到一个二维的直角坐标系: 那么,球面坐标系下的每一个点都可以使用一个直角坐标系中的点表示,如下: 通过这么一层变换,我们就将三维空间中任意一点的位置(x,y,z) 投射到了2维坐标系下的一个点的位置 (i,j) 我们提取点云中每一个点的5个特征: (x,y,z,intensity,range) 放入对应的二维坐标 (i,j) 内。从而得到一个尺寸为 (H,W,C) 张量(其中C=5),由于论文使用的是Kitti的64线激光雷达,所以 H=64,水平方向上,受Kitti数据集标注范围的限制,原论文仅使用了正前方90度的Lidar扫描,使用512个网格对它们进行了划分(即水平上采样512个点)。所以,点云数据在输入到CNN中之前,数据被预处理成了一个尺寸为 (64×512×5)  的张量。 ▌CNN结构 SqueezeSeg的CNN部分几乎完全采用的SqueezeNet网络结构,SqueezeNet是一个参数量极少但是能够达到AlexNet精度的CNN网络,在对实时性有要求的点云分割应用场景中采用颇有意义。其网络结构如下: 该网络最大的特色为两个结构,被称为 fireModules 和 fireDeconvs,这两种网络层的具体结构如下: 由于输入的张量的高度(64)要小于其宽度(512),该网络主要对宽度进行降维,通过添加最大池化层(Max Pooling)降低数据的宽度。到Fire9输出的是降维后的特征映射。为了得到一个完整的映射标签,还需要对特征映射进行还原(即还原到原尺寸),conv14层的输出即对每个点的分类概率映射。输出最后被输入到一个条件随机场中进行进一步的矫正。 SqueezeSeg中采用的CRF 在深度学习技术不断进步的同时,概率图形模型已被开发为用于提高像素级标记任务准确性的有效方法。马尔可夫随机场(Markov Random Fields, MRF)及其变体——条件随机场(Conditional Random Fields, CRF)已经成为计算机视觉中最成功的概率图模型之一。 由于CNN网络的下采样层(如最大池化层)的存在,使得数据的一些底层细节在CNN被抛弃,近而造成CNN输出的预测分类存在边界模糊的问题。高精度的逐像素分类不仅依赖于高层特征,也受到底层细节信息的影响,细节信息对于标签分类的一致性至关重要。打个比方,如果点云中两个点相近,同时具有类似的强度值(intensity),那么它们就有可能属于同一个目标(即具有一样的分类)。 CRF推理应用于语义标记的关键思想是将标签分配(对于像素分割来说就是像素标签分配)问题表达为包含类似像素之间具有一定标签协议的假设的概率推理问题。CRF推理能够改进像素级标签预测,以产生清晰的边界和细粒度的分割。因此,CRF可用于克服利用CNN进行像素级标记任务的缺点。为了弥补下采样过程中细节信息的损失,SqueezeSeg在最后使用RNN实现一个CRF推理,以对label map进行进一步精炼,这里作者参考了论文: Conditional Random Fields as Recurrent Neural Networks ,该论文提出了mean-field 近似推理,以带有高斯pairwise的势函数的密集CRF作为RNN,在前向过程中对CNN粗糙的输出精细化,同时在训练时将误差返回给CNN。结合了CNN与RNN的模型可以正常的利用反向传播来端对端的训练。SqueezeSeg的CRF部分结构如下图所示: 我们将CNN的输出结果作为CRF的输入,根据原始点云计算高斯滤波器,其有两个高斯核,如下所示: 其中x为点的三维坐标 (x,y,z) ,p为点经过球面投影得到的方位角和顶角 (θ,ϕ),其他参数为经验性阈值。该高斯核衡量了两点之间特征的差异,两点之间差异越大( x xx 和 p pp 相差越多),高斯核的值就越小,两点之间的相关性也就越小。在输入图像使用该高斯滤波器的过程称为message passing,可以初步聚合邻域点的概率。接着,通过1x1大小的卷积核去微调每一个点的概率分布权重,这一个过程称为re-weighting and compatibilty transformation,卷积核的值是通过学习得到。最后,以残差方式将最初的便签映射加到re-weighting的输出结果并用softmax归一化。在实际操作中,整个CRF以RNN层重复循环三次,并得到最终精炼后的标签映射。 使用SqueezeSeg实现一个ROS节点进行点云目标识别与分割 SqueezeSeg的模型训练代码在本文中不在赘述,感兴趣的同学可以直接去看作者的开源代码: SqueezeSeg作者开源的模型训练代码: https://github.com/BichenWuUCB/SqueezeSeg 上面的代码为TensorFlow实现,基于上述仓库,我们实现一个ROS节点,调用一个已经训练好的SqueezeSeg模型,对输入的点云进行目标识别和分割。所以在运行下述实例代码之前,需要自行安装好TensorFlow-GPU版本(CPU版本亦可,但是运行速度相对要慢一些),本文假定大家已经安装好TensorFlow环境,我们来继续关注基于SqueezeSeg的ROS应用开发,我们采用论文作者公开的数据(来源于Kitti,采集自HDL-64雷达,同时已经完成了前向90度的切割,并且被保存成了npy文件)。 数据下载地址: https://www.dropbox.com/s/pnzgcitvppmwfuf/lidar_2d.tgz?dl=0  国内读者如无法访问,可以使用此地址下载: https://pan.baidu.com/s/1kxZxrjGHDmTt-9QRMd_kOA 将数据下载好以后解压到ROS package的 script/data/ 目录下,解压以后的目录结构为: squeezeseg_ros/script/data/lidar_2d/ 完整代码见文末github仓库。 采用作者开源的数据的一个很重要的原因在于手头没有64线的激光雷达,首先我们看看launch文件内容:                      npy_path参数即为我们的数据的目录,我们将其放在package的script/data目录下,npy_file_list是个文本文件的路径,它记录了验证集的文件名,pub_topic指定我们最后发布出去的结果的点云topic名称,checkpoint参数指定我们预先训练好的SqueezeSeg模型的目录,它是一个TensorFlow 的checkpoint文件,gpu参数指定使用主机的那一快GPU(即指定GPU的ID),通常我们只有一块GPU,所以这里设置为0,如果主机没有安装GPU(当然TensorFlow-gpu也就无法工作),则会使用CPU。squeezeseg_ros_node.py即为我们调用模型的接口,最后我们在启动Rviz,加载设定好的Rviz配置文件,即可将模型的识别结果可视化出来。 具体到squeezeseg_ros_node.py中,首先加载参数并且配置checkpoint路径: rospy.init_node('squeezeseg_ros_node')    npy_path = rospy.get_param('npy_path')    npy_file_list = rospy.get_param('npy_file_list')    pub_topic = rospy.get_param('pub_topic')    checkpoint = rospy.get_param('checkpoint')    gpu = rospy.get_param('gpu')    FLAGS = tf.app.flags.FLAGS    tf.app.flags.DEFINE_string(        'checkpoint', checkpoint,        """Path to the model paramter file.""")    tf.app.flags.DEFINE_string('gpu', gpu, """gpu id.""")    npy_tensorflow_to_ros = NPY_TENSORFLOW_TO_ROS(pub_topic=pub_topic,                                                  FLAGS=FLAGS,                                                  npy_path=npy_path,                                                  npy_file_list=npy_file_list) 循环读取npy数据文件,读取文件的代码如下: # Read all .npy data from lidar_2d folder    def get_npy_from_lidar_2d(self, npy_path, npy_file_list):        self.npy_path = npy_path        self.npy_file_list = open(npy_file_list, 'r').read().split('\n')        self.npy_files = []        for i in range(len(self.npy_file_list)):            self.npy_files.append(                self.npy_path + self.npy_file_list[i] + '.npy')        self.len_files = len(self.npy_files) 调用深度学习模型对点云进行分割和目标检测识别,并将检测出来的结果以PointCloud2的msg格式发到指定的topic上: # Read all .npy data from lidar_2d folder    def get_npy_from_lidar_2d(self, npy_path, npy_file_list):        self.npy_path = npy_path        self.npy_file_list = open(npy_file_list, 'r').read().split('\n')        self.npy_files = []        for i in range(len(self.npy_file_list)):            self.npy_files.append(                self.npy_path + self.npy_file_list[i] + '.npy')        self.len_files = len(self.npy_files)    def prediction_publish(self, idx):        clock = Clock()        record = np.load(os.path.join(self.npy_path, self.npy_files[idx]))        lidar = record[:, :, :5]        # to perform prediction        lidar_mask = np.reshape(            (lidar[:, :, 4] > 0),            [self._mc.ZENITH_LEVEL, self._mc.AZIMUTH_LEVEL, 1]        )        norm_lidar = (lidar - self._mc.INPUT_MEAN) / self._mc.INPUT_STD        pred_cls = self._session.run(            self._model.pred_cls,            feed_dict={                self._model.lidar_input: [norm_lidar],                self._model.keep_prob: 1.0,                self._model.lidar_mask: [lidar_mask]            }        )        label = pred_cls[0]        # point cloud for SqueezeSeg segments        x = lidar[:, :, 0].reshape(-1)        y = lidar[:, :, 1].reshape(-1)        z = lidar[:, :, 2].reshape(-1)        i = lidar[:, :, 3].reshape(-1)        label = label.reshape(-1)        cloud = np.stack((x, y, z, i, label))        header = Header()        header.stamp = rospy.Time().now()        header.frame_id = "velodyne_link"        # point cloud segments        msg_segment = self.create_cloud_xyzil32(header, cloud.T)        # publish        self._pub.publish(msg_segment)        rospy.loginfo("Point cloud processed. Took %.6f ms.",                      clock.takeRealTime()) 不同于一般的PointCloud2 msg,这里的每一个点除了包含x,y,z,intensity字段以外,还包含一个label字段(即分类的结果),构建5字段的PointCloud2 msg的代码如下: # create pc2_msg with 5 fields    def create_cloud_xyzil32(self, header, points):        fields = [PointField('x', 0, PointField.FLOAT32, 1),                  PointField('y', 4, PointField.FLOAT32, 1),                  PointField('z', 8, PointField.FLOAT32, 1),                  PointField('intensity', 12, PointField.FLOAT32, 1),                  PointField('label', 16, PointField.FLOAT32, 1)]        return pc2.create_cloud(header, fields, points) 使用launch文件启动节点: roslaunch squeezeseg_ros squeeze_seg_ros.launch 弹出Rviz界面,识别分割如下: 在我的 CPU:i7-8700 + GPU:GTX1070的环境下,处理一帧数据的耗时大约在50ms以内,如下: 对于semantic segmentationz这类任务而言,其速度已经比较可观了,通常雷达频率约为10HZ,该速度基本达到要求。
原文标题:无人驾驶汽车系统入门:基于深度学习的实时激光雷达点云目标检测及ROS实现 文章出处:【微信号:rgznai100,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

EdgeBoard终端计算加速方案可以应用在哪里

深度学习软硬一体化加速方案,具备模型剪枝&量化加速工具,能将原始模型性能提升 4 倍以上。高性能的加....
发表于 02-23 11:11 14次 阅读
 EdgeBoard终端计算加速方案可以应用在哪里

攀登深度学习之巅 对AI领域会产生什么深远影响

2018 年,由美国国家能源研究科学计算中心 (NERSC) 与 NVIDIA 组成的联合团队取得了....
的头像 TensorFlow 发表于 02-23 10:54 376次 阅读
攀登深度学习之巅 对AI领域会产生什么深远影响

深度学习中的各种卷积网络大家知多少

对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,这篇文章非常值得一读。Kunlun Bai 是....
的头像 人工智能学家 发表于 02-22 09:44 368次 阅读
深度学习中的各种卷积网络大家知多少

深度学习只是人类探索智能的历史上的一个插曲

时至今日,几乎你所有听到的关于 AI 的重要进展,背后都离不开深度学习。这类算法的工作原理是使用统计....
的头像 电子发烧友网工程师 发表于 02-22 09:16 329次 阅读
深度学习只是人类探索智能的历史上的一个插曲

盘点资本加速洗牌对人工智能行业的影响

自2017年以来,深度学习概念被再次提起,AI成为全球最炙手可热的行业。不论是从创业项目数量、融资金....
的头像 重庆人工智能 发表于 02-21 16:04 460次 阅读
盘点资本加速洗牌对人工智能行业的影响

MIT深度学习基础知识 编码器-解码器架构分析

本文以 7 种架构范例简要介绍深度学习,每种范例均提供 TensorFlow 教程链接。
的头像 TensorFlow 发表于 02-21 15:53 195次 阅读
MIT深度学习基础知识 编码器-解码器架构分析

深度学习可能需要比Python更灵活更易于用的新编程语言

尽管工程师们普遍定位 Python 是简单、优雅的编程语言,但它并非毫无缺点,比如人们一直吐槽它的执....
的头像 电子发烧友网工程师 发表于 02-21 10:23 324次 阅读
深度学习可能需要比Python更灵活更易于用的新编程语言

人工智能行业即将迎来寒冬

深度学习处于所谓的AI革命的前沿至今已有好几年;许多人过去认为,深度学习是神奇的“银弹”,会把我们带....
的头像 人工智能学家 发表于 02-20 14:48 521次 阅读
人工智能行业即将迎来寒冬

美国大学研发出拥有自主意识的机器人

美国哥伦比亚大学的研究团队发表了一项新成果:一个机器人(机械臂)有了“自我意识”。这项研究成果发表在....
的头像 机器人技术与应用 发表于 02-20 14:40 270次 阅读
美国大学研发出拥有自主意识的机器人

如何同时使用Nucleus与TensorFlow解决基因组学领域的机器学习问题

本文中阐述的两种方法均使用深度神经网络,学习将输入映射至输出的函数。神经网络由若干层线性与非线性运算....
的头像 TensorFlow 发表于 02-20 14:38 232次 阅读
如何同时使用Nucleus与TensorFlow解决基因组学领域的机器学习问题

从文本(数据)挖掘的角度去“探索”全唐诗

然而,对于古汉语(文言文),尤其是诗词的分词处理可没有这么简单,因为单字词占古汉语词汇统计信息的80....
的头像 悟空智能科技 发表于 02-20 14:23 162次 阅读
从文本(数据)挖掘的角度去“探索”全唐诗

深度学习在计算机视觉领域的瓶颈已至

有种策略,是把标准对抗攻击 (Adversarial Attacks) 的概念扩展到包含非局部结构 ....
的头像 悟空智能科技 发表于 02-18 14:52 251次 阅读
深度学习在计算机视觉领域的瓶颈已至

雷洪钧:汽车自动驾驶技术与实例的研究(上)

光学摄像头,按安装位置不同的分类车载摄像头布置位置(见图1)主要包括内视摄像头、后视摄像头、前置摄像....
的头像 智车科技 发表于 02-18 14:28 623次 阅读
雷洪钧:汽车自动驾驶技术与实例的研究(上)

史上最强通用NLP模型诞生

OpenAI今天在官博上介绍了他们的新NLP模型,刷新了7大数据集的SOTA(当前最佳结果),并且能....
的头像 人工智能和机器人研究院 发表于 02-18 14:19 312次 阅读
史上最强通用NLP模型诞生

先天结构或是人工智能发展的下一个方向

人工智能从神经科学领域吸收了大量养分,并由此催生了深度学习和强化学习等智能处理方法。以色列魏茨曼科学....
的头像 电子发烧友网工程师 发表于 02-18 10:24 803次 阅读
先天结构或是人工智能发展的下一个方向

图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

新智元今天为大家推荐一份PPT综述,作者是斯坦福大学的多位博士后和博士生。这篇综述由基于神经网络和图....
的头像 新智元 发表于 02-18 09:04 258次 阅读
图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

国内某人脸识别公司数据泄露影响超250万人

2月15日,根据微博安全应急响应中心消息,国内某人脸识别公司发生大规模数据泄露事件。
的头像 芯智讯 发表于 02-17 10:06 619次 阅读
国内某人脸识别公司数据泄露影响超250万人

探析从贝叶斯到深度学习及各自优缺点

集成方法是由多个较弱的模型集成模型组,其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来....
的头像 人工智能学家 发表于 02-17 09:56 334次 阅读
探析从贝叶斯到深度学习及各自优缺点

DNN解决ImageNet时的策略似乎比我们想象的要简单得多

这就避免了对图像的显式分区,并且尽可能接近标准CNN,同时仍然实现概述的策略,我们称之为模型结构Ba....
的头像 新智元 发表于 02-16 11:12 385次 阅读
DNN解决ImageNet时的策略似乎比我们想象的要简单得多

推荐一本中文PyTorch书籍——PyTorch中文手册

12 月 8 日 PyTorch 已经发布 1.0 的稳定版。 API 的改动不是很大,本教程已经通....
的头像 新智元 发表于 02-16 10:58 558次 阅读
推荐一本中文PyTorch书籍——PyTorch中文手册

中国6家公司上榜全球AI初创企业100强

日前,全球知名创投研究机构CB Insights公布了2019全球100强AI初创企业排行榜,这10....
的头像 机器人技术与应用 发表于 02-15 17:07 989次 阅读
中国6家公司上榜全球AI初创企业100强

深度学习的基础理论,深度学习为何work又为何不work?

深度学习的泛化能力为什么那么好?大家知道深度学习理论的第一个谜团就是一个大的网络动辄百万参数, 而能....
的头像 人工智能学家 发表于 02-15 16:47 955次 阅读
深度学习的基础理论,深度学习为何work又为何不work?

为什么现在的人工智能助理都像人工智障

大家好,我又出来怼人了。 “ 我不是针对谁,只是现在所有的深度学习都搞不定对话AI。”
的头像 算法与数据结构 发表于 02-15 16:11 770次 阅读
为什么现在的人工智能助理都像人工智障

谷歌等探索深度学习新理论蓝图

深度学习需要更多的理论!这是学术界的一个共识。神经网络十分强大,但往往不可预测。现在,谷歌大脑、FA....
的头像 机器人大讲堂 发表于 02-15 15:16 271次 阅读
谷歌等探索深度学习新理论蓝图

人工智能最新现状分析,智能化时代要来临了吗?

现在人工智能确实非常好,各种人才进入人工智能行业开始研究各种产品,火热程度超越以前。但是真正落地的应....
发表于 02-15 10:15 387次 阅读
人工智能最新现状分析,智能化时代要来临了吗?

AI大夫的能力又精进了,有产品有真相

该模型先通过自然语言处理技术对电子病例进行标注,再利用逻辑回归来建立层次诊断。这是一种基于器官的方法....
的头像 人工智能学家 发表于 02-14 15:13 412次 阅读
AI大夫的能力又精进了,有产品有真相

自然语言处理技术基于文本型电子病历(EMR)做临床智能诊断的研究成果!

我们通过阅读训练数据中的句子,并选择临床相关单词以用于查询-答案模型构建来生成词典。词典的关键词由我....
的头像 新智元 发表于 02-14 08:56 737次 阅读
自然语言处理技术基于文本型电子病历(EMR)做临床智能诊断的研究成果!

一份2019 AI算法岗求职攻略,快来“扫盲”吧!

目前该攻略已涵盖校招时间表、准备攻略、刷题指南、内推、AI公司清单和答疑等资料。资料已经上传到 AI....
的头像 新智元 发表于 02-14 08:54 340次 阅读
一份2019 AI算法岗求职攻略,快来“扫盲”吧!

探索深度学习蓝图新理论 让神经网络更深更窄

深度学习需要更多的理论!这是学术界的一个共识。神经网络十分强大,但往往不可预测。
的头像 人工智能 发表于 02-13 15:30 175次 阅读
探索深度学习蓝图新理论 让神经网络更深更窄

7种架构范例的深度学习,每个范例都提供了TensorFlow教程

在下面的部分中,我将简要描述这 7 种架构范例,并提供每个范例的演示性TensorFlow 教程的链....
的头像 新智元 发表于 02-13 10:40 403次 阅读
7种架构范例的深度学习,每个范例都提供了TensorFlow教程

DeepMind的“星际2”智能体AlphaStar实际上是演化算法?

在AlphaStar中,用于训练智能体的基于人口的训练策略(PBT)是使用拉马克进化(LE)的模因算....
的头像 新智元 发表于 02-13 10:34 337次 阅读
DeepMind的“星际2”智能体AlphaStar实际上是演化算法?

ICLR-17最佳论文《理解深度学习需要重新思考泛化》

本文提供了进一步的经验证据,并进行了可能更细致的分析。尤其是,我们凭经验表明,深层网络中的层在表示预....
的头像 新智元 发表于 02-13 10:26 231次 阅读
ICLR-17最佳论文《理解深度学习需要重新思考泛化》

深度学习需要更多的理论!我们对神经网络几乎一无所知

他将这种情况与另一种革命性技术的发展进行类比:蒸汽机。最初,蒸汽机除了抽水之外没有别的用处。后来,蒸....
的头像 新智元 发表于 02-13 09:55 315次 阅读
深度学习需要更多的理论!我们对神经网络几乎一无所知

从四个经典角度看机器学习的本质

何谓“机器学习”,学界尚未有统一的定义。本文摘取Tom Mitchell、Christopher M....
的头像 新智元 发表于 02-13 09:44 424次 阅读
从四个经典角度看机器学习的本质

面向图谱的深度学习会迎来重大突破吗

神经网络(Graph NN)是近来的一大研究热点,尤其是DeepMind提出的“Graph Netw....
的头像 新智元 发表于 02-13 09:37 339次 阅读
面向图谱的深度学习会迎来重大突破吗

想真正达到理想中的人工智能 深度学习的瓶颈有待于人们的进一步突破

从人工智能的发展过程看,深度学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计....
发表于 02-13 09:22 122次 阅读
想真正达到理想中的人工智能 深度学习的瓶颈有待于人们的进一步突破

如何选择合适的深度学习框架开展AI研究

深度学习框架正如一家杂货店,当人们想要做一顿美餐的时候,想必没有几个人会亲自到菜园里种菜,而是选择从....
的头像 英伟达NVIDIA中国 发表于 02-12 10:09 269次 阅读
如何选择合适的深度学习框架开展AI研究

教你用PyTorch快速准确地建立神经网络

动态计算图:PyTorch被称为“由运行定义的”框架,这意味着计算图结构(神经网络体系结构)是在运行....
的头像 电子发烧友网工程师 发表于 02-11 14:33 665次 阅读
教你用PyTorch快速准确地建立神经网络

如何将CycleGAN用于风格迁移并探索其在游戏图形模型中的应用

该网络能够理解原始域图像中的对象,并对目标域图像中相同对象的外观做相应的变换。该网络的算法实现经训练....
的头像 电子发烧友网工程师 发表于 02-11 11:35 254次 阅读
如何将CycleGAN用于风格迁移并探索其在游戏图形模型中的应用

深度学习框架不能“包治百病”什么样的深度学习框架才是适合自己的呢?

PaddlePaddle:百度出品,跟 TF 类似,PaddlePaddle 也是在百度内部实际应用....
的头像 新智元 发表于 02-11 09:41 382次 阅读
深度学习框架不能“包治百病”什么样的深度学习框架才是适合自己的呢?

快速了解神经网络与深度学习的教程资料免费下载

本文档的详细介绍的是快速了解神经网络与深度学习的教程资料免费下载主要内容包括了:机器学习概述,线性模....
发表于 02-11 08:00 36次 阅读
快速了解神经网络与深度学习的教程资料免费下载

受美国司法部对华为诉讼影响 加州大学伯克利分校暂停与华为合作

据《自然》杂志报导,美国司法部于1月28日对中国华为公司提起刑事指控,随后加州大学伯克利分校(The....
发表于 02-04 08:17 2182次 阅读
受美国司法部对华为诉讼影响 加州大学伯克利分校暂停与华为合作

人工智能正在告别新一轮概念炒作

我们一直梦想着有一个通用的模型,可以建模整个世界,使各种各样的问题都能够迎刃而解,这便是通用人工智能....
的头像 Thundersoft中科创达 发表于 01-30 10:21 1363次 阅读
人工智能正在告别新一轮概念炒作

企业CIO将如何采用人工智能技术?以及将来如何开发他们的业务用例?

英国国民健康保险服务管理局(NHSBSA)首席数字官Darren Curry也在领导着一个数字化转型....
的头像 AI人工智能D1net 发表于 01-30 09:43 796次 阅读
企业CIO将如何采用人工智能技术?以及将来如何开发他们的业务用例?

FPGA的深度学习加速器有怎样的挑战和机遇

FPGA 的神经网络加速器如今越来越受到 AI 社区的关注,本文对基于 FPGA 的深度学习加速器存....
的头像 嵌入式ARM 发表于 01-29 16:48 1117次 阅读
FPGA的深度学习加速器有怎样的挑战和机遇

人工智能如何拯救濒危语言

塞内卡语是北美地区六个易洛魁联盟所使用的语言之一,目前,仅有约 100 人将塞内卡语作为第一语言,记....
的头像 英伟达NVIDIA中国 发表于 01-29 15:25 691次 阅读
人工智能如何拯救濒危语言

如何选择合适的深度学习框架开展人工智能研究

深度学习框架正如一家杂货店,当人们想要做一顿美餐的时候,想必没有几个人会亲自到菜园里种菜,而是选择从....
的头像 英伟达NVIDIA企业解决方案 发表于 01-29 14:59 808次 阅读
如何选择合适的深度学习框架开展人工智能研究

生态积累并非一蹴可几,高通选择稳健循序渐进

SNPE开发环境已经不再封闭,而是提供给广大的第三方 AI 应用开发者,SNPE 也理所当然的支持主....
的头像 电子发烧友网工程师 发表于 01-29 13:56 660次 阅读
生态积累并非一蹴可几,高通选择稳健循序渐进

如何用Python识别停车位?

解决一个复杂的问题,首先第一步是要把问题分解成几个简单子任务。然后,针对每个子任务,运用机器学习中不....
的头像 电子发烧友网工程师 发表于 01-29 10:30 2287次 阅读
如何用Python识别停车位?

机器学习训练秘籍中文版电子书PDF免费下载

机器学习(machine learning) 已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮....
发表于 01-29 10:04 68次 阅读
机器学习训练秘籍中文版电子书PDF免费下载

主流深度学习框架比较

DL:主流深度学习框架多个方向PK比较
发表于 12-26 11:10 190次 阅读
主流深度学习框架比较

Win10系统进行深度学习时系统C盘满了,正确卸载一些非必要的内容的方法

C盘:当Win10系统进行深度学习的时候发现系统C盘满了,大神教你如何正确卸载一些非必要的内容——Jason niu...
发表于 12-26 10:45 146次 阅读
Win10系统进行深度学习时系统C盘满了,正确卸载一些非必要的内容的方法

深度学习框架TensorFlow&TensorFlow-GPU详解

TensorFlow&TensorFlow-GPU:深度学习框架TensorFlow&TensorFlow-GPU的简介、安装、使用方法详细攻略...
发表于 12-25 17:21 215次 阅读
深度学习框架TensorFlow&TensorFlow-GPU详解

计算机视觉神经网络资料全集

CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录(第二次)——Jason niu...
发表于 12-24 11:52 213次 阅读
计算机视觉神经网络资料全集

CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录

CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录...
发表于 12-24 11:51 202次 阅读
CV之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录

CV之YOLO:深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录

CV之YOLO:深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录...
发表于 12-24 11:50 170次 阅读
CV之YOLO:深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录

利用ECS进行深度学习详细攻略

ECS:利用ECS进行深度学习详细攻略
发表于 12-24 11:47 138次 阅读
利用ECS进行深度学习详细攻略

CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别

CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别...
发表于 12-21 10:31 143次 阅读
CV:基于深度学习实现目标检测之GUI界面产品设计并实现图片识别、视频识别、摄像头识别

深度学习实现目标检测俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间

CV:2108足球世界杯—深度学习实现目标检测俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间—东道主俄罗斯5-0完胜沙特...
发表于 12-21 10:31 129次 阅读
深度学习实现目标检测俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间

Py之TFCudaCudnn:Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略

Py之TFCudaCudnn:Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略...
发表于 12-20 10:35 147次 阅读
Py之TFCudaCudnn:Win10下安装深度学习框架Tensorflow+Cuda+Cudnn最简单最快捷最详细攻略