【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

如何用Python识别停车位?

2019-01-29 10:30 次阅读
【导语】今天这篇文章的选题非常贴近生活。营长生活在北京,深知开车出门最怕的就是堵车和找不到停车位。记得冬至那个周末,几个小伙伴滑雪回来找了一家饺子馆吃饺子,结果七拐八拐,好不容易才找到一个停车位。看到这篇技术文章,马上就想要学习一下,分享给大家,希望有助于解决大家这个痛点问题,春节出行没准就可以用得上了。 作者通过相机结合深度学习算法,基于 Python 语言建立一个高精度的停车位的通知系统,每当有新停车位时就会发短信提醒我。听起来好像很复杂,真的方便实用吗?但实际上所使用的工具都是现成的,只要将这些工具进行有机的组合,就可以快速、简便的实现。 下面我们就开始学习整个工程流程: 分解问题 解决一个复杂的问题,首先第一步是要把问题分解成几个简单子任务。然后,针对每个子任务,运用机器学习中不同的方法来分别解决每个问题。最后把这些子任务贯穿起来,形成整套解决方案。 下面是检测开放停车位的流程图: 输入:普通摄像头采集的视频流 有了输入数据后,接下来我们需要知道图像的哪一部分是停车位,而且停车位是没有人使用的。 第一步:检测视频帧中所有可能的停车位。 第二步:检测每一帧视频中的所有车辆。可以跟踪每辆车从一帧到另一帧的运动。 第三步:确定目前有哪些停车位被占用,哪些没有被占用。这需要结合第一步和第二步的结果。 最后一步:当停车位变成可用时,系统发出通知。 其实可以使用多种不同的方法来完成这些步骤。不同的方法将具有不同的优势和缺点。接下来具体来看: 一、探测停车位 相机视图如下图所示: 需要扫描图像,并得到有效停车区域,如下面黄色标识出来的位置: 一个懒办法是程序写死每个停车场的位置,而不是自动检测停车场。但是如果移动摄像机,探测不同街道上的停车位,就必须再次手动定位停车位置。这样看来这个方法一点都不好,还是要采用自动检测停车位的方法。 其中一个想法是识别停车计时器并假设每个计时器旁边都有一个停车位: 但是这种方法也有一些问题。首先,并不是每个停车位有一个停车计时器,而且我们最想先找到免费停车位。第二,知道停车计时器的位置还不能告诉我们确切的停车位置点。 另一个想法是搭建一个目标检测模型,找到在马路上画的停车位记号,就像下图标识出来的: 这种方法也有两个难点。首先,从远处看,停车位线的标志很小,很难看到,增加了识别难度;其次,道路上还有各种交通标记线,比如车道线、人行道斑马线,这也给识别增加了难度。 或许还可以换个思维方式,回避一些技术挑战。重新思考停车位到底是什么呢?无非是一个车需要停放一定时间的位置。所以我们可能根本不需要检测停车位,只要检测出长时间不动的车,并假设它们的位置就是停车位。 所以,如果我们能检测出汽车,并找出哪些车在视频帧之间没有移动,就可以推断停车位的位置。 二、在图像中检测汽车 在视频中检测车辆是一个经典的目标检测问题。有很多机器学习方法可以实现。下面列出了一些最常见的目标检测算法: 1、通过 HOG(梯度方向直方图)目标检测器检测出所有的车。这种非深度学习方法运行起来相对较快,但它无法处理汽车在不同方向上的旋转问题。 2、通过 CNN(卷积神经网络)目标检测器检测所有的车。这种方法是准确的,但是效率比较低,因为同一张图像必须扫描多次,以检测到所有的汽车。虽然它可以很容易地对不同旋转方向的汽车定向,但是比 HOG 方法需要更多的训练数据。 3、使用新的深度学习方法,如 Mask R-CNN,Faster R-CNN 或者 YOLO 算法,兼容准确性和运行效率,大大加快了检测过程。一旦有大量的训练数据,在 GPU 上运行也很快。 通常来说,我们希望选择最简单可行的算法和最少的训练数据,而不是一定要用那些流行的新的算法。基于目前这种特殊场景下,Mask R- CNN 是一个不错的选择。 Mask R-CNN 架构就是在整个图像中检测对象,不使用滑动窗口的方式,所以运行速度很快。有了 GPU 处理器,我们能够每秒处理多帧的高分辨率视频,从中检测到车辆。 Mask R-CNN 为我们提供了很多检测到的信息。大多数目标检测算法只返回每个对象的边框。但是 Mask R-CNN 不仅会给我们每个对象的位置,也会给出一个对象的轮廓,像这样: 为了训练 Mask R-CNN 模型,我们需要很多这类检测物体的图片。可以花几天的时间出去拍摄照片,不过已经存在一些汽车图像的公共数据集。有一个很流行的数据集叫做COCO(Common Objects In Context的缩写),它里面已经有超过 12000 张汽车的图片。下面就是一个 COCO 数据集中的图像: 这些数据可以很好的训练 Mask R-CNN 模型,而且已经有很多人使用过 COCO数据集,并分享了训练的结果。所以我们可以直接使用一些训练好的模型,在本项目中使用 Matterport 的开源模型。 不仅能识别车辆,还能识别到交通灯和人。有趣的是,它把其中一棵树识别成“potted plant”。对于图像中检测到的每个对象,我们从 MaskR-CNN 模型得出以下 4 点: (1)不同对象的类别,COCO 模型可以识别出 80 种不同的物体,比如小轿车和卡车。 (2)目标识别的置信度,数字越大,说明模型识别对象的精准度越高。 (3)图像中物体的边界框,给定了 X/Y 像素的位置。 (4)位图“mask”说明了边框内哪些像素是对象的一部分,哪些不是。使用“mask”数据,我们也可以算出物体的轮廓。 下面是 Python 代码,使用 Matterport 的 Mask R-CNN 的训练模型和 OpenCV 来检测汽车边框: 1import os  2import numpy as np  3import cv2  4import mrcnn.config  5import mrcnn.utils  6from mrcnn.model import MaskRCNN  7from pathlib import Path  8  9 10# Configuration that will be used by the Mask-RCNN library 11class MaskRCNNConfig(mrcnn.config.Config): 12    NAME = "coco_pretrained_model_config" 13    IMAGES_PER_GPU = 1 14    GPU_COUNT = 1 15    NUM_CLASSES = 1 + 80  # COCO dataset has 80 classes + one background class 16    DETECTION_MIN_CONFIDENCE = 0.6 17 18 19# Filter a list of Mask R-CNN detection results to get only the detected cars / trucks 20def get_car_boxes(boxes, class_ids): 21    car_boxes = [] 22 23    for i, box in enumerate(boxes): 24        # If the detected object isn't a car / truck, skip it 25        if class_ids[i] in [3, 8, 6]: 26            car_boxes.append(box) 27 28    return np.array(car_boxes) 29 30 31# Root directory of the project 32ROOT_DIR = Path(".") 33 34# Directory to save logs and trained model 35MODEL_DIR = os.path.join(ROOT_DIR, "logs") 36 37# Local path to trained weights file 38COCO_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_coco.h5") 39 40# Download COCO trained weights from Releases if needed 41if not os.path.exists(COCO_MODEL_PATH): 42    mrcnn.utils.download_trained_weights(COCO_MODEL_PATH) 43 44# Directory of images to run detection on 45IMAGE_DIR = os.path.join(ROOT_DIR, "images") 46 47# Video file or camera to process - set this to 0 to use your webcam instead of a video file 48VIDEO_SOURCE = "test_images/parking.mp4" 49 50# Create a Mask-RCNN model in inference mode 51model = MaskRCNN(mode="inference", model_dir=MODEL_DIR, config=MaskRCNNConfig()) 52 53# Load pre-trained model 54model.load_weights(COCO_MODEL_PATH, by_name=True) 55 56# Location of parking spaces 57parked_car_boxes = None 58 59# Load the video file we want to run detection on 60video_capture = cv2.VideoCapture(VIDEO_SOURCE) 61 62# Loop over each frame of video 63while video_capture.isOpened(): 64    success, frame = video_capture.read() 65    if not success: 66        break 67 68    # Convert the image from BGR color (which OpenCV uses) to RGB color 69    rgb_image = frame[:, :, ::-1] 70 71    # Run the image through the Mask R-CNN model to get results. 72    results = model.detect([rgb_image], verbose=0) 73 74    # Mask R-CNN assumes we are running detection on multiple images. 75    # We only passed in one image to detect, so only grab the first result. 76    r = results[0] 77 78    # The r variable will now have the results of detection: 79    # - r['rois'] are the bounding box of each detected object 80    # - r['class_ids'] are the class id (type) of each detected object 81    # - r['scores'] are the confidence scores for each detection 82    # - r['masks'] are the object masks for each detected object (which gives you the object outline) 83 84    # Filter the results to only grab the car / truck bounding boxes 85    car_boxes = get_car_boxes(r['rois'], r['class_ids']) 86 87    print("Cars found in frame of video:") 88 89    # Draw each box on the frame 90    for box in car_boxes: 91        print("Car: ", box) 92 93        y1, x1, y2, x2 = box 94 95        # Draw the box 96        cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 1) 97 98    # Show the frame of video on the screen 99    cv2.imshow('Video', frame)100101    # Hit 'q' to quit102    if cv2.waitKey(1) & 0xFF == ord('q'):103        break104105# Clean up everything when finished106video_capture.release()107cv2.destroyAllWindows() 运行该脚本后,将会看到在图像中识别到的汽车和边框: 同时会得到检测的每辆车的像素坐标: 这样我们已经成功地在图像中检测到了汽车。接下来到了下一个步骤。 三、探测空车位 知道图像中每辆车的像素位置后,通过观察连续多帧视频,可以很容易地算出哪帧里汽车没有移动。但我们如何检测到汽车何时离开停车位?经观察,图像中汽车的边框部分有所重叠: 如果假设每个边界框代表一个停车场空间,这个区域即使有车开走了,但是仍可能被另外汽车部分占据。因此我们需要一种方法来测量重叠,检查出“大部分为空”的框。我们使用的度量方法称为 Intersection Over Union(IoU)。通过计算两个物体重叠的像素量,然后除以两个物体所覆盖的像素: 有了这个值,接下来就可以很容易确定一辆车是否在停车位。如果 IoU 测量值低,比如 0.15,表示汽车并没有占据大部分的停车位空间。但是如果测量值很高,比如 0.6,就表示汽车占据了大部分的停车位,因此可以确定停车位已被占用。 IoU 是计算机视觉中常用的一种测量方法,提供了现成的代码。Matterport 的Mask R-CNN 库可以直接调用这个函数 mrcnn.utils.compute_overlaps()。假设我们有一个表示停车位边界框的列表,要检识别到的车辆是否在这些边界内框很简单,只需添加一两行代码: 1    # Filter the results to only grab the car / truck bounding boxes2    car_boxes = get_car_boxes(r['rois'], r['class_ids'])34    # See how much cars overlap with the known parking spaces5    overlaps = mrcnn.utils.compute_overlaps(car_boxes, parking_areas)67    print(overlaps) 结果显示为: 在二维数组中,每一行表示一个停车位边界框。同样的,每一列表示停车场被汽车所覆盖的程度。1.0 分意味着汽车完全占据了,而 0.02 这样的低分数,意味着有重叠区域,但不会占据大部分空间。 要找到无人使用的停车位,只需要计算出这个数组。如果所有的数都是 0 或者很小,也就表示空间没有被占用,因此一定是空停车位。 尽管 Mask R-CNN 非常精确,但目标检测并不能做到完美。有时也会在一段视频中漏掉一两辆车。所以在定位到一个空车位时,还应该检测在一段时间内都是空的,比如 5或10帧连续视频。这也可以避免视频本身出现故障而造成误检。一旦看到几个连续视频中都有空车位,马上发送提醒通知! 四、发送消息 最后一步是发送 SMS 提醒消息。利用 Twilio 通过 Python 发送 SMS 消息非常简单,基本上几行代码就可以实现。当然,Twilio 只是这个项目中用到的方法,你也可以用其他方式实现。 要使用 Twilio,先要注册一个试用帐户,创建一个 Twilio 电话号码并获取您的帐户凭证。然后,您需要安装 Twilio Python 客户端库: 下面是发送 SMS 消息的 Python 代码 (需用自己的帐户信息替换这些值): 1from twilio.rest import Client 2 3# Twilio account details 4twilio_account_sid = 'Your Twilio SID here' 5twilio_auth_token = 'Your Twilio Auth Token here' 6twilio_source_phone_number = 'Your Twilio phone number here' 7 8# Create a Twilio client object instance 9client = Client(twilio_account_sid, twilio_auth_token)1011# Send an SMS12message = client.messages.create(13    body="This is my SMS message!",14    from_=twilio_source_phone_number,15    to="Destination phone number here"16) 在添加 SMS 发送功能时要注意,不要连续发送已经识别过的空车位信息。可以用一个 flag 来跟踪已经发过的短信,除非是设定一段时间后再次提醒或是检测到新的空车位。 五、把所有流程串在一起 现在将每个步骤集成一个Python脚本。下面是完整代码,要运行这段代码,需要安装Python 3.6+,Matterport 的 Mask R-CNN 和 OpenCV: 1import os  2import numpy as np  3import cv2  4import mrcnn.config  5import mrcnn.utils  6from mrcnn.model import MaskRCNN  7from pathlib import Path  8from twilio.rest import Client  9 10 11# Configuration that will be used by the Mask-RCNN library 12class MaskRCNNConfig(mrcnn.config.Config): 13    NAME = "coco_pretrained_model_config" 14    IMAGES_PER_GPU = 1 15    GPU_COUNT = 1 16    NUM_CLASSES = 1 + 80  # COCO dataset has 80 classes + one background class 17    DETECTION_MIN_CONFIDENCE = 0.6 18 19 20# Filter a list of Mask R-CNN detection results to get only the detected cars / trucks 21def get_car_boxes(boxes, class_ids): 22    car_boxes = [] 23 24    for i, box in enumerate(boxes): 25        # If the detected object isn't a car / truck, skip it 26        if class_ids[i] in [3, 8, 6]: 27            car_boxes.append(box) 28 29    return np.array(car_boxes) 30 31 32# Twilio config 33twilio_account_sid = 'YOUR_TWILIO_SID' 34twilio_auth_token = 'YOUR_TWILIO_AUTH_TOKEN' 35twilio_phone_number = 'YOUR_TWILIO_SOURCE_PHONE_NUMBER' 36destination_phone_number = 'THE_PHONE_NUMBER_TO_TEXT' 37client = Client(twilio_account_sid, twilio_auth_token) 38 39 40# Root directory of the project 41ROOT_DIR = Path(".") 42 43# Directory to save logs and trained model 44MODEL_DIR = os.path.join(ROOT_DIR, "logs") 45 46# Local path to trained weights file 47COCO_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_coco.h5") 48 49# Download COCO trained weights from Releases if needed 50if not os.path.exists(COCO_MODEL_PATH): 51    mrcnn.utils.download_trained_weights(COCO_MODEL_PATH) 52 53# Directory of images to run detection on 54IMAGE_DIR = os.path.join(ROOT_DIR, "images") 55 56# Video file or camera to process - set this to 0 to use your webcam instead of a video file 57VIDEO_SOURCE = "test_images/parking.mp4" 58 59# Create a Mask-RCNN model in inference mode 60model = MaskRCNN(mode="inference", model_dir=MODEL_DIR, config=MaskRCNNConfig()) 61 62# Load pre-trained model 63model.load_weights(COCO_MODEL_PATH, by_name=True) 64 65# Location of parking spaces 66parked_car_boxes = None 67 68# Load the video file we want to run detection on 69video_capture = cv2.VideoCapture(VIDEO_SOURCE) 70 71# How many frames of video we've seen in a row with a parking space open 72free_space_frames = 0 73 74# Have we sent an SMS alert yet? 75sms_sent = False 76 77# Loop over each frame of video 78while video_capture.isOpened(): 79    success, frame = video_capture.read() 80    if not success: 81        break 82 83    # Convert the image from BGR color (which OpenCV uses) to RGB color 84    rgb_image = frame[:, :, ::-1] 85 86    # Run the image through the Mask R-CNN model to get results. 87    results = model.detect([rgb_image], verbose=0) 88 89    # Mask R-CNN assumes we are running detection on multiple images. 90    # We only passed in one image to detect, so only grab the first result. 91    r = results[0] 92 93    # The r variable will now have the results of detection: 94    # - r['rois'] are the bounding box of each detected object 95    # - r['class_ids'] are the class id (type) of each detected object 96    # - r['scores'] are the confidence scores for each detection 97    # - r['masks'] are the object masks for each detected object (which gives you the object outline) 98 99    if parked_car_boxes is None:100        # This is the first frame of video - assume all the cars detected are in parking spaces.101        # Save the location of each car as a parking space box and go to the next frame of video.102        parked_car_boxes = get_car_boxes(r['rois'], r['class_ids'])103    else:104        # We already know where the parking spaces are. Check if any are currently unoccupied.105106        # Get where cars are currently located in the frame107        car_boxes = get_car_boxes(r['rois'], r['class_ids'])108109        # See how much those cars overlap with the known parking spaces110        overlaps = mrcnn.utils.compute_overlaps(parked_car_boxes, car_boxes)111112        # Assume no spaces are free until we find one that is free113        free_space = False114115        # Loop through each known parking space box116        for parking_area, overlap_areas in zip(parked_car_boxes, overlaps):117118            # For this parking space, find the max amount it was covered by any119            # car that was detected in our image (doesn't really matter which car)120            max_IoU_overlap = np.max(overlap_areas)121122            # Get the top-left and bottom-right coordinates of the parking area123            y1, x1, y2, x2 = parking_area124125            # Check if the parking space is occupied by seeing if any car overlaps126            # it by more than 0.15 using IoU127            if max_IoU_overlap < 0.15:128                # Parking space not occupied! Draw a green box around it129                cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 3)130                # Flag that we have seen at least one open space131                free_space = True132            else:133                # Parking space is still occupied - draw a red box around it134                cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 0, 255), 1)135136            # Write the IoU measurement inside the box137            font = cv2.FONT_HERSHEY_DUPLEX138            cv2.putText(frame, f"{max_IoU_overlap:0.2}", (x1 + 6, y2 - 6), font, 0.3, (255, 255, 255))139140        # If at least one space was free, start counting frames141        # This is so we don't alert based on one frame of a spot being open.142        # This helps prevent the script triggered on one bad detection.143        if free_space:144            free_space_frames += 1145        else:146            # If no spots are free, reset the count147            free_space_frames = 0148149        # If a space has been free for several frames, we are pretty sure it is really free!150        if free_space_frames > 10:151            # Write SPACE AVAILABLE!! at the top of the screen152            font = cv2.FONT_HERSHEY_DUPLEX153            cv2.putText(frame, f"SPACE AVAILABLE!", (10, 150), font, 3.0, (0, 255, 0), 2, cv2.FILLED)154155            # If we haven't sent an SMS yet, sent it!156            if not sms_sent:157                print("SENDING SMS!!!")158                message = client.messages.create(159                    body="Parking space open - go go go!",160                    from_=twilio_phone_number,161                    to=destination_phone_number162                )163                sms_sent = True164165        # Show the frame of video on the screen166        cv2.imshow('Video', frame)167168    # Hit 'q' to quit169    if cv2.waitKey(1) & 0xFF == ord('q'):170        break171172# Clean up everything when finished173video_capture.release()174cv2.destroyAllWindows() 这段代码写的比较简洁,实现了基本的功能。大家也可以试着修改代码以适应不同的场景。仅仅更改一下模型参数,出现的效果就可能完全不同,在不同应用中尽情发挥想象力!
原文标题:春节停车难?用Python找空车位 文章出处:【微信号:rgznai100,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

某些生物医药领域使用人工智能技术或将得出一些不准确的结论

北京时间2月18日早间消息,据报道,一组顶尖科学家和医学统计学家上周五警告称,在某些生物医药领域使用....
发表于 02-18 14:56 23次 阅读
某些生物医药领域使用人工智能技术或将得出一些不准确的结论

深度学习在计算机视觉领域的瓶颈已至

有种策略,是把标准对抗攻击 (Adversarial Attacks) 的概念扩展到包含非局部结构 ....
的头像 悟空智能科技 发表于 02-18 14:52 57次 阅读
深度学习在计算机视觉领域的瓶颈已至

雷洪钧:汽车自动驾驶技术与实例的研究(上)

光学摄像头,按安装位置不同的分类车载摄像头布置位置(见图1)主要包括内视摄像头、后视摄像头、前置摄像....
的头像 智车科技 发表于 02-18 14:28 119次 阅读
雷洪钧:汽车自动驾驶技术与实例的研究(上)

史上最强通用NLP模型诞生

OpenAI今天在官博上介绍了他们的新NLP模型,刷新了7大数据集的SOTA(当前最佳结果),并且能....
的头像 人工智能和机器人研究院 发表于 02-18 14:19 97次 阅读
史上最强通用NLP模型诞生

先天结构或是人工智能发展的下一个方向

人工智能从神经科学领域吸收了大量养分,并由此催生了深度学习和强化学习等智能处理方法。以色列魏茨曼科学....
的头像 电子发烧友网工程师 发表于 02-18 10:24 469次 阅读
先天结构或是人工智能发展的下一个方向

Python打造最强表白程序

在抓取这个网站的情话时,如果你利用普通的爬取思路,即利用 request 进行请求,你会发现网页获取....
的头像 电子发烧友网工程师 发表于 02-18 09:47 158次 阅读
Python打造最强表白程序

如何快速入门Python爬虫的?

抛开数据,可能你会觉得这张图在排版布局、色彩搭配、字体文字等方面还挺好看的。这些呢,就跟爬虫没什么关....
的头像 电子发烧友网工程师 发表于 02-18 09:38 132次 阅读
如何快速入门Python爬虫的?

TensorFlow 2.0最佳实践及主要变化

由于能够自由地穿插 Python 和 TensorFlow 代码,您能够充分利用 Python 的表....
的头像 电子发烧友网工程师 发表于 02-18 09:34 114次 阅读
TensorFlow 2.0最佳实践及主要变化

探析机器学习核心概念之间的有机关系及知识脉络

机器学习这件事,要学鲁智深倒拔垂杨柳,而不是“狗熊掰棒子”。
的头像 电子发烧友网工程师 发表于 02-18 09:33 559次 阅读
探析机器学习核心概念之间的有机关系及知识脉络

警告:机器学习导致了一场“科学危机”!

科学上的“可复制性危机”指的是当另一组科学家尝试同样的实验时,研究结果没有被重复。这意味着最初的结果....
的头像 新智元 发表于 02-18 09:07 138次 阅读
警告:机器学习导致了一场“科学危机”!

图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

新智元今天为大家推荐一份PPT综述,作者是斯坦福大学的多位博士后和博士生。这篇综述由基于神经网络和图....
的头像 新智元 发表于 02-18 09:04 152次 阅读
图神经网络到底有多厉害?斯坦福33页PPT带你看明白!

【PYNQ-Z2试用体验】Jupyter Notebook体验

前言上一篇文章中,我们通过网线连接开发板,以ssh的方式成功登录了linux系统。通过资料发现系统安装了交互式的Python,接下来...
发表于 02-17 19:37 69次 阅读
【PYNQ-Z2试用体验】Jupyter Notebook体验

国内某人脸识别公司数据泄露影响超250万人

2月15日,根据微博安全应急响应中心消息,国内某人脸识别公司发生大规模数据泄露事件。
的头像 芯智讯 发表于 02-17 10:06 478次 阅读
国内某人脸识别公司数据泄露影响超250万人

全球人工智能革命的前20家公司你了解吗

人工智能是计算机科学的一个分支,旨在创建像人类一样学习、工作和反应的计算机和机器。
的头像 机器人大讲堂 发表于 02-17 10:05 699次 阅读
全球人工智能革命的前20家公司你了解吗

探析从贝叶斯到深度学习及各自优缺点

集成方法是由多个较弱的模型集成模型组,其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来....
的头像 人工智能学家 发表于 02-17 09:56 222次 阅读
探析从贝叶斯到深度学习及各自优缺点

OpenCV的Mat数据格式及其遍历的程序资料说明

在opencv早期的版本中,图像通过一个叫做IplImage的结构(structure)存储在内存中....
的头像 C语言专家集中营 发表于 02-17 09:42 161次 阅读
OpenCV的Mat数据格式及其遍历的程序资料说明

机器学习应用场景拓展翻新

2018年全球人工智能技术支出规模达到240亿美金,其中中国市场达到22亿美金,中国在全球技术支出占....
发表于 02-16 15:01 229次 阅读
机器学习应用场景拓展翻新

DNN解决ImageNet时的策略似乎比我们想象的要简单得多

这就避免了对图像的显式分区,并且尽可能接近标准CNN,同时仍然实现概述的策略,我们称之为模型结构Ba....
的头像 新智元 发表于 02-16 11:12 261次 阅读
DNN解决ImageNet时的策略似乎比我们想象的要简单得多

推荐一本中文PyTorch书籍——PyTorch中文手册

12 月 8 日 PyTorch 已经发布 1.0 的稳定版。 API 的改动不是很大,本教程已经通....
的头像 新智元 发表于 02-16 10:58 299次 阅读
推荐一本中文PyTorch书籍——PyTorch中文手册

2018年以来最重要的10篇计算机视觉/图像生成相关的研究

卷积神经网络(CNN)可以很好的处理二维平面图像的问题。然而,对球面图像进行处理需求日益增加。例如,....
的头像 新智元 发表于 02-16 10:50 204次 阅读
2018年以来最重要的10篇计算机视觉/图像生成相关的研究

用python做一个三阶拼图

程序的功能很简单,还是之前我们用到的pygame和随机数的知识,整个流程非常的清晰,但是我们需要注意....
的头像 电子发烧友网工程师 发表于 02-16 10:37 222次 阅读
用python做一个三阶拼图

在互联网上你的脸正在成为色情片主角

视频请求者将这位女性的脸放在身体上,视频中汇集了她491张脸的照片,其中许多照片来自她的Facebo....
的头像 电子发烧友网工程师 发表于 02-16 10:29 323次 阅读
在互联网上你的脸正在成为色情片主角

为什么选择Python?谈谈如何学习Python

每种语言都有它自己的优点和缺点,以及最适用的场景。Python 最常用的三个场景是数据处理、编写 W....
的头像 电子发烧友网工程师 发表于 02-16 10:26 232次 阅读
为什么选择Python?谈谈如何学习Python

Python登上“最强王者”中国程序猿是“全场MVP”

国内基于 Python 创业成功的案例不在少数,豆瓣,知乎,果壳,全栈都是 Python,大家对 P....
的头像 电子发烧友网工程师 发表于 02-16 10:23 191次 阅读
Python登上“最强王者”中国程序猿是“全场MVP”

TIOBE编程语言社区发布了最新的2月编程语言排行榜

除此之外,Groovy 在一次进入语言排行榜前20,它第一次进入语言排行榜前20是在2016年末,因....
的头像 电子发烧友网工程师 发表于 02-16 10:12 219次 阅读
TIOBE编程语言社区发布了最新的2月编程语言排行榜

机器学习准入门槛降低,机器学习工程师职位或将消失

机器学习工程师团队负责人、Looker的首席产品官,以自己十几年的从业经历,以及对当下机器学习领域的....
的头像 电子发烧友网工程师 发表于 02-16 08:53 238次 阅读
机器学习准入门槛降低,机器学习工程师职位或将消失

中国6家公司上榜全球AI初创企业100强

日前,全球知名创投研究机构CB Insights公布了2019全球100强AI初创企业排行榜,这10....
的头像 机器人技术与应用 发表于 02-15 17:07 787次 阅读
中国6家公司上榜全球AI初创企业100强

深度学习的基础理论,深度学习为何work又为何不work?

深度学习的泛化能力为什么那么好?大家知道深度学习理论的第一个谜团就是一个大的网络动辄百万参数, 而能....
的头像 人工智能学家 发表于 02-15 16:47 827次 阅读
深度学习的基础理论,深度学习为何work又为何不work?

为什么现在的人工智能助理都像人工智障

大家好,我又出来怼人了。 “ 我不是针对谁,只是现在所有的深度学习都搞不定对话AI。”
的头像 算法与数据结构 发表于 02-15 16:11 583次 阅读
为什么现在的人工智能助理都像人工智障

谷歌等探索深度学习新理论蓝图

深度学习需要更多的理论!这是学术界的一个共识。神经网络十分强大,但往往不可预测。现在,谷歌大脑、FA....
的头像 机器人大讲堂 发表于 02-15 15:16 217次 阅读
谷歌等探索深度学习新理论蓝图

仔细研究用于机器学习和数据科学的十大Python工具

毫无疑问,Python是最流行的语言之一,其成功的原因之一是它为科学计算提供了广泛的报道。 在这里,....
的头像 人工智能 发表于 02-15 15:03 228次 阅读
仔细研究用于机器学习和数据科学的十大Python工具

DeepSolar项目训练AI统计太阳能面板

斯坦福大学工程师和计算机科学家组成了DeepSolar团队,可精确地统计全美太阳能电池面板的尺寸规模....
的头像 人工智能 发表于 02-15 14:57 253次 阅读
DeepSolar项目训练AI统计太阳能面板

黑客是怎么用python的?检如何判断目标环境是否部署防火墙?

在步骤1中我们定义了我们的HTML文档,其中表单名称为“waf”。因此在第三行代码中,我们需要告诉m....
的头像 马哥Linux运维 发表于 02-15 14:26 194次 阅读
黑客是怎么用python的?检如何判断目标环境是否部署防火墙?

Python爬虫库-BeautifulSoup的使用

可以看到 children 的类型为 .contents 和 .children 属性仅包含tag的....
的头像 马哥Linux运维 发表于 02-15 14:22 187次 阅读
Python爬虫库-BeautifulSoup的使用

Python的套路都在这里了!7个案例15分钟让你了解

而我要推荐的计算机语言,答案已在标题中被出卖:Python!Python是一门十分容易上手,但是又被....
的头像 马哥Linux运维 发表于 02-15 14:14 277次 阅读
Python的套路都在这里了!7个案例15分钟让你了解

如何用Python实现极大似然估计?

从上面的结论可以看出,作100次伯努利实验,出现positive、1及head的数目是53个,相应的....
的头像 马哥Linux运维 发表于 02-15 14:07 183次 阅读
如何用Python实现极大似然估计?

使用python进行语音识别的终极指南

亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本....
的头像 马哥Linux运维 发表于 02-15 13:42 175次 阅读
使用python进行语音识别的终极指南

快讯:苹果更换Siri负责人,作为人工智能战略转变的一部分

据CNBC报道,谷歌母公司Alphabet旗下生命科学部门Verily一直在寻求合作伙伴,联合开发嵌....
的头像 高工智能未来 发表于 02-15 11:28 843次 阅读
快讯:苹果更换Siri负责人,作为人工智能战略转变的一部分

人工智能最新现状分析,智能化时代要来临了吗?

现在人工智能确实非常好,各种人才进入人工智能行业开始研究各种产品,火热程度超越以前。但是真正落地的应....
发表于 02-15 10:15 357次 阅读
人工智能最新现状分析,智能化时代要来临了吗?

NVIDIA首席执行官黄仁勋将在世界知名AI大会上发表主题演讲

3月17-21日,第十届GPU技术大会(GTC)将于美国加利福尼亚州圣何塞举行。当地时间3月18日(....
发表于 02-15 09:59 153次 阅读
NVIDIA首席执行官黄仁勋将在世界知名AI大会上发表主题演讲

中国为AI独角兽最强诞生地,自动化机器学习、RPA 领域同样吸金

众所皆知,过去获得投资人青睐一直是计算机视觉、以及自动驾驶技术为主的公司,像是商汤、旷视、依图以面部....
的头像 深圳创新设计研究院 发表于 02-15 09:45 441次 阅读
中国为AI独角兽最强诞生地,自动化机器学习、RPA 领域同样吸金

MATLAB R2018b的产品描述资料免费下载

全世界数以百万计的工程师和科学家使用matlab来分析和设计改变我们世界的系统和产品。Matlab应....
发表于 02-15 08:00 23次 阅读
MATLAB R2018b的产品描述资料免费下载

分享机器学习卷积神经网络的工作流程和相关操作

机器学习算法篇--卷积神经网络基础(Convolutional Neural Network)...
发表于 02-14 16:37 39次 阅读
分享机器学习卷积神经网络的工作流程和相关操作

FEM模拟中的python异常

您好,我在Linux RedHat5_10下使用EMPRo2013_07运行大型FEM模拟时收到以下Python错误消息有没有人得到类似的东西? ...
发表于 02-14 15:14 19次 阅读
FEM模拟中的python异常

AI大夫的能力又精进了,有产品有真相

该模型先通过自然语言处理技术对电子病例进行标注,再利用逻辑回归来建立层次诊断。这是一种基于器官的方法....
的头像 人工智能学家 发表于 02-14 15:13 324次 阅读
AI大夫的能力又精进了,有产品有真相

计算机芯片的发展历程,以及所有架构的未来趋势

软件与硬件的通信是通过指令集架构(ISA)进行的。在 1960 年代早期,IBM 有四个互不兼容的计....
的头像 人工智能和机器人研究院 发表于 02-14 15:00 438次 阅读
计算机芯片的发展历程,以及所有架构的未来趋势

ST推出具有机器学习功能的新型运动传感器

意法半导体在其先进的惯性传感器内集成机器学习技术,提高手机和可穿戴设备的运动跟踪性能和电池续航能力。
的头像 MEMS 发表于 02-14 14:29 492次 阅读
ST推出具有机器学习功能的新型运动传感器

对scikit-learn和numpy生成数据样本的方法做一个总结

‍‍‍‍在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特....
的头像 人工智能爱好者社区 发表于 02-14 13:54 182次 阅读
对scikit-learn和numpy生成数据样本的方法做一个总结

什么是数据科学家?需要认证吗?

Fleming说,提供认证将“有助于使我们的组织成为一个有吸引力的工作场所,因为它将为我们的员工提供....
的头像 IEEE电气电子工程师学会 发表于 02-14 09:41 281次 阅读
什么是数据科学家?需要认证吗?

自然语言处理技术基于文本型电子病历(EMR)做临床智能诊断的研究成果!

我们通过阅读训练数据中的句子,并选择临床相关单词以用于查询-答案模型构建来生成词典。词典的关键词由我....
的头像 新智元 发表于 02-14 08:56 535次 阅读
自然语言处理技术基于文本型电子病历(EMR)做临床智能诊断的研究成果!

一份2019 AI算法岗求职攻略,快来“扫盲”吧!

目前该攻略已涵盖校招时间表、准备攻略、刷题指南、内推、AI公司清单和答疑等资料。资料已经上传到 AI....
的头像 新智元 发表于 02-14 08:54 266次 阅读
一份2019 AI算法岗求职攻略,快来“扫盲”吧!

机器学习自学?你应该知道这篇中外结合的计划

一份中外结合的 Machine Learning 自学计划
发表于 02-14 06:43 33次 阅读
机器学习自学?你应该知道这篇中外结合的计划

求scons和python软件分享

那位大佬有这两款软件,求分享!邮箱:
发表于 02-14 03:07 29次 阅读
求scons和python软件分享

MicroPython自动浇水实验

    实验目的:     学习在PC机系统中扩展简单I/O 接口的方法     学习TurnipBit拼插...
发表于 02-13 13:11 209次 阅读
MicroPython自动浇水实验

自然语言处理工具python调用hanlp中文实体识别

Hanlp作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于hanlp这款分词工具还是很认可的。...
发表于 02-13 10:26 370次 阅读
自然语言处理工具python调用hanlp中文实体识别

分享一个机器学习Demo,很受用

TensorFlow入门:第一个机器学习Demo
发表于 02-12 10:13 69次 阅读
分享一个机器学习Demo,很受用

怎么从MXG Signal Generator N5182A加载和传输IQ数据文件

嗨,我尝试控制Agilent MXG N5182A并需要帮助。 我有一个创建的数据包库,其中包含各种通道衰落配置文件,用于自动,可重...
发表于 01-29 08:54 30次 阅读
怎么从MXG Signal Generator N5182A加载和传输IQ数据文件

RT-Thread MicroPython的特性和优势

RT-Thread 推出了 MicroPython 软件包,可以运行在 RT-Thread 操作系统上,支持众多开发板,可以快速完成各种 IOT 功...
发表于 01-29 06:35 59次 阅读
RT-Thread MicroPython的特性和优势