深度学习下的分类，目标检测、语义分割这三个方向具体的概念及其应用场景是什么？-电子发烧友网

随着Halcon新版本的更新，截止2019年5月1号。Halcon的最新版本为halcon18.11.这次新版本最大的更新在于完整的加入了深度学习在视觉应用的三个重要部分，即目标分类分类、目标检测、语义分割这三个内容。与此同时超人视觉即将向大家简介Halcon软件这三个方向的应用示例，帮助大家进一步认识到机器视觉的魅力与当前的机器视觉威廉希尔官方网站的应用前沿。

在开始内容前我们先明确一下前面提到的三个重要概念即深度学习下的分类，目标检测、语义分割这三个方向具体的概念及其应用场景是什么？帮助大家理解其威廉希尔官方网站的产生背景以及形成自己的理解。

1图像分类

图像分类这一类问题常用与区分不同的物品，图像分类，顾名思义，是一个输入图像，输出对该图像内容分类的描述的问题。它是视觉方向的其中一个核心，实际应用广泛。许多同学在学习计算机视觉中有一个练习题是练习如何区分猫狗如图1所示：

我们观察一下这些图片的特点，这些图片各种各样，分辨率也各不相同。图片中的猫和狗形状、所处位置、体表颜色各不一样。它们的姿态不同，有的在坐着而有的则不是，它们的情绪可能是开心的也可能是伤心的，猫可能在睡觉，而狗可能在汪汪地叫着。照片可能以任一焦距从任意角度拍下。

总而言之这些图片有着无限种可能，对于我们人类来说在一系列不同种类的照片中识别出一个场景中的宠物自然是毫不费力的事情，然而这对于一台机器来说可不是一件小事。实际上，如果要机器实现自动分类，那么我们需要知道如何强有力地描绘出猫和狗的特征，也就是说为什么我们认为这张图片中的是猫，而那张图片中的却是狗。这个需要描绘每个动物的内在特征。

1.在传统的分类方法下图像分类是特征描述及检测，这类传统方法可能对于一些简单的图像分类是有效的，但由于实际情况非常复杂，传统的分类方法不堪重负。深度学习下的神经网络在图像分类任务上效果很好的原因是，它们有着能够自动学习多重抽象层的能力，神经网络可以识别极端变化的模式，在扭曲的图像和经过简单的几何变换的图像上也有着很好的鲁棒性。

2目标检测

图像分类是将图像划分为单个类别，通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体，此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的，并不准确。对于这样的情况，就需要目标检测模型，目标检测模型可以识别一张图片的多个物体，并可以定位出不同物体并且给出边界框。目标检测在很多场景有用，如无人驾驶和安防系统。

传统的目标检测的算法多用模板匹配完成，但是模板匹配针对复杂场景下下的识别并不良好，特别是在光照情况不稳定物体有遮挡的情况下算法的鲁棒性如何确保一直是传统视觉算法的一个难题。

由上图所示，我们可以总结出来目标检测要解决的核心问题是：1)目标可能出现在图像的任何位置，2)目标有各种不同的大小，3)目标可能有各种不同的形状。深度学习在这方面的处理已经部分超越了传统算法的上限，目前较为先进的深度卷积神经网络结构，通过其具有局部连接权，值共享及池化操作等功能，有效降低了网络的复杂度，减少了训练参数的数目。使模型对于平移、扭曲、缩放具有一定程度不变性并具有较强的鲁棒性和容错能力，且易于训练与优化的网络结构。

3.语义分割

语义分割方法在处理图像时，具体到像素级别，也就是说，该方法会将图像中每个像素分配到某个对象类别。语义分割是一种典型的计算机视觉问题，其涉及将一些原始数据（例如，平面图像）作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。

许多人使用术语全像素语义分割，其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。早期的计算机视觉问题只发现边缘（线条和曲线）或渐变等元素，但它们从未完全按照人类感知的方式提供像素级别的图像理解。语义分割将属于同一目标的图像部分聚集在一起来解决这个问题，从而扩展了其应用领域。如图所示。

语义分割问题也可以被认为是分类问题，其中每个像素被分类为来自一系列对象类中的某一个。因此一个使用案例是利用土地的卫星影像制图。土地覆盖信息是重要的各种应用，如监测地区的森林砍伐和城市化等。为了识别卫星图像上每个像素的土地覆盖类型（例如，城市、农业、水等区域），土地覆盖分类可以被视为多级语义分割任务。道路和建筑物检测也是交通管理，城市规划和道路监测的重要研究课题。

以上介绍的三个方向是目前深度学习在计算机视觉领域非常火热的三个研究方。市面上许多网络教程通过使用开源的视觉开发软件OpenCV结合Caffe/Tensorflow进行发开，但是对于初学者，这一套开发与部署流程对于刚刚接触深度学习的同学非常不友好，学习周期漫长并且部署流程繁琐。德国著名视觉算法软件开发公司MVtec开发的Halcon算法工具包集成了开发环境。后期将会带大家了解如何通过Halcon软件开发包快速上手玩转当前最火的深度学习三大方向应用。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4771

浏览量
100742
图像分类

图像分类

+关注

关注
0

文章
90

浏览量
11916
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121130

原文标题：深度学习在视觉中的应用（1）

文章出处：【微信号：chaorenshijue，微信公众号：超人Halcon机器视觉】欢迎添加关注！文章转载请注明出处。

目标检测和图像语义分割领域性能评价指标

目标检测和图像语义分割领域的性能评价指标

发表于 05-13 09:57

目标检测 | 已开源！全新水下目标检测算法SWIPENet+IMA框架

，基于深度学习的方法在标准的目标检测中取得了可喜的性能。水下目标检测仍具有以下几点挑战：（1）水

发表于 07-24 11:05

van-自然和医学图像的深度语义分割：网络结构

feature每个点做softmax prediction，就可以获得32*upsampled prediction（分割图）。FCN这三个创新点有哪些？全卷积：用于解决逐像素的预测问题。通过将基础网络

发表于 12-28 11:03

van-自然和医学图像的深度语义分割：网络结构

发表于 12-28 11:06

迁移学习

Zurich）。语义分割工具箱MMSegmentaion的认识和使用。设计一个分割模型能够从仿真环境中得到的数据迁移到真实场景

发表于 04-21 15:15

机器学习简介与经典机器学习算法人才培养

）。语义分割工具箱MMSegmentaion的认识和使用。设计一个分割模型能够从仿真环境中得到的数据迁移到真实场景

发表于 04-28 18:56

如何使用深度学习进行视频行人目标检测

近年来，随着深度学习在计算机视觉领域的广泛应用，基于深度学习的视频运动目标检测受到广大学者的青睐

发表于 11-19 16:01 •22次下载

如何使用<b class='flag-5'>深度</b><b class='flag-5'>学习</b>进行视频行人<b class='flag-5'>目标</b><b class='flag-5'>检测</b>

分析总结基于深度神经网络的图像语义分割方法

随着深度学习威廉希尔官方网站的快速发展及其在语义分割领域的广泛应用，语义

发表于 03-19 14:14 •21次下载

基于深度学习的三维点云语义分割研究分析

近年来，深度传感器和三维激光扫描仪的普及推动了三维点云处理方法的快速发展。点云语义分割作为理解三

发表于 04-01 14:48 •16次下载

基于深度神经网络的图像语义分割方法

图像语义分割是计算机视觉领堿近年来的热点硏究课题，随着深度学习威廉希尔官方网站的兴起，图像语义分割与

发表于 04-02 13:59 •11次下载

基于深度学习的场景分割算法研究

大部分基于深度学习的场景分割算法采用的“卷积-反卷积”结构;在此基础上，对近年来出现的基于深度学习

发表于 02-12 11:28 •579次阅读

语义分割数据集：从理论到实践

语义分割是计算机视觉领域中的一个重要问题，它的目标是将图像或视频中的语义信息（如人、物、场景等）

发表于 04-23 16:45 •929次阅读

自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战

了许多解决深度多模态感知问题的方法。然而，对于网络架构的设计，并没有通用的指导方针，关于“融合什么”、“何时融合”和“如何融合”的问题仍然没有定论。本文系统地总结了自动驾驶中深度多模态目标

发表于 06-06 10:37 •0次下载

深度学习图像语义分割指标介绍

深度学习在图像语义分割上已经取得了重大进展与明显的效果，产生了很多专注于图像语义分割的模型与基准

发表于 10-09 15:26 •394次阅读

图像语义分割的实用性是什么

什么是图像语义分割图像语义分割是一种将图像中的所有像素点按照其语义类别进行分类的任务。与传统

发表于 07-17 09:56 •419次阅读