分类与检测与分割模型:它们之间的差异以及何时使用它们

时间:2019-03-17 08:27:00 阅读:48次

  如果您已经听说过计算机视觉(CV),那么您可能已经熟悉了它的作用。该技术由CV模型提供支持,使计算机能够查看和理解图??像。我们已经讨论了 不同形式的简历关注,所以下面我们将看看这些应用程序中使用的不同技术以及它将如何影响您的结果:分类,检测和分割。

<! - more - >

  在我们开始之前,让我们首先介绍两个基本定义,这些定义可以帮助您了解每种技术:

标签:标签是指我们拍摄未标记图像的数据集,并添加有意义的,信息丰富的标签,告诉您图像中的内容。
边界框:边界框是一种标签,可以创建,编辑和删除框,并且框中分配了概念。


那么,什么是分类?

  分类是指一种标签,其中图像/视频被分配了某些概念,目的是回答“这张图片/视频中的内容是什么?”

  图像可以分为多个类别。例如,以下屏幕截图取自我们的一个模型演示,显示已上传到Clarifai的通用模型的图像。

  
正如我们所看到的,该模型为我们提供了一系列预测概念。这些代表了模型如何将图像分类为代表不同“分类”的每个概念。

  

如果您只是需要识别“这是一个海滩还是一个游泳池?”这样的一般事物,这项技术非常有用。

  

好的,那么什么是物体检测?

  物体检测是一种计算机视觉技术,用于区分图像或视频中的物体。虽然它与分类有关,但它在识别的内容中更具体,将分类应用于图像/视频中的不同对象,并使用边界框告诉我们每个对象在图像/视频中的位置。人脸检测是物体检测的一种形式。

  如果您需要识别场景中的特定对象(如停放在街道上的汽车)以及整个图像,此技术非常有用。

  

  下面,我们可以看到分类和对象检测之间的区别:

  图1:分类

  

  图2:物体检测(人脸检测模型)

  
正如我们所看到的,虽然图1 告诉我们它在图像中看到的所有内容,但在图2 中,只检测到并隔离了面部有一个边界框。

  

那么什么是分割?

  分割是一种标记,其中图像中的每个像素都标有给定的概念。在这里,整个图像被分成像素分组,然后可以进行标记和分类,目的是简化图像或改变图像呈现给模型的方式,以便于分析。

  分段模型提供图像中对象的精确轮廓。也就是说,为 Classification 模型提供了逐像素细节,而分类模型则模型识别图像中的内容, Detection 模型,这些地方特定对象周围的边界框。

  它与图像分类和对象检测有关,因为这两种技术必须在分割开始之前进行。在使用边界框隔离有问题的对象之后,您可以进入并在图像中执行该对象的逐像素轮廓。

  
如果您需要忽略图像的背景,分割特别有用,例如,如果您希望模型在繁忙街道上拍摄的时尚编辑图像中识别和标记衬衫。

  虽然人类一直能够在眨眼之间完成上述所有工作,但经过多年的研究,试验和错误才能让计算机模仿我们。然而,今天,由于计算机视觉,我们的设备终于满足了我们的需求。

  

分类与检测与分割模型:它们之间的差异以及何时使用它们所属专题:它们专题 分割专题 《分类与检测与分割模型:它们之间的差异以及何时使用它们》链接:http://www.zhouchuanxiong.net/1291