沃尔多在哪里?使用机器学习查找所有Waldos

时间:2019-03-21 11:25:25 阅读:33次

  沃尔多在哪里是一个游戏,其中一个人寻找隐藏在混乱,繁忙的奇思妙想场景中的瓦尔多(一个戴着眼镜,看着眼睛的人类糖果手杖)。换句话说,它是使用自定义培训挑战视觉识别API的完美数据集!

<! - more - >

  在Clarifai,我们每个月都有一个内部黑客日,每个人都在从事他们通常没有时间的宠物项目。本月我的Hack Dayproject试图回答一个问题,当他们发现自己被困在室内时,无处不在的孩子都会问这个问题,无论是从下雨天,医生的访问,还是在小型货车后面的越野公路旅行......沃尔多在哪里?

  
在场景中充满动物,外星人,美人鱼和各种各样的人(包括他们称之为的几个Waldo冒名顶替者或“朋友”),我想看看我们的自定义训练模型在这样的情况下表现得如何具有挑战性的流行数据集。我是这样做的!

  
第一步:找到数据
幸运的是,我已经创造了一些善良和好奇的灵魂并在线共享了一个Where's Waldo数据集,在那里他拍了19个Where的Waldo地图,将它们分成网格/瓷砖,然后相应地标记了瓷砖('waldo'或'not waldo')。

  
我决定遵循这个方法,并对其他未包含在其中的Waldo地图做同样的事情。将地图分成几个不同的网格(4×5,4×6,5×8等)以增加样本大小。然后将这些图块上传到我们的应用程序中并进行相应标记。

  
第二步:训练,测试,更多数据
在初步训练之后,我根据不在训练集中的地图测试模型,自然地将Waldo放在月球上。在整个地图上,我们的模型发现......没有。好吧...... Waldo有1%的机会在场。这不是一个意想不到的结果,因为很多图像根本就不是Waldo - 这就是让这些游戏如此有趣/令人沮丧的原因。

  
我决定使用与训练相同的网格系统再次测试它。从瓷砖到瓷砖,结果开始变得更有意义。 Waldo在相对空的瓷砖上有1-3%的几率。忙碌的人有10-20%的几率。 Waldo冒名顶替者有30-40%的几率(握拳)。然后,有一个Waldo几率为50%的瓷砖!我焦急地扫视了瓷砖。繁荣。沃尔多躲在一个生物体二楼的一群人身后。

  
第三步:更多数据,减少冒名顶替者
我的下一个目标是降低被标记为Waldo的Waldo外观的百分比。我回到原始地图并手动裁剪了几个(大约500-1000人);一些相似的颜色,其他人只是随机的人。全部告诉模特谁不是Waldo。

  
结果
Waldo阳性瓷砖的百分比较高,Waldo负瓷砖的百分比较低,相似的假阳性较少。

  
总的来说,数字仍然不是很好。更繁忙的瓷砖仍然抛出模型进行循环,Waldo预测仍然不够高,并且仍然存在误报。奇怪的是,通常不会欺骗人眼(相似的人,戴着条纹或眼镜的人物等)的人物不会抛出假阳性,而是其他我无法辨别的东西。 / p>

  
当我重新审视这个项目时,我相信我接下来的步骤是找到/增加Waldo积极的例子,试图抵消数据隐含的不平衡性质。这就是机器学习的美妙之处 - 你展示的例子越多,结果就越好。如果您有兴趣亲自尝试,请注册免费的API帐户并开始使用自定义培训!

  

沃尔多在哪里?使用机器学习查找所有Waldos所属专题:机器学习 《沃尔多在哪里?使用机器学习查找所有Waldos》链接:http://www.zhouchuanxiong.net/1393

沃尔多在哪里?使用机器学习查找所有Waldos相关文章