当前位置:首页> 机器学习 >机器学习系统同时处理语音和对象识别

机器学习系统同时处理语音和对象识别

麻省理工学院的计算机科学家已经开发出一种系统,该系统基于对图像的口头描述来学习识别图像内的物体。给定图像和音频标题,模型将实时突出显示所描述图像的相关区域。 与当前的语音识别技术不同,该模型不需要手动转录和对其训练的示例进行注释。相反,它直接从原始图像中记录的语音剪辑和对象中学习单词,并将它们相互关联。 该模型目前只能识别几百种不同的单词和对象类型。 [详情阅读] 机器学习系统同时处理语音和对象识别

相关推荐