学会回答非平凡的问题:通过深度学习推理知识库

时间:2019-03-06 18:39:43 阅读:6次

  虽然今天的大多数问答(QA)系统都擅长回答有关特定领域或主题的简单问题,但对能够跨多个不精确的域和实体回答问题的系统的需求不断增长。

   IBM Research的AI Foundations团队的新研究提出了如何通过创建一个最先进的系统来自动回答需要通过利用知识库进行多个重要步骤的问题来克服这一挑战;也称为KB。他们的研究将在本周在加拿大温哥华举行的计算语言学协会会议(ACL 2017)上进行详细讨论。

   KB是人类知识的巨大集合,以人类,组织,电影和日期等实体的形式以及这些实体之间的关系。例如,“罗伯特帕丁森”,电影“暮光之城”和“2008”,都有“电影主演”和“发行日期”等关系,这些关系存在于演员和电影之间以及电影和它首次亮相的日期。 / p>

  由于人类知识的广度和深度,KB已经成为现代问答系统最重要的资源之一。这样的系统,通常在研究社区中称为KB-QA,可以被认为是将输入问题映射到KB中的实体和关系的子图。例如,考虑到问题“Rob Pattinson在2008年播放了什么电影?”系统将首先识别实体“Robert Pattinson”和“2008”,然后检测将前一实体的答案连接为“FilmStarring”和后者为“ReleasedDate”。或者在下面的例子中,“Grant Show在2008年播放的电视节目是什么?”,系统使用“Grant Show”和“2008”作为实体,并检测到与“ StarringRole-Series“指向答案”SwingTown。“只有满足KB中上述约束的实体才能被选为答案。

   解析问题以执行实体链接和关系检测任务的KBQA系统示例。

  上述所有步骤都需要处理词汇或句法变体。例如,上述问题不包含实体和关系的确切形式。在第一个问题中,实体“Robert Pattinson”显示为“Rob Pattinson”,但问题中不存在“FilmStarring”的单词形式。同样对于实体,可能有多个具有相同名称的人。正是由于这种语言的变异和暧昧,KB-QA作为人工智能中的一个难题而闻名。

  我们研究的主要焦点是从问题文本中检测关系。基于观察结果,KB中定义的关系通常可以分解为子单元(例如描述关系的单词),并且通常较小的单元倾向于与问题中较短的短语匹配,团队提出了一个学习深度学习模型以不同方式对问题中的短词和长词进行编码,使得它们可以分别匹配关系中的不同粒度。例如,整个关系名称“FilmStarring”对应于长图案“movie did< somebody>在问题中扮演角色,而关于“电影主演”的子单元可以是“电影”和“主演”,它可以分别与问题短语“电影”和“播放”相匹配。

  另一种称为剩余连接的技术 - 以前由计算机视觉社区使用 - 进一步应用于处理由于语言变化导致长问题短语代表小关系单元的不太常见的情况。

  为了处理实体模糊,本研究还通过使用高级关系检测模型来过滤实体来改进KB-QA管道。关键的想法是,具有相同名称的不同实体倾向于连接到不同的关系,例如演员和政治家“罗伯特帕丁森”。当从句子中检测到的大多数顶级自信关系是关于电影和主演时,政治家实体将被过滤掉。

  新方法优于以前关于从问题中提取关系的几个基准的工作。它还有助于IBM KB-QA系统通过优秀的问题解答基准测试(如SimpleQuestions和WebQSP)实现最先进的性能,优于各组织的所有其他报告结果。

   改进的知识库问题回答神经关系检测

Mo Yu,Kazi Saidul Hasan,Cicero dos Santos,Bing Xiang,Bowen Zhou,IBM Research

   Wenpeng Yin,慕尼黑大学信息与语言处理中心

学会回答非平凡的问题:通过深度学习推理知识库所属专题:知识库 推理 《学会回答非平凡的问题:通过深度学习推理知识库》链接:http://www.zhouchuanxiong.net/847

学会回答非平凡的问题:通过深度学习推理知识库相关文章

  • 脑启动AI:神经科学如何帮助推进机器学习
  • 使用深度学习来预测海浪
  • 深度学习的开放标准,以简化神经网络的发展
  • 使用物联网和机器学习来跟踪肺病的进展
  • 机器学习过去常常超过MELD来评估肝脏疾病
  • IBM科学家证明使用GPU可以将大规模机器学习速度提高10倍
  • 分布式深度学习培训控制提供10倍的性能提升
  • ROMEO寻求通过机器学习和边缘物联网改善风电场
  • 从研究论文中自动生成深度学习模型的代码
  • 攻丝机学习促进更多地利用仿生学进行创新
  • 深度学习培训时间显着减少
  • IBM Research的深度学习进展
  • IBM利用POWER9和NVIDIA GPU设置万亿级机器学习基准记录; PowerAI即将推出
  • 一种用于大规模图的可扩展深度学习方法
  • 在强化学习中发现特征选择的新算法
  • 加速机器学习算法的培训
  • 使用深度学习生成餐厅评论
  • 使用OpenCV和深度学习在视频中跟踪对象
  • 开发一个使用机器学习的基于Web的移动健康应用程序
  • 在Kubernetes上部署和使用多框架深度学习平台
  • 创建一个Web应用程序以与机器学习生成的图像标题进行交互
  • 创建一个Web应用程序,以便与使用机器学习检测到的对象进
  • 机器学习模型的性能评估
  • 构建机器学习推荐引擎,以鼓励基于过去购买行为的额外购买
  • 使用内部部署数据训练基于云的机器学习模型
  • 使用Watson Machine Learning和IBM Db2 Warehouse on Cloud持续学习
  • 部署深度学习驱动的“魔术裁剪工具”
  • 使用机器学习预测心脏病
  • 使用Watson OpenScale监控自定义机器学习引擎
  • 使用Watson OpenScale监控Sagemaker机器学习