深度学习定义和好奇心

时间:2019-04-04 15:45:01 阅读:27次

深度学习定义

  定义深度学习有不同的方法,但总的来说,深度学习是一类机器学习算法,可以应用于结构化或非结构化数据的世界。如果我们关注非结构化信息,我们通常会将文本挖掘视为深度学习解决方案执行的典型任务。

  机器学习世界中有几种算法用于执行文本挖掘,换句话说,从文本中提取知识,但它们都共享相似的统计核心(关键字的分布和频率)和共现。文本挖掘解决方案最常见的三种应用是自动分类,实体和概念提取以及自然语言问答。

深度学习解决方案的工作原理

  简单来说,深度学习解决方案(例如自动分类)需要使用许多文档进行培训(越多越好)。为了使算法识别和存储内容中包含的内容并将特定内容链接到相关标签,这些文档必须已经由人们进行分析和描述(标记)。

  例如,对于深度学习系统来识别有关金融的文档,必须对其进行培训。这意味着系统必须处理许多标记为“财务”的财务相关文档以及许多标记为“非财务”的其他内容。在分析这些文档时,系统会跟踪它在文档中找到的所有模式,关键字和序列。与实体或概念提取和自然语言问答相关的深度学习解决方案以类似的方式工作。

  一旦存储了所有这些信息,就说深度学习系统是训练有素的。实际上,培训阶段几乎可以无限期地继续进行,但超过一定数量的文件处理后,性能的提升是有限的。

如何衡量深度学习解决方案的性能

  与自动分类相关的深度学习解决方案的性能是根据精度和召回来衡量的。
精度是指文档的数量正确分配给一个类别,除以分配给该类别的文件总数。
召回是分配给类别的正确文件数,除以样本中应分配给该类别的所有文件。类别。

  当训练有素的深度学习系统处理新文档时,它会将从该文档中提取的数据(关键字,频率和分布)与存储的数据进行比较。如果新文档包含的模式类似于编码为“财务”的文档的已知模式,则系统将识别新文档正在讨论财务。

  因此,训练有素的深度学习解决方案的准确度(精确度和召回率)将根据培训阶段使用的文档数量以及这些文档中包含的特定主题术语的覆盖范围而有所不同。

  纯粹的深度学习系统由于采用纯黑盒方法而具有显着的实施成本和限制。他们的文本挖掘性能往往不足以完成更复杂的任务。因此,今天,金融,能源,情报,执法和生命科学等部门的组织倾向于寻求基于语义的系统,以达到所需的性能水平。

上一篇:什么是机器学习     下一篇:已是最后一篇
深度学习定义和好奇心所属专题:深度学习 《深度学习定义和好奇心》链接:http://www.zhouchuanxiong.net/1653

深度学习定义和好奇心相关文章

  • 大数据分析的机器学习
  • 机器学习应用程序:它们如何工作
  • 关于机器学习(和深度学习)的真相
  • 机器学习如何运作
  • 什么是R编程语言的机器学习
  • 什么是Spark的机器学习?
  • 机器学习用例 - 物联网,预测性维护,情感
  • 大公司在2018年选择机器学习的5个原因
  • 2018年应避免学习的5种最差编程语言
  • 沃尔多在哪里?使用机器学习查找所有Waldos
  • 机器学习中的技术包容与多样性
  • 您的第一个深度学习项目是API呼叫
  • 与DataRobot合作,将机器学习引入AI驱动的组织
  • 业务分析师如何征服机器学习
  • AI简化:什么是自动机器学习?
  • 为什么机器学习是军队招募和保留的未来
  • 利用自动机器学习加强您的反洗钱计划
  • 使用自动机器学习来预测NBA球员的表现
  • 自动机器学习对管家医疗保健的影响
  • 挑选自动化机器学习试点项目的5个技巧
  • DemystData如何使用自动化机器学习为其数据科学家提供支持
  • 利用机器学习识别财富管理中的潜在客户前景
  • 自动化机器学习如何赋予数据科学家权力
  • 自动化机器学习和银行业[信息图]
  • 成功的CECL符合自动化机器学习
  • 利用自动机器学习将梦幻足球分析提升到新的水平
  • 企业不能等待 - 了解自动化机器学习如何填补数据科学空白
  • 自动机器学习是真实的:托马斯达文波特和我的妈妈这么说
  • 使用DataRobot和Amazon SageMaker使数据科学团队能够应对机器学习的挑战
  • 用自动机器学习理解歌曲流行度