机器学习如何运作

时间:2019-03-27 08:48:45 阅读:20次

  回答这个问题,“机器学习是如何运作的?”有很多神话:它自动学习,不需要定制或使用它的组织进行任何修改,它适合任何企业案例,可以解决任何问题。但那些回应中哪一个是真的?

  与任何其他技术一样,机器学习(ML)在某些情况下具有巨大的商业价值潜力,但并非总是如此。尽管大型技术营销机器产生了炒作,但它通常不是分析非结构化信息的最佳解决方案。尽管你可能听说过,但IBM的Watson没有思考或推理。它不会在今天也不会在不久的将来这样做。这是(几乎)没有人想谈论的事实。

  正如本博文中所解释的那样,机器学习是“编程计算机执行任务的另一种方式;”因此,在询问“机器学习如何工作?”之前,设置对潜力的正确期望非常重要。机器学习业务,同时牢记没有什么魔法或新的。而且,虽然很容易得到(错误的)印象,即计算机可以迅速变得非常智能(在人类层面或超出人类水平,这要归功于人工智能),机器学习与人类智能关系不大。它只是一种通过培训“学习”并处理特定输入以便应用文本分析方法的技术。

机器学习技术的特征(及其局限性)

  虽然有几种机器学习技术,但它们都共享一个由统计和共现组成的类似核心。通俗地说,ML没有嵌入式知识,但需要一套培训文件(文件组越大越好)。该训练集必须由人员手动预先标记,以便算法可以记录文档中的内容并识别特定内容如何与特定标记配对的示例。这就是为什么ML不能自己做所有事情......在任何情况下都需要大量的手工工作!

  为了“学习”并识别与主题相关的文档,机器学习技术必须摄取与该主题相关的大量文档。它还需要手动标记涵盖此主题的大量文档以及不涉及该主题的类似数量。只有在通过查看共同发生和关键字频率处理许多文档后,系统才能识别文档的主题。

  受过训练的系统的准确程度将根据培训阶段使用的文件数量和这些文件中特定术语的范围而有所不同。系统还必须经常重新训练以保持相同的质量水平。信息过载会降低整个系统的速度,而过度拟合(过多的同类“流派”文档)会使系统不准确;换句话说,错误选择文件实际上会导致质量下降。

  在一篇着名的文章中,我们读到“通过机器学习,工程师从不知道计算机如何完成其??任务。神经网络的操作在很大程度上是不透明和不可思议的。换句话说,它是一个黑盒子。“这意味着可能的改进水平有限,而且通常很难理解为什么系统已经改进或者如何进一步改进它。对于机器学习系统,根本没有用于改进算法的工具。使用纯ML,您唯一的选择是为算法提供更多示例。遗憾的是,这并不能保证您能够改善结果或达到所需的准确度。

  如果发现任何错误或者由于任何原因需要修改受过训练的系统,整个过程必须回到原点。

从机器学习到认知AI

  回到我们的第一个问题,“机器学习是如何工作的?”我们可以说当我们拥有大量的样本文档时,机器学习很容易支持组织训练ML算法,我们必须面对一个简单的场景。作为纯ML的真正候选者的文本分析项目正是如此:低复杂性案例和大型训练集,其中所有可能的输出均衡分布。

  相反,当我们的场景涉及一小部分且不均匀分布的样本集和高复杂度时,ML是不够的。对于这些用例,您需要一个足够复杂的语言引擎,以确保深入理解内容和一组足够强大的工具,以确保开发和有效应用高级语言规则。

   Cogito认知技术堆栈提供了基于规则的认知技术功能和基于ML的算法的独特组合,以解决分析非结构化信息的最常见用例。结合最先进的人工智能技术,如机器学习,专有的语义和自然语言处理算法,Cogito确保在每种情况下都有更高的性能。

  观看此视频,了解Cogito与仅基于机器学习的其他技术之间的区别,以及Cogito如何为您的业务创造价值。

机器学习如何运作所属专题:机器学习 《机器学习如何运作》链接:http://www.zhouchuanxiong.net/1474

机器学习如何运作相关文章