AI体验旧金山:农民保险集团,Airbnb和Adobe的亮点

时间:2019-03-15 13:16:43 阅读:35次

  人工智能是硅谷(及其他地区)最热门的话题之一。在6月12日星期二举行的AI体验路演中,数百位好奇的湾区高管,分析师和数据科学家在旧金山W酒店随时了解自己,成为人工智能驱动的企业意味着什么。感谢三位DataRobot用户,这些与会者能够亲眼目睹自动化机器学习如何帮助他们的组织实现AI驱动的愿景。

   <! - 多 - >


Yashar Mehdad(Airbnb),Scot Barton(农民保险),Gourab De(DataRobot),RobLiebscher(Adobe)

  

演讲者1:Scot Barton,Farmers Insurance的商业保险研发负责人

   Scot一直理解将数据科学应用于保险业内大量可用数据的潜力,以及如何这可以为定价,索赔处理和客户服务等用例产生强大的结果。但是,在他们开始使用DataRobot之前,始终有一个重要的数据来源让Scot和他的数据科学团队望而却步:

文本分析。

  计算机在处理数字数据方面做得很好,但是当涉及到分析文字和文本时 - 通常在保险应用程序中找到 - 他们很难。苏格兰警告说,数据科学团队甚至不能考虑将文本数据(构建模型中尚未开发的资源)包括在内,直到他们使用Ensemble Models成熟,这是DataRobot自动生成的。

  

  对于苏格兰人和农民保险公司来说,DataRobot是一个工具,甚至他的团队中的一名初级数据科学家也可以用它来做出预测,展示结果并加速商业对话。

  在他的演讲中,苏格兰人深入研究了文本分析的一些复杂性 - 词序,语境,标点符号,词干,停止词 - 并分享了解决这些问题的解决方案。例如,可以阻止来自调查的文本(即“会议”和“会议”处理相同)并停止删除单词(即“the”和“this”之类的单词)。然后可以将其余单词标记化为包含1s和0s的表以及为每个调查记录创建的向量。使用这些方法,Scot的团队可以清理和准备文本数据,然后将这些数据输入预测模型。

  正如Scot解释的那样,文本分析通常需要花费很多时间,这使得它成为一个完整的独立项目。通过使用DataRobot的自动化机器学习平台,文本分析成为“一个额外的推动按钮”:

典型的文本分析步骤
使用DataRobot

  研究R / Python封装

  自动

  安装和配置包

  自动

  获取词汇数据集

  自动

  训练图书馆/载体

  自动

  加载建模数据集

  手册

  清理 - 词干

  自动

  清理 - 删除停用词

  自动

  决定运行哪些模型

  自动

  运行模型

  自动

  分析结果

  手册

  考虑合奏

  自动

  使用DataRobot自动执行上述步骤意味着典型的文本分析建模项目现在需要Scot和他的团队日,而不是手动方法所要求的几周。与手动流程相比节省时间和生产力,使他有限的数据库科学家能够在更具挑战性和创造性的数据科学项目中工作。

   DataRobot不仅对Scot在自动化繁琐的手动流程中有用。使用DataRobot的有用副产品之一是将数据科学发现传达给业务受众。例如,通过使用DataRobot的Word Cloud(下面的示例),Scot的团队可以提供显示单词在数据集中出现的频率(由单词大小表示)以及是否具有预测性(由红色表示)的结果或蓝色)。 Word Cloud是一种可视化某些词对模型预测能力的影响的快速方法。

  

  

  对于苏格兰人和农民保险公司来说,DataRobot是一个工具,即使是他的团队中的初级数据科学家也可以用它来做出预测,展示结果并加速商业对话。

  

演讲者2:Airbnb的数据科学经理Yashar Mehdad

   Yashar用他自己的话说,“很长一段时间”一直在做数据科学。回到刚刚开始时,自动化就是在很大程度上不存在,这意味着Yashar在进入生产之前需要进行大量的手动操作。这极大地限制了他建立和运行大量模型的能力。

  当他开始使用DataRobot的自动化机器学习平台时,Yashar很快发现他定义,开发和完成机器学习项目的能力大大提高。

  根据Yashar的说法,他发现DataRobot特别适合:

  提高生产力和节省时间


  设置基线,一个过去需要几个星期的过程,现在需要几个小时


  参数优化实验


  离线分析和评估


  有用的R&amp; Python API


  他的数据科学家团队之间的合作,以及与整个组织的业务运营商分享成果


  最关键的是,DataRobot有助于通过引入顶级数据科学家的专业知识和自动化多传统工艺所要求的“繁重的工作”的解决对真正有才华的科学数据资源的需求没有得到满足。

  

  结果

  这些好处很快就融入了Airbnb的一系列机器学习项目和计划,由Yashar和他的团队牵头。 Yashar鼓励不同部门开展能够带来可观投资回报的机器学习项目,从而有效地使整个组织的数据科学民主化。在Airbnb,DataRobot用于从定价调整和销售预测到商品推销操作和客户个性化的项目。

  在演讲中,Yashar深入探讨了一个用例:Airbnb客户支持团队的细分和路由优化。客户支持在Airbnb是一项非常重要的功能,受到了极大的关注和投资。任何有助于客户支持团队节省资金或提高效率的举措都至关重要,而细分和路由优化就是一个具有巨大价值的项目。

   Airbnb的客户支持分为两组:旅行社和非旅行社。目前正在旅行的客户遇到的问题更为紧迫和复杂,需要作为最优先处理的问题处理。非旅行客户的支持票不太重要。当客户致电或提交支持票时,票证将被路由到相应的组中。有时,票证将从非旅行升级到旅行,平均而言,每次升级都会使代理时间增加50%。通过确保初始路由准确,能够尽可能减少不必要的升级,每年可以为Airbnb节省数百万美元。

  

  在确定DataRobot中最准确的模型,调整和调整之后,Yashar和团队决定对5%的实时门票进行实验,团队看到了对旧模型的重大改进。

  为了解决这个问题,Yashar和团队决定从严格的基于规则的路由模型迁移到更复杂的上下文机器学习模型。该团队收集历史数据,并从两个组中创建和关闭的故障单创建数据集,包括呼叫者用户功能,预订对应特征,历史取消等功能。

  在将数据引入DataRobot并选择升级作为预测器之后,平台会针对数十个适当的模型快速测试数据,以了解他们如何预测呼叫是否应该升级。在确定了DataRobot中最准确的模型,调整和调整之后,Yashar和团队决定对5%的实时门票进行实验,并且团队看到了对旧模型的显着改进。因此,他们决定在所有100%的支持票中推出它。

  新模型的首次推出导致了Yashar所描述的消防月份,他的团队正在梳理模型和数据。大规模发射的效果不如样本集实验;部分问题是他们在数据集中遗漏了一些有价值的上下文数据。 Yashar和他的团队对数据中的大量噪音进行筛选以清理它并找到信号,然后再回过头来调整模型几次。当它最终投入生产时,他们新的和改进的模型大大改善了升级门票的细分和路由。

   Yashar在完成这个项目时学到了几个教训,包括:

的重要性

  教育自己重要的指标 - 数据科学家与更熟悉特定问题的复杂性的业务专家密切合作非常重要。


  数据质量 - 如果你把垃圾放进去,你会得到垃圾。了解您的数据,了解什么是信号,什么是噪音。


  开放思想 - 最初并不总是你想到的。可以制定假设,但不要使用严格的先入为主的观念进入项目。接受你不了解一切的事实。


  了解建模只是您作为数据科学家工作的一部分 - Yashar强调这是他学到的最重要的经验教训。许多数据科学家如此专注于建立一个模型并继续前进到他们错过森林的树木。对他们来说,花时间了解他们放入模型的数据非常重要。


  
最重要的是,数据科学家必须了解他们所从事项目的商业价值。像DataRobot这样的自动化机器学习平台是一个很好的工具,但数据科学家必须超越工具。正如Yashar所说,它们必须比机器更好。人类为机器创建的这个模型增加了什么价值?您能否清楚,有效地向组织的其他成员传达业务价值和预测结果?

  

演讲者3:Adobe的高级数据科学家Rob Liebscher

  对于Rob和他在Adobe的团队,他们与DataRobot的合作是基于解决市场营销中最着名的报价之一:

   “我花在广告上的一半资金浪费了。麻烦的是,我不知道哪一半。“ - John Wanamaker

  每个营销部门面临的一个古老问题是归因问题:确定您在哪里花费营销资金以及哪些渠道回报最多的投资。有多种多点触控营销归因模型 - 针对每位客户,考虑到销售之旅中的每个转化事件和接触点,如下表所示:

付费搜索
显示广告
电子邮件点击
展会
网络访问

  最后触摸

   0%

   0%

   0%

   0%

   100%

  首先触摸

   100%

   0%

   0%

   0%

   0%

  线性

   20%

   20%

   20%

   20%

   20%

  位移说明

   35%

   10%

   10%

   10%

   35%

  时间衰退

   14%

   17%

   20%

   23%

   26%

  算法

   23%

   13%

   11%

   45%

   9%

  所有模型都是不完美和主观的,每个模型在绘制整体营销归因图片时都不完整。最准确的模型类型是算法,为了实现这一目标,Adobe倾向于使用DataRobot。

   Rob和团队开始根据营销方式构建转换模型。该模型主要关注Adobe企业漏斗的顶端,在销售中的客户开发经理接受之前,会考虑创建潜在客户并将这些潜在客户转化为营销合格潜在客户的所有营销活动。收集他们的数据集并建立模型后,Rob发现初始基线模型在准确性方面还不错。但是,当他们将相关信息添加到数据集变量(如职位,职能领域,垂直,公司规模和位置)时,模型的准确性大大提高。

然后,Rob将他的模型应用于Shapley Value方法,这是一种源自合作博弈理论概念的营销归因方法。 Shapley Value方法的一般目的是在不同的个人之间公平地分配信用或价值,或者在营销的情况下,公平地分配不同的渠道。这种方法很有价值,因为它比上一次触摸,线性或上述其他归因方法更能更准确地测量实际贡献。它还与模型无关,与各种不同类型的预测模型同样良好。

  

  当比较百分比归因分类与每个频道的实际美元支出时,Rob的团队现在清楚地了解了哪些工作正在进行,以及Adobe应该将其营销工作重点放在哪里。

  对于大多数尝试实施Shapley Value方法的营销人员来说,需要大量的人工计算来确定边际贡献的基线。然而,根据Rob的说法,使用像DataRobot这样的工具,实现起来变得非常简单。在设置基线,模拟场景(从双接触点归属开始),计算平均场景,然后计算各种不同渠道的贡献后,Rob的团队能够在Adobe上提供完整且准确的营销效果归因分类。在比较百分比归因分类与每个渠道的实际美元支出时,Rob的团队现在清楚地了解了哪些工作正在进行,以及Adobe应该将其营销工作重点放在哪里。

  

共同主题

  在人工智能体验中,三位发言人都讨论了数据科学家对这一过程的重要性,他们每个人都宣布他们各自的公司正在招聘数据科学家。虽然DataRobot在这些组织的数据科学民主化方面做了奇迹,并解决了缺乏可用数据科学资源的问题 - 使他们能够高效,有效地继续开展机器学习项目 - 数据科学家仍然至关重要......而且很少见。随着以前手动流程的自动化,Farmers Insurance,Airbnb和Adobe的数据科学家现在可以自由地开展更具创造性和挑战性的数据科学项目,以适应他们的技能和专业知识。

  

   AI Experience的下一站将于6月20日在纽约市举行。我们希望能在那里见到你!

  

AI体验旧金山:农民保险集团,Airbnb和Adobe的亮点所属专题:AI 《AI体验旧金山:农民保险集团,Airbnb和Adobe的亮点》链接:http://www.zhouchuanxiong.net/1251

AI体验旧金山:农民保险集团,Airbnb和Adobe的亮点相关文章