机器学习

DataRobot首次成为2019年Gartner数据科学和机器学习平台魔力象限中的“有远见者”

   Gartner着名的数据科学与机器学习平台魔力象限2019年本周问世,DataRobot定位于'Visionaries'象限。与其他两家供应商一起,我们还实现了视力完整性最远的总体职位之一。对于那些关注MQ的人来说,我们认为这是一个令人印象深刻的首次展示,并强调了我们对市场的破坏性影响。毕竟,我们是创建自动化机器学习类别的公司。去年,我们选择不参与MQ,但Gartner对市场的影响是不可否认的。   我们的想法似乎与Gartner一致,特别是在增强分析方面。 Gartner在2019年的十大战略技术趋势中表示,“到2020年,超过40%的数据科学任务将实现自动化。”并且,“到2020年,公民数据科学家的数量将比专家数据快五倍科学家“。  我们在开发增强分析平台方面投入的资金超过任何其他供应商,我们的客户正在使用这种平台来改变其运营方式。借助DataRobot前所未有的自动化程度,数据科学技能在整个组织内实现民主化 - 使数据科学家能够提高工作效率,使企业用户能够充当公民数据科学家,并将人工智能和机器学习注入每项关键业务决策。     这就是为什么我...      

使用自动机器学习来预测NBA球员的表现

2018年NBA总决赛如火如荼,今年是克利夫兰骑士队连续第四次面对金州勇士队。随着勒布朗詹姆斯和斯蒂芬库里领导他们的球队,这场竞争肯定会使今年的季后赛成为历史书籍之一。   对于NBA中的一些顶级天才,克利夫兰骑士队和金州勇士队是其他NBA球队希望推翻的球队。每个NBA球队都在不断寻找优势,随着美国职业棒球大联盟等其他体育项目的分析成功,NBA球队正在寻求机器学习和人工智能(AI)等先进技术,以获得竞争优势。  体育组织内有许多AI应用程序,包括销售和营销,商品推销,聊天机器人,计算机视觉和可穿戴技术,但这篇博文主要关注特定应用 - 预测播放器性能。从球迷的角度来看,球员表现更有趣!   玩家表现指标   评估玩家表现的方法有很多种。在最基本的层面上,篮球比得分更多得分,所以自然每场比赛都是一个不错的起点。但是,还有其他方法来量化玩家的表现,其中一些方法变得非常复杂,如Box Plus Minus或玩家效率等级。  对于本博客,我将逐步介绍DataRobot如何通过游戏分数(game_score)衡量玩家表现的预测。  游戏分数...      

什么是Spark的机器学习?

  随着技术日新月异,竞争激烈的世界不断发展,各种用户专注的数据产品不断发展,对机器学习的需求也随之增加。机器学习可用于在个性化,推荐和预测性见解方面取得进展。通常,这些问题在R和Python的帮助下得到解决,但随着组织不断堆积数据,数据科学家们将更多的时间用于维护基础设施,而不是提出解决数据问题的模型。 Spark已经考虑到了这些功能。 使用Spark进行机器学习 M-Llib是Spark提供的通用机器学习库,其设计具有可扩展性,简单性和易于与其他工具同化的特点。 Spark具有以下关键功能: - 可伸缩性 语言兼容性 速度   数据科学家能够快速有效地解决和迭代数据问题。因此,M-   R和Python是流行的语言,用于解决大量模块或包以解决数据问题。但是它们的使用现在非常有限且耗时。它们的绝对性增加了这些语言需要采样和广泛的工程。 Spark通过以下特征解决了这些问题: - 快速统一引擎。 使用起来非常简单。 允许数据从业者解决机器学习问题。 解决图形计算。 Streaming。 实时互动查询处理。 提供许多语言...      

如何自动化机器学习

  六年前我们推出DataRobot时,人们笑了。 “自动化机器学习?”他们哼了一声。 “哈哈!它永远不会奏效!“   专家嗤之以鼻。 “你永远不会自动化机器学习。你会得到一个弱模型。你会得到一个会破坏你的业务的有偏见的模型。“  六年来,数以百计的客户,成千上万的用户以及近十亿的模特,他们不再笑了。   今天,不少供应商声称提供自动化机器学习。大公司和小公司;传统公司和创业公司。我们很激动。模仿是最真诚的奉承形式。   然而,我们注意到这些DataRobot模仿者的一些惊人之处。  他们做错了。  有一种自动化机器学习的正确方法。并且,有许多不同的错误方式。我们创建了一个指南,帮助您了解成功实现自动化的十个关键组件。   但首先,这是自动化机器学习最常见的错误方法。   假自动化  有些人似乎对自动化某些东西意味着什么感到困惑。   例如,一家供应商提供了一个用于分析的拖放工具,并称之为“自动化”。拖放式UI很不错。拖放比编写优秀的Python代码要容易得多。但是用户仍然必须知道要拖动什么以及放下它的...      

用自动机器学习理解歌曲流行度

   Spotify在2008年向大众推出音乐服务后掀起了波澜,允许用户流式传输音乐而不是购买唱片或在iTunes上购买歌曲。用户数量几乎是竞争对手Apple音乐的两倍。 Spotify仍然是那些想要听音乐而不必购买所需歌曲或专辑的人的主要来源。   前创业公司的一个很酷的方面是,他们的大部分音乐信息(艺术家,专辑,曲目等)都是通过网络API公开的。这包括每首歌曲的属性,例如它的节奏,它有多少能量,它有什么键,等等。就个人而言,我一直对流行歌曲背后的机制着迷。它们的一般特征是什么?他们通常有更多的高能量节拍吗?一定的长度?好吃的名字?我开始使用自动机器学习平台DataRobot凭经验调查这些事情。   数据收集   使用R包spotifyr,我从出现在广告牌年终图表 - 热门100首歌曲列表中的艺术家那里抽出了唱片,可追溯到2010年。该图表根据广播播放情况对艺术家进行排名所有类型的销售数据和流媒体活动。当然,虽然这些艺术家将有流行歌曲,但并非所有的音乐都是热门歌曲。因此,对2010-2017所有歌曲的流行度进行建模将使我们能够研究将流行曲...      

热点推荐