使用DataRobot和Amazon SageMaker使数据科学团队能够应对机器学习的挑战

时间:2019-03-14 21:44:44 阅读:41次

  为什么机器学习如此困难

  对于开发人员,数据工程师和数据科学家而言,机器学习过程可能具有挑战性 - 构建,培训,然后将模型部署到生产中既复杂又耗时。

   <! - 多 - >

  •   首先,您需要收集并准备历史训练数据,其中您知道您要预测的结果,这些数据将用于发现数据集的哪些元素很重要。


  •   接下来,您需要选择最佳算法来拟合数据和结果,并提供准确的模型。


  •   在决定进近之后,您需要训练算法以使用历史数据进行预测,这需要大量的计算时间和精力。


  •   然后,您需要调整所选模型,以便提供最佳预测。这通常是一个繁琐而复杂的过程,需要大量的手动工作。


  •   在开发完全训练有素的模型后,您需要将模型与应用程序集成,并将此应用程序部署在可扩展的基础架构上。


       DataRobot和亚马逊网络服务(AWS)认识到这些步骤需要专业的专业知识,访问大量的计算能力和存储,以及时间来试验和优化流程的每个步骤。最后,很明显为什么机器学习对大多数开发人员和数据科学团队来说都是如此耗时且困难。

      为了确保机器学习成功,DataRobot和Amazon SageMaker提供了强大的工具组合,使开发人员和数据科学团队能够解决机器学习过程的复杂性。

      

      建立模型变得更容易

      亚马逊SageMaker的重点是规模,成本效益,自动化和安全性。 AWS SageMaker软件致力于改进机器学习过程并提供:

  •   构建和训练模型的极大灵活性。预先配置的深度学习框架,BYO支持和内置算法为数据科学家和开发人员带来了价值。


  •   可扩展的模型培训。 SageMaker可以通过各种AWS实例类型和高度可扩展的分布式培训环境来处理大规模机器学习工作负载。


  •   具有高可用性和低延迟的高弹性和可扩展托管环境,这对于部署到生产中的模型至关重要。


       DataRobot是AWS机器学习能力合作伙伴,通过为用户提供自动化机器学习的强大功能,为SageMaker提供补充。使用DataRobot,用户可以在几分钟或几小时内快速构建,培训,验证和调整数千种机器学习模型组合,并根据自己的数据和他们想要完成的内容快速选择最佳模型。 p>

      根据用户的环境和工作方式,用户可以选择进行预测或部署模型。 DataRobot提供按需评分,带有Java或Python导出代码的可移植预测,以及一个REST API,允许DataRobot作为预测引擎,只需很少的编码。此外,DataRobot还为Hadoop环境中的安装提供了Spark Scoring。 SageMaker提供了自己的部署功能,并提供了一个编码环境,数据科学团队可以协同工作,进一步培训和调整模型。在DataRobot上训练模型后,可以将其导出到一个文件中,该文件包含模型以及调用模型的代码。然后可以使用“自带容器”方法在Amazon SageMaker中部署此模型。这个简单的方法涉及将此Python模型打包到AWS提供的基本容器中。这里显示了一个例子。

      借助DataRobot,SageMaker用户可以访问领先的自动化机器学习平台,以优化和加速机器学习模型的开发和部署。与SageMaker环境相结合,各种规模的企业都能够创建高效的数据科学解决方案,涵盖数据准备,协作,模型构建,部署和长期模型维护。所有这些都在坚如磐石的AWS平台上!

       DataRobot开发了样本笔记本,向您展示如何使用DataRobot自动化机器学习平台与Amazon SageMaker以最快,最有效的方式构建和评估自定义机器学习模型。

      

      

  • 使用DataRobot和Amazon SageMaker使数据科学团队能够应对机器学习的挑战所属专题:机器学习专题 《使用DataRobot和Amazon SageMaker使数据科学团队能够应对机器学习的挑战》链接:http://www.zhouchuanxiong.net/1227

    使用DataRobot和Amazon SageMaker使数据科学团队能够应对机器学习的挑战相关文章