汲取美国鲨鱼坦克数据

时间:2019-03-13 20:10:28 阅读:19次

   鲨鱼坦克是美国着名的以企业家为主题的真人秀节目,由于以下几个原因而受欢迎:它激发潜在的企业家,教授有关创业,这很有趣。

   <! - 多 - >

  对于在Shark Tank上展示的创业公司创始人来说,这是一次千载难逢的机会,希望能够确保Shark在他们的创业公司投资。同样,投资鲨鱼,他们自己已经是百万富翁或亿万富翁,可以帮助这些有前途的创业公司,并为他们的投资带来可观的回报。例如,自Lori Greiner 2012年投资20万美元投资20%后, Scrub Daddy的总销售额超过1.7亿美元。

  为了更好地了解美国鲨鱼坦克现象,我们将来自 Sharkalytics 的数据(其数据持续到第7季和一些有趣的Shark Tank可视化), ABC 维基百科 Halle Tecco的数据库和Google。这个美国鲨鱼坦克数据集由第1季到第9季的199集中的所有803个创业投手组成。对于每个投注,我们知道日期,情节,描述和要求,基本启动信息,企业家性别和交易。

  在这篇博客中,我们将预测观点,无论是否在投入坦克之前达成协议以及哪条鲨鱼可能赢得交易。

  

视图预测

  鲨鱼坦克在第6季后开始失去电视观众,并有各种各样的想法来解决它。我们想估计美国。观众(数百万)用于未来剧集,并审查影响收视率的一些因素。

  实验设计:

  • 数据:803个投球和22个特征(目标特征是观众)
  • 公制:R平方
  • 回归模型:13
  • 分区:随机,8倍交叉验证(每次折叠超过观测预测的最佳模型是极限梯度增强树回归量和RuleFit分类器的平均混合器,具有良好的R平方为88%。

      

       十大功能包括季节,剧集,星期几,询问资产,鲨鱼,行业,州,交易评估,询问金额和询价。

      

      

       季节:回想起来,第6季(2014年至2015年)是电视剧集的高峰期,观众人数超过700万。随后几季的收视率持续下降。 Shark Tank在流行的在线流媒体网站上的可用性,例如 Hulu Netflix 可能是导致这种下降的原因之一。目前尚不清楚收视率是否会在第10季及以后继续下降,因此季节数据可能不是观看预测的有用功能。

      

      

       剧集:在第14到第20集(第8季和第9季每集共有24集)中,通常会有更高的电视收视率。这可能是因为人们可以在家里花更多时间看电视的冬季。

      

      

       星期几:与周二和周日相比,电视黄金时段的周五(以4表示)往往会有更高的收视率(分别由1和6表示)。

      

      

       鲨鱼:鲨鱼名称的大小表示它们在鲨鱼坦克上一起出现的频率,颜色表示与收视率数字的相关性。红色是最高收视率,蓝色是最低收视率。

      以下是一些有趣的见解,可以使用DataRobot轻松观察到:

  • 收视率最高的是Herjavec和Cuban一起出现的剧集,或者在早些时候有一些客人鲨鱼,如Nick Woodman, John Paul DeJoria和Steve Tisch
  • O'Leary与Cuban 或Corcoran一起出现时,收视率通常高于Greiner和Corcoran
  • 最近的收视率来自客串鲨鱼(例如Alex Rodriguez,Rohan Oza,Sara Blakely和Bethenny Frankel)在最近的一个赛季中
    < p>

    交易预测

      在他们的投资者宣传之前,这对创业公司的创始人来说可能是令人头疼的事。我们希望通过交易预测来理解:创业公司在进入油箱之前获得交易的可能性有多大?影响交易或没有交易的原因是什么?

      实验设计:

  • 数据:803个投球和11个特征(目标特征是交易)
  • 公制:AUC(AUC下)选择ROC曲线是因为它可以直观地向商业用户解释。
  • 二进制分类模型:14
  • >分区:分层,8倍交叉验证

      最佳交易预测模型是弹性网络分类器和极限梯度提升树分类器的平均混合器,AUC为60%。

      

       十大功能包括描述,状态,询问金额,询问估价,性别,要价,行业,插曲,鲨鱼和季节。

      

      

       描述:“质量”和“设计”(参见 Tipsy Elves [ pitch ])是与交易相关的一些关键词。 “服务”是与没有交易密切相关的关键字,这是有道理的,因为Shark Tank更多的是寻找可以变得更加成功的有形产品,而基于服务的创业概念更难以呈现和理解。利用这些见解,企业家可以定制他们的创业公司描述,以获得更好的交易率。

      

      

       状态:“IL”(参见 SockTABS [ pitch ]),“FL”和“UT”具有更高交易概率的初创公司“或”和“MA”。

      

      

       性别:女性企业家(参见 Riveter [推销])和混合团队获得投资的机会略高。

      

      

       行业:“媒体/娱乐”(参见 Ten Thirty One Productions [ pitch ]),“Lifestyle / Home”,“Food&Beverage”更受欢迎的类别; “汽车”,“时尚/美容”,“其他”(如“商业服务”)则不那么重要。

      

    鲨鱼预测

      对于每个参加比赛的鲨鱼,他们必须决定是自己提出报价还是与其他鲨鱼合作。如果提出要约,创业公司创始人可以选择接受,协商或拒绝此交易;或者选择另一个Shark的竞争优惠。换句话说,鲨鱼赢得交易可能很难,所以我们想做一个鲨鱼预测:哪个鲨鱼有可能赢得这笔交易以及为什么?

      实验设计

      数据:11个功能(目标功能是deal_by_&lt; shark_name&gt;)


      指标:AUC


      二进制分类模型:14


    Shark NameAttendanceWins预测准确度Lori Greiner72%18%60%使用弹性网和轻度梯度增强分级器的平均搅拌器进行分层5倍交叉验证Barbara Corcoran58%16%64%使用弹性网和TensorFlow分级器的平均搅拌器分层4倍交叉验证Roobe Herjavec92%11%54%使用RandomForest和广义Additive2分类器的平均混合器进行分层7倍交叉验证Kevin O'Leary96%8%55%使用弹性网和光梯度增强分级器的平均混合器进行分层7倍交叉验证戴蒙德约68%14%53%使用SVM和N-Gram文本分类器的平均混合器进行分层5倍交叉验证Mark Cuban89%18%54%使用弹性网和TensorFlow分级器的平均混合器分层7倍交叉验证

      我们深入研究Barbara Corcoran的模型,因为它具有64%的最高AUC。

      

       Corcoran的十大功能包括描述,询问估值/净值/金额,性别,季节,行业,州,情节和鲨鱼。

       Corcoran通常提供并赢得投资,当时:要价估值低于200万美元,要价权益为10%或更低,要价金额低于10万美元。她倾向于支持女企业家,食品和饮料创业公司,并且通常在赛季结束时获得更多胜利。

      

       以上是对验证数据最佳预测的解释,其中Corcoran最有可能赢,而不是赢。例如,ID 139指的是 Wild Friends Food [ pitch ],其中Keeley&amp; Erika要求5万美元换取10%的股权。 Corcoran提出了唯一的要约,最终成为了投资者。另一个例子是ID 322,它指的是 SynDaver Labs [ pitch ],其中男性创始人要求并接受Herjavec的3M提议。 Corcoran是第一个出去的鲨鱼。

      

    结论

      使用 DataRobot ,我们自动在数字,分类和文本数据上构建了许多高质量的模型。我们探索了对视图,交易和鲨鱼预测的最佳模型的见解。

      将来可以使用DataRobot在从美国鲨鱼坦克视频/音频中提取的全音域抄本(文本中)中捕获实际的程序(例如企业家的介绍和演示,Q&amp; A和鲨鱼的讨论) 。此外,这项工作可能会扩展到其他国家的“鲨鱼坦克”,通常称为 Dragons'Den ,例如加拿大 UK

      

  • 汲取美国鲨鱼坦克数据所属专题:美国专题 汲取专题 《汲取美国鲨鱼坦克数据》链接:http://www.zhouchuanxiong.net/1198