万个问题,而这个社区的魅力在于人们可以非常公开地分享他们的解决方案。例如,如果我构建了一个解决方案,在领导者排名区排名第100位,我会把它发布到这个Light Channel上,并告诉大家这是一个脚本,可以让你排名上升到100位,然后继续改进它。这样你就得到了这种资源池。我见过一些人仅仅因为积极参加这些黑客马拉松就成为了更优秀的数据科学家。人们参加这些黑客马拉松的两三天时间里,学到了很多他们在工作或
课程中无法学到的东西。从这个意义上说,黑客马拉松提供了这个真
正独特的机会,无论你是否赢得比赛,在黑客马拉松中都能学到大量的知识。通常,在两天的时间内,我们看到社区成员之间会交换一万到一万五千条信息。我们 特殊数据库 平均每个参与者会收到八到十个解决方案。人们尝试各种模型,各种工具和技术,到黑客马拉松结束时,他们会被标记出自认为
的最佳解决方案。人们会上传该解决方案,然后平台会根据其准确性或预先设定的一些标准自动对解决方案进行评分。当参与者完成后,平台会实时设置一个领导者展位,并确定你的排名,之后招聘流程就会立即启动。这就是典型的黑客马拉松的运作方式。
如果你想参加黑客马拉松,我认为最好的
办法是从Analytics Vidhya上的一些练习题开始。它们能让你对这些问题有所了解,但在非竞争性的环境中,你可以在博客上找到这些问题的教程。你还会找到一个基准测试脚本。这是一个很好的起点,可以帮助你了解如何改进你的模型,或者了解哪些工具和技术可以用来改进 什么是销售漏斗你的模型,无论你使用的是Python、SAS还是其他任何工具。在参加竞争性或奖金黑客马拉松之
前,练习一些已知问题或练习题是一个很好的练习。完成这些练习后,如果你是新手,你应该再次尝试看看其他人在做什么,讨论门户网站是什么,通常人们会问他们使用的工具和技术是什么,或者人们会再次分享这些内容。试着向你的同行或最优秀的参与者学习尽可能多的东西。
我们做的另一件事是推动竞赛,我们将 销售线索 解决方案发布给社区,以便让社区能够获得顶尖的解决方案,从而了解最优秀的数据科学家如何处理同样的问题。这又是一个很大的学习机会。你不仅可以看到自己的水平,还能看到一些顶尖人才的水平,以及他们使用的特征工程、转换方法、变量插补方法
,以及在简单的建模中使用了哪些技术来改进解决方案。这是最好的学习方式,而且很多时候人们也会遇到一些他们之前不知道的技术。但你随时可以回过头去搜索当今的算法,看看这个算法的含义以及它的应用场景。这就是整个黑客马拉松模式如此精彩的地方,我看到的成果,以及定期参与的人所带来的影响,都令人惊叹。