首页 » 但其中一份工作尤其让我印象深刻

但其中一份工作尤其让我印象深刻

你是如何进入数据分析领域的?是什么让你对学习数据分析产生了兴趣?

Avik Sarkar: 早在上世纪90年代中期,我就决定学习数学/统计学,当时数据分析、数据科学、大数据等领域还鲜为人知,也并不热门。我本来会从事同样的工作——可能是从事研究工作,因为数据分析的商业化应用才刚刚起步。当时还有很多其他基础科学领域没有得到应有的重视,人们纷纷转向其他领域。我很幸运能够在我所学的领域工作。

您记得处理的第一个数据集是什么?您用它做了什么?

Avik Sarkar: 我在孟买印度理工学院的教授们让我接触到了数据挖掘和机器学习的世界。我接触的第一个大型数据集是路透社的一篇新闻文章数 电话号码数据库 据集。我用它完成了我的硕士论文,主题是多主题文本分类。我再次感到幸运,在“大数据”这个术语诞生之前,我就对高级文本挖掘技术有了初步的了解——不知不觉中,我花了几年时间研究大型文本数据集,手动编写代码,将大型任务分布到多个节点上。后来,在攻读博士学位期间,我研究了TREC(文本检索会议)数据集以及通过爬取互联网/内联网获取的数据。

有没有一个特定的“啊哈”时刻让您意识到数据的力量?

Avik Sarkar: 在我任职的公司里,我做过好几份工作。——那是2013年北阿坎德邦洪灾期间,我作为IBM团队的一员参与了救援工作。我们查看了洪灾当天位于灾区的所有手机,并追踪了这些手机在随后几天转移到安全区域的轨迹, 因为您不仅可以根据用户与您的 这表明这些人可能是安全的。由于这些手机的主人信息被公开,我们立即致电这些人确认他们的安全。这不仅缩短了失踪人员名单,还为救援人员节省了大量时间。虽然过程简单,但却展现了利用数据产生积极社会影响的巨大力量。

你目前的工作日常是怎样的?你大部分时间都花在哪里?

Avik Sarkar: 我曾担任过多个职位,工作时间的投入很大程度上取决于手头的任务。通常,大量时间都花在设计处理特定类型数据的算法上。在 销售线索处理来自源头的噪声数据时,大量的时间都花在清理数据并使其适合分析上。在我目前任职于印度政府期间,我花了大量时间去设想数据在高效政策制定和治理中能够发挥的作用。我们正在筹备一个“国家数据分析门户”,它将成为一个一站式平台,汇集印度所有数据,包括各部委和各邦的数据,并为最终用户提供自助分析功能。

滚动至顶部