首页 » 以及利用数据可以实现和无法实现的

以及利用数据可以实现和无法实现的

合)的能力。此外,还要能够有效地沟通想法,清晰地阐明优势/局限性,目标。总而言之,数据科学家必须全身心投入到项目的成功中。

有志于成为数据从业者的人应该在处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?

Lovekesh Vig: 很多,正如我提到的,数据清理和编码对于构建有用的应用程序至关重要,数据科学家的大部分时间都花在这上面。其他领域包括预测模型、计算和存储基础设施的优化以及数据可视化。

您对新手、数据科学学生或希望在数据分析行业建立职业生涯的从业者有什么建议?

Lovekesh Vig: 

  • 编程和软件技能——R、Python、SAS 或 Excel

一个好的程序员应该能够跨语 特殊数据库 言和工具转换,你可以使用一种喜欢的语言(我推荐 python),但如果情况需要,这不应该限制你跨语言/工具转换。

  • 可视化工具

选择你最喜欢的可视化工具,成为各种可 他们就根本没有利用他们的工具 视化功能的高级用户,并了解哪些可视化适用于不同类型的数据。在进行任何类型的预测建模之前,可视化都至关重要。

  • 统计基础与应用知识

 这些方面经常被年轻的数据科学家所忽视,而倾向于更炫酷的技术,但这些方面是理解机器学习的基础,并且可以成为未来职业生涯的巨大差异化因素。

  • 机器学习:

学习机器学习课程已经远远不够了,机器学习是一个应用领域。用实际经验来支撑你的理论知识至关重要,比如在Kaggle等网站上发布数据挑战赛。

您预见到数据科学领域将会出现哪些变化趋势?您建议当前的数据分析师如何跟上这一变化趋势?

Lovekesh Vig: 随着深度 销售线索学习的普及以及大多数深度学习模型在 GPU 集群上运行,使用 CUDA 或 OpenGL 进行编程以在 GPU 上运行计算已成为一项备受推崇的技能,并且在可预见的未来可能会非常抢手。此外,深度模型很快就会变得非常普遍,以至于每位数据科学家都必须至少熟悉涉及图像和序列数据应用的基本深度模型类型。随着人工智能渗透到企业领域,数据科学家必须能够适应新兴的应用领域,例如智能对话应用、智能设备应用和增强现实。依赖固定技术技能的时代正在迅速消逝,未来属于那些能够快速适应新领域、解决相关问题并不断前进的人。 

滚动至顶部