首页 » 目前有大量数据可用于训练基于医学

目前有大量数据可用于训练基于医学

例如,在医疗保健领域,影像的诊断模型,然而,将诊断结果与患者病历关联起来,并整合领域知识和特定遗传因素,仍然是一项艰巨的挑战。制造业等一些行业通过为机器配备健康监测和故障检测传感器,更好地描绘了迈向“智能工厂”的工业4.0标准。其他行业仍不确定数据能将他们带向何方以及如何实现这一目标,但人们无疑重新燃起了利用各种形式数据 企业电子邮件列表的渴望,包括图像、非结构化文本、传感器数据和关系数据。这催生了各种创新,并将改变企业的运作方式。

数据科学面临的三大问题是什么?无论是基于行业还是基于技术领域

Lovekesh Vig: 

技术领域:深度学习

  1. 利用深度模型做出可解释的预测
  2. 将领域知识融入深度模型
  3. 使用有限的数据训练深 您可以看到有关内容排名 度模型

行业对大数据的准备情况

除了Facebook、谷歌、雅虎等社交巨头之外,大数据是否正在其他行业成为现实?如果是,哪些行业正在向大数据分析的强大力量迈进?如果没有,那么应用前景如何?

Lovekesh Vig: 大数据对零售、制造和能源行业的组织产生了深远的影响,医疗保健和制药等其他行业现在正在迎头赶上并重新设计其流程,以更好地捕获、集成和预测数据。

说出 3 个行业以及它们使用大数据解决的问题类型。

Lovekesh Vig:制造业和 销售线索重型机械的行业无疑正在转向大数据分析,用于机器健康监测、故障检测和预测。零售公司通过利用大数据向客户提供建议获得了巨大的利润。金融公司也成功地利用大数据来预测股票价格和优化投资组合。  

行业内,您的大数据典型客户是谁?是首席技术官、首席信息官、首席营销官,还是数据领域的专家?

Lovekesh Vig: 我们的典型客户是 CIO。

对有志于成为数据科学家的人的建议

您认为数据分析师和数据科学家需要具备哪些最重要的技能,包括技术技能和软技能?

Lovekesh Vig: 从技术角度来说,我们寻求的是更深入地理解所使用的模型。由于机器学习 API 的激增,人们很容易在未完全理解模型工作原理的情况下就使用模型,得到预测结果就完事了。优秀的数据科学家会了解模型背后的数学原理,理解不同参数的影响,从而能够辨别哪些模型最适合哪些类型的数据。数据科学家大约 80% 的时间都花在清理和编码数据上,使其符合机器学习算法的需要。因此,数据科学家应该掌握有效处理缺失数据和噪声数据的技术,并了解数据编码对最终结果的影响。

滚动至顶部