×
支持199IT发展可加入知识交流群(4000+用户),最有价值数据分享和讨论!
点击即可加入!
关闭

数据科学新人需要知道的13个雷区

引言
看来你已经决定要进入数据科学这个领域了。数据正在驱动越来越多的业务,世界的联系正在变得越来越紧密,似乎每个业务都需要数据科学实践。因此,对数据科学家的需求是巨大的。更好的是,所有人都承认这个行业的人才短缺。

然而成为一名数据科学家并不容易。需要拥有解决问题的能力、结构化思维、编码和各种技术技能才能真正获得成功。如果您并非技术或数学背景,那么通过书籍和视频课程来学习是很好的方式。但是大多数这类资源不会教你行业内需要什么样的数据科学家。

这就是胸怀抱负的数据科学家努力缩小自我教育与实际工作之间差距的原因之一。

本文将讨论数据科学爱好者常犯的一些错误(包括我自己都曾经犯过),我也会提供一些资源帮助你避开数据科学之旅上的陷阱。

01
只学习理论概念,但不应用

图片来源:cognitive class-YouTube

就像我之前提到过的一样,掌握机器学习技术背后的理论是非常好的,但是如果你不去应用它们,它们就仅仅是理论概念。当我开始学习数据科学的时候犯了同样的错误,我学习书本知识和在线课程,但却没有应用它们去解决问题。

所以当我有机会应用我所学的知识去解决挑战或问题时,几乎一大半我都不记得了!要学的东西太多了,算法、推导、研究论文等等等等。你有很高的几率失去动力然后半途放弃。我本人见证过许许多多想进入这个领域的人都是这样。

如何避免?

学习过程中保持理论和实践之间健康的平衡是非常必要的。只要学习了一个概念,请立即Google一下找到可以应用它的数据集或问题。你会发现你比以前更好地吸收了这种概念。

你必须承认所有东西是不可能一次性学完的。一边练习一边填补空白,将会学到更多东西!

02
不了解原理或概念直接进行机器学习

图片来源:伦敦帝国理工学院 – YouTube

大部分想成为数据科学家的人是看到了机器学习的相关视频,或一个超级棒的预测模型,抑或是高薪的吸引,然而,想要成为你看到的样子,还需要走很长的路。

在将技术应用到问题之前,你应该先了解它的工作原理。这将有助于了解算法的工作原理,以及做些什么可以对其进行微调,还可以帮助你构建现有技术。数学在这里发挥着重要作用,因此了解某些概念总是有帮助的。在日常的企业数据科学家角色中,您可能不需要了解高级微积分,但有高级的整体认识肯定是有帮助的。

如果您有一个好奇的想法,或想要进入研究角色,在开始进行核心机器学习之前,您需要了解的四个关键概念是:

  • 线性代数
  • 微积分
  • 统计
  • 概率
如何避免?

正如房子是一砖一瓦建造的,数据科学家也是所有单个部件的总和。有大量的资源可以帮助学习这些主题。下面列出一些资源,可以帮助您入门:

  • 数据科学家线性代数综合入门指南
  • 可汗学院的微积分课程

https://www.khanacademy.org/math/calculus-home

  • 通过实例解释数据科学概率的基础知识
03
仅依赖认证和学位

图片来源:CIO.com

这也是招聘人员的烦恼。自从数据科学变得非常受欢迎以来,到处都有认证和学位。我在LinkedIn上看了一下,至少展示了5张认证的图片。虽然获得认证并不容易,但只依赖认证是一种灾难。

许许多多的胸怀抱负的数据科学家被大多数在线课程倾倒并且完成学习。如果他们为你的数据科学简历添加了一个独特的价值,那就没问题了。但是招聘人员并不关心这些考试 – 他们更看重你的