数据科学。它是令人兴奋的。它也是让人紧张的。
它是跨学科的,不断发展的。它揭示了数据中的秘密,需要创新的解决方案。这就是数据科学的吸引之处。更不用说待遇好了。
数据科学有时也令人沮丧,原因有时很相似。竞争激烈,期望高,目标不断变化,道德困境不断。
进入这个领域会让你想把头发都拔掉,但奇怪的是,你会喜欢上它。有点像在Twitter上关注技术界的人。对不起,埃隆,X。
对于初学者来说,到面试中寻找第一份数据科学工作特别如此。
然而,通过正确的准备和心态,你可以自信地在这些面试中航行并留下深刻的印象。以下是一些建议,帮助你在初学者数据科学工作面试中取得成功。
1. 全面了解基础知识。
你需要对统计学、线性代数和编程等基础概念有深厚的理解。面试官通常在进入更复杂的话题之前测试这些基础知识。
这些技能通常包括:
- 统计学
- 编程
- 数据操作
- 数据可视化
- 关系型数据库
- 机器学习
2. 统计学
面试者通常期望即使是初学者也具备以下统计学概念的基本知识。
- 描述性统计:
-
中心趋势度量-均值、中位数和众数
-
离散趋势度量-范围、方差、标准差和四分位数范围
-
形状度量-偏度和峰度
-
概率:
-
基本概率概念
-
条件概率和贝叶斯定理
-
概率分布-正态分布、二项分布、泊松分布等
-
推断统计:
-
抽样-总体、样本、抽样技术
-
假设检验-零假设和备择假设、I型和II型错误、p值和显著性水平
-
置信区间-基于样本数据估计总体参数。
-
相关性和协方差:
-
理解两个变量之间的关系和相互依赖性
-
皮尔森相关系数
-
回归分析:
-
简单线性回归-两个连续变量之间的关系
-
多元回归-扩展到多个独立变量
-
分布:
- 正态分布
- 二项分布
- 泊松分布
- 指数分布
3. 编程
你需要精通数据科学中常用的编程语言。目前最受欢迎的三种语言是:
- SQL
- Python
- R
你不必在这三种语言中都成为大师级人物。通常来说,对其中一种语言有一定的熟练度,并且至少对其他两种语言的基础知识有所了解就足够了。
具体取决于工作描述。不同的公司和职位需要不同的编程语言。在数据科学领域,通常要求掌握其中三种中的一种。
如果你问我,只能学一门的话,我会选择SQL。查询数据库是任何数据科学家都无法生存的基础。SQL就是专门为此而设计的语言,没有其他语言能够做到数据库查询和数据清洗如此出色。
它还可以轻松与其他语言集成。这样,您就可以利用其他语言来完成SQL不适合的任务,例如构建模型或数据可视化。
数据操作
它指的是您清洁和转换数据的能力,包括处理缺失数据、异常值和转换变量。
这意味着您需要了解最流行的数据操作库:
数据可视化
您需要了解不同类型数据和见解的最佳可视化技术。并且您需要知道如何使用可视化工具将其付诸实践:
- matplotlib 和 seaborn – 用于Python
- ggplot2 – 用于R
关系数据库
作为数据科学家,您需要对关系数据库及其工作原理有一般的了解。如果您至少有使用SQL进行查询的基本知识,那就更好了。
一些最受欢迎的数据管理系统包括:
机器学习
您必须熟悉机器学习的基础知识。例如,知道监督学习和无监督学习之间的区别。
您还需要熟悉分类、聚类和回归。这包括了解一些基本的算法,如线性回归、决策树、SVM、朴素贝叶斯和k-means。
2. 熟悉您的工具
面试之前,熟悉流行的数据科学工具。这包括我们已经提到的编程语言,以及其他一些平台。
您不需要全部都了解。但如果您至少对每个类别的一个工具有一些经验,那就理想了。
3. 为编码和技术问题做好准备
使用诸如 StrataScratch、 LeetCode 等平台准备编码和技术问题。
此外,使用YouTube频道、博客和其他资源来复习其他技术概念的知识。如果您专注于“彻底了解基础知识”中提到的内容,那就没问题了。
模拟面试非常有益。使用提供这种服务的在线平台。或者与朋友和导师练习。
所有这些准备技巧将帮助您熟悉面试形式并改进您的回答。
4. 展示实践经验
如果你做过个人项目或实习,要善加利用。在面试中讨论它们,以突出你所面临的挑战、采取的解决方案和取得的成果。
5. 提前准备行为问题
技术技能通常占据大部分招聘过程。然而,公司通常至少会花一些时间来问一些行为问题。
这是预料中的,因为你将会在一个团队中工作。面试官想要了解你如何与同事沟通、理解团队合作、处理压力和冲突,以及解决问题的方法。
准备过去经历的例子,展示你的软实力和解决问题的能力。
6. 保持更新
数据科学在迅速发展变化。因此,你需要随时掌握最新的趋势、工具和技术。阅读相关内容,加入在线论坛,参加网络研讨会和工作坊,以保持自己与时俱进。
然而,不要过分纠结于这一点,认为你需要了解每个新的“必备”和“必须掌握”的产品。
7. 提问
根据面试的形式,你很可能有机会在面试期间或结束时提问。
这是展示你对角色和公司的热情的机会,也是展示你对他们寻求的要求的理解。
询问团队目前的项目、公司的数据基础设施、计划以及他们面临的挑战。
8. 别忘了软技能
单凭技术技能无法使你取得长远进展。你将在工作中与技术和非技术团队成员以及利益相关者进行沟通和协作。
在面试中,用清晰简洁的回答展示你解释复杂问题的能力。这将向面试官展示你可以有效地与非技术团队成员协作的能力。这是一项你在数据科学中将需要的技能,因为数据科学并不孤立存在,其结果常常被非技术人员使用。
9. 保持冷静并继续前进
紧张是很自然的。但不要因为紧张而紧张!请记住,面试官寻找的是最佳候选人,而不是完美的候选人。在这种情况下,最佳意味着以上提到的所有要点的最佳结合。
如果在面试的某个环节犯错,不要失去信心,保持冷静并继续前进!候选人往往会夸大自己的错误影响,而这些错误可能(几乎)对面试官的印象没有负面影响。
请记住,面试既是了解公司也是让他们了解你的过程。保持冷静,深呼吸,并自信地回答每个问题。
当然,自信是无法假装的。通过对前八个建议的充分准备,你可以最好地实现自信。
结论
是的,技术知识对于数据科学角色至关重要,即使是在初级水平上也是如此。但软技能、实际经验和对该领域的真正热情同样重要。
面试官主要寻找的是一个完整的包。九个提示将为你提供保障。
现在,你需要给自己时间进行充分准备。如果你对自己的准备程度有信心,以积极的心态参加面试会更容易。通过这样做,你已经在成功地迈向你的第一份数据科学工作的道路上。
祝好运!Nate Rosidi是一位数据科学家和产品战略工作者。他还是一位教授分析学的兼职教师,并且是StrataScratch的创始人,这是一个帮助数据科学家准备来自顶尖公司的真实面试题的平台。与他联系:Twitter: StrataScratch或LinkedIn。