你是一个渴望成为数据科学家的人吗?如果是这样,很有可能你已经见过或听说过很多成功转向数据科学职业的人。而你也希望有朝一日能够进行转变。
作为一名数据科学家工作是令人兴奋的事情。你可以:
- 建立在各个领域都可转移的硬技能和软技能
- 通过数据讲述故事
- 通过数据回答商业问题
- 为商业问题构建有影响力的解决方案
还有许多其他的好处。虽然听起来非常令人兴奋,但是作为一名数据科学家同样具有挑战性,如果不是更具挑战性的话。那么这些挑战是什么呢?
让我们一起深入了解。
1. 你喜欢独自工作
当你正在提升自己的编码和技术技能时,你可能会习惯独自工作。但是作为一名数据科学家,你应该优先考虑合作和沟通。因为数据科学并不是关于在孤立环境中处理数据和做计算。
你需要与其他专业人士合作,不仅仅是在同一团队中,往往还跨越多个团队。因此,你与不同团队和利益相关者的合作能力和沟通能力与你的技术能力同样重要。
此外,你还应该能够向非技术干系人员,包括商业领导者,传达你的发现和见解。
一位数据科学家和技术作家尼莎·阿里亚·艾哈迈德(Nisha Arya Ahmed)分享道:
“在一个数据科学团队中,你将与其他数据科学专业人员合作,了解每项任务的职责以及它们如何与其他任务相互配合。这很重要,因为你不想重复已经完成的工作并浪费更多的时间和资源。此外,你将与不仅仅是数据专业人士合作,还将成为一个跨职能团队的一部分,包括产品、市场营销和其他利益相关者。”
– 尼莎·阿里亚·艾哈迈德(Nisha Arya Ahmed),数据科学家和技术作家
2. 你希望真正“完成”项目
如果你喜欢参与项目、完成项目并将其发布到生产环境中,那么你可能会觉得数据科学并不能给你带来有意义的职业。
虽然你开始一个项目时有一组目标,但随着组织的业务目标发生变化,你通常需要改变项目的范围。也许利益相关者会看到一个新的有前景的方向。
因此,你将不得不有效地重新设置项目的优先级并修改其范围。在最糟糕的情况下,如果需要的话,放弃你的项目。
此外,在早期阶段的创业公司中,你通常需要兼顾多个角色。所以你的工作并不仅仅是模型构建。即使你成功将一个机器学习模型部署到生产环境中,你也需要监控模型的性能,关注漂移情况,进行回归和重新训练模型。
一位来自VoAGI的作家、编辑和数据科学家阿比德·阿里·阿万(Abid Ali Awan)分享道:
“如果你在一家公司工作,你可能经常需要在多个团队之间切换,并同时参与不同的项目。然而,你参与的大多数项目可能并不会最终投入生产。
因为公司的优先事项可能会改变,或者项目的影响可能不够重要。不断切换团队和项目可能会令人筋疲力尽,你可能会感到自己对于自己的贡献感到困惑。”
– 阿比德·阿里·阿万(Abid Ali Awan),作家、编辑和数据科学家,VoAGI
因此,进行数据科学项目的工作不是一个线性的从头到尾的过程,在完成一个项目后转移到下一个项目。
3. 你对角色的模糊性感到沮丧
在两个不同组织的数据科学家的一天可能完全不同。数据科学家、机器学习工程师和MLOps工程师的角色通常有很多重叠的功能。
假设你是一个对构建预测模型非常感兴趣的数据科学家。你在一个你感兴趣的组织中找到了数据科学家的角色。
然而,如果你整天只是处理电子表格中的数据并制作报告,或者使用SQL从数据库中提取数据,并对数据进行整理以回答业务问题,那也别感到惊讶。你可能会认为用SQL整理数据并找到业务问题的答案更适合数据分析师的角色。
在其他一些情况下,你可能负责构建和部署模型到生产环境,并监控模型的偏离情况,并根据需要重新训练模型。在这种情况下,你是一位既是数据科学家又是MLOps工程师的人。
让我们听听Abid对数据职业中的角色流动性有何看法:
“我一直对被称为“数据科学家”感到困惑。这究竟意味着什么?我是数据分析师、商业智能工程师、机器学习工程师、MLOps工程师,还是以上所有的角色?如果你在一家较小的公司或初创公司工作,你在公司中的角色是流动的。然而,较大的组织可能在角色之间有更清晰的区分。但这并不能保证角色是完全定义好的。你可能是一位数据科学家,但你所做的工作很大一部分可能是根据业务目标创建分析报告。”
– Abid Ali Awan,VoAGI的作家、编辑和数据科学家
4. 对业务目标不感兴趣
作为一名数据科学家,你应该将精力集中在对业务有重大影响的项目上,而不是追求技术上有趣但不那么相关的项目。为此,理解业务目标是至关重要的,原因如下:
- 理解业务目标可以让你根据组织的不断变化的需求进行适应和重新优先排序项目。
- 数据科学项目的成功往往是根据其对业务的影响来衡量的。因此,对业务目标的深入了解为评估项目的成功提供了明确的框架,将技术方面与可触及的业务结果联系起来。
VoAGI的首席编辑和数据科学家Matthew Mayo分享了对业务结果漠不关心的代价:
“作为一名数据科学家,如果你对业务目标漠不关心,你就好像是一只追逐激光指针的猫,你会发现自己过于活跃而且没有目标,很可能一无所成。理解业务目标并且能够将其从业务角度转化为数据的能力是至关重要的技能。如果缺乏这些技能,你可能会发现自己投入时间建立最复杂但不相关的模型。一个有效的决策树总比一次最先进的失败更有价值!”
– Matthew Mayo,VoAGI的首席编辑和数据科学家
以下是Nisha在这方面的看法:
“无论你做什么,你都需要一个原因。这是你的意图,在你行动之前。当涉及到数据世界时,理解业务和挑战至关重要。没有这一点,你只会在整个过程中感到困惑。在进行数据科学项目的每一步时,你都会想要参考激发项目的目标。”
– Nisha Arya Ahmed,数据科学家和技术作家
因此,数据科学不仅仅是处理数据和构建复杂模型。它更多地是利用数据推动业务成功。
如果没有对业务目标的牢固理解,你的项目可能会偏离它们本应解决的业务问题,从而减弱其价值和影响力。
5. 你不喜欢“无聊”的工作
构建模型是令人兴奋的。然而,通往此目标的道路可能不那么有趣。
您可以期望将大部分时间用于:
- 收集数据
- 识别出要使用的最相关的数据子集
- 清洗数据使其适合分析
现在这项工作并不是非常令人兴奋。通常情况下,您甚至不需要构建机器学习模型。一旦您将数据存储在数据库中,就可以使用SQL来回答问题。在这种情况下,您甚至不需要构建机器学习模型。
以下是阿比德(Abid)分享他对工作重要性的看法:
“重复做同样的事情可能会很乏味。通常情况下,您可能会被分配清洗数据的任务,这可能相当困难,特别是在处理多样化数据集时。此外,数据验证和编写单元测试等任务可能没有那么有趣,但是却是必要的。”
– Abid Ali Awan,VoAGI的作家、编辑和数据科学家
因此,要在数据科学领域有一番成功的事业,您必须喜欢与数据一起工作的过程,包括好的、坏的和丑陋的,因为数据科学的核心是从数据中获取价值。这往往与构建最奢华的模型并无关系。
6. 您想要停止学习
作为数据科学家,您(可能)永远无法达到一个可以说自己已经学得全部的程度。您需要学习的内容和程度取决于您所从事的领域。
可能是一个相对简单的任务,如学习和使用新的框架。也可能是更加繁琐的工作,例如将现有代码库迁移到诸如Rust之类的语言以提高安全性和性能。除了技术上的强大,您还应该能够迅速学习和适应所需的框架、工具和编程语言。
另外,如果需要的话,您还应愿意进一步了解领域和业务。在您的数据科学职业生涯中,很不可能一直在一个领域工作。例如,您可能会从医疗保健领域开始,然后转向金融科技、物流等其他领域。
在研究生阶段,我有机会在医疗保健领域从事机器学习项目——一个疾病预测项目。我从未读过高中以上层次的生物课。因此,在我能够继续对记录进行预处理之前,前几周都是关于探索特定生物医学信号的技术细节、特性和其他方面的内容,这些内容非常重要。
技术作家Kanwal Mehreen与我们分享了她的经验:
“您是否熟悉学习一项新技能,然后感到‘啊,这就是我要的’的感觉?在数据科学领域,这种时刻从来没有真正到来。这个领域不断发展,频繁涌现新的技术、工具和方法论。因此,如果您更倾向于达到某个点后学习变得不重要,那么数据科学职业可能不适合您。”
– Kanwal Mehreen,技术作家
因此,作为一名数据科学家,您不应回避不断学习和提升技能的过程。
7. 您不喜欢挑战
我们已经概述了作为数据科学家的几个挑战,包括:
- 超越编码和模型构建的技术技能
- 了解领域和业务目标
- 持续学习和提升技能以保持相关性
- 主动积极,不必担心以字面意义上完成项目
- 准备重新设置优先级、回到原点并进行更改
- 处理乏味但必要的工作
与任何其他技术角色一样,难点不在于成为一名数据科学家,而在于建立成功的数据科学职业。
Mathew Mayo恰如其分地总结了您作为数据科学家应该如何接纳这些挑战:
“寻找一份轻松的职业,可以在开始工作后就停止学习,从不担心最新的工具、技巧和技术?呵呵,那就别指望数据科学!希望成为一个安宁的数据专业人员就像指望在季风中进行一次干燥的漫步,只带着一把鸡尾酒伞和一颗乐观的心态。
这个领域是一个不间断的技术难题和非技术谜题的过山车:有一天你深入研究算法,而下一天你要试图向一个认为回归是一种行为儿童般的退缩的人解释你的发现。但挑战的乐趣就在于此,这是我们兴奋的咖啡因饮品所教给我们的。
如果您对挑战过敏,您可能会发现针织更让您安心。但如果您还没有从与大数据洪流的对抗中退缩,数据科学可能正是您喜爱的咖啡。
– 马修·梅奥(Matthew Mayo),首席编辑和数据科学家,VoAGI
让我们听听Kanwal的想法:
“让我们面对这个事实:数据科学并不总是一帆风顺。数据并不总是整洁有序的。你的数据可能看起来就像经历过一场风暴,可能是不完整、不一致甚至不准确的。清洗和预处理这些数据以确保其与分析的相关性可能具有挑战性。
在从事多学科领域工作时,您可能需要与非技术利益相关者互动。向他们解释技术概念以及它们与他们的目标的一致性可能会很具有挑战性。
因此,如果您是那种偏好明确、直接的职业道路的人,从事数据科学职业可能会给您带来很多阻碍。”
– Kanwal Mehreen,技术作家
总结
所以数据科学不仅仅是数学和模型,它涉及从数据到决策的过程。在这个过程中,您应该时刻愿意学习和提升技能,了解业务目标和市场动态,以及更多。
如果您正在寻求一个具有挑战性的职业,并且希望以韧性完成,那么数据科学确实是一个很好的职业选择。祝您探索愉快!
我感谢Matthew、Abid、Nisha和Kanwal分享他们对数据科学职业的多个方面的见解。也感谢他们使这篇文章变得更加有趣和愉快!
[Bala Priya C](https://twitter.com/balawc27)来自印度,是一名开发者和技术作家。她喜欢在数学、编程、数据科学和内容创作的交叉点上工作。她的兴趣和专长领域包括DevOps、数据科学和自然语言处理。她喜欢阅读、写作、编码和咖啡!目前,她正在通过撰写教程、指南、观点文章等,与开发者社区学习和分享她的知识。