Press "Enter" to skip to content

数据科学家角色的典型模式

数据科学的角色可能会有很大的不同,职位发布并不总是清晰的。你想戴哪顶帽子?

Clem Onojeghuo在Unsplash上的照片

在我的最新一篇关于机器学习工程师的文章得到了积极的回应之后,我想写一点关于数据科学从业者在职业市场上真正的角色类别。虽然我之前说的是关于候选人,例如他们的资质期望和现实可能是什么样子,但今天我想谈一谈实际工作的内容。

也就是说,这些是我认为人们真正雇佣数据科学专业人员来做的工作,不管他们是否承认。我将解释这份工作真正的内容,而不是工作描述中可能的要求,并且大致解释你可能会在企业组织结构的哪个位置上。

为什么这很重要?

作为寻求工作的数据科学家,无论我们在职业生涯的哪个阶段,我们都必须在审查职位和工作描述时看穿字里行间。工作描述中可能会有很多夸大和委婉的措辞,很难判断职位每天的实际工作内容以及你需要哪些技能来取得成功。

了解工作任务的样子也很重要,这样你才能知道这是否是你想要花时间做的事情!你可能更喜欢数据科学这个广泛领域中的某些方面,也可能有一些你想要更多了解或深入研究的内容。如果你进入了错误的角色,你可能会发现自己的职业发展走向你不想去的地方。

我希望这篇文章能帮助你看穿职位发布中的废话,了解在你花时间申请和面试之前这份工作的真实内容。同时,当你看穿字里行间时,了解招聘广告中所宣传的角色是否真的适合一个人成功地承担。正如我后面所描述的,有时候公司试图雇佣一个数据科学家来做很多工作,这对于被雇佣的人来说既不可持续也不愉快。

作为寻求工作的数据科学家,无论我们在职业生涯的哪个阶段,我们都必须在审查职位和工作描述时看穿字里行间。……如果你进入了错误的角色,你可能会发现自己的职业发展走向你不想去的地方。

注意事项

在我们开始之前,我向读者提醒几点注意事项。

  • 我大部分职业生涯都在VoAGI规模较小的科技公司中度过,没有在大型科技公司有个人经验。我咨询了一些有相关经验的朋友,以获取他们对此的反馈,所以我希望我的概括大致适用于任何地方。我可能是错的。
  • 这些都是概括。虽然我确实认为这些观点是正确的,但其中也有些笑话。请不要把所有事情都当真,但请认识到我是在对我们奇怪的领域开个小小的玩笑。
  • 我稍后还会再次提到这一点,但请记住这些是原型,而不是“某人职位描述的精确文本”。原型对我们来说是有用的,但现实生活中会有例外、合并和其他特殊情况。

现在,让我们开始谈论数据科学家的原型吧!

数据分析大师

我要从最被低估和被低估的角色开始-分析师。你的任务是帮助公司弄清楚他们是否实现了目标,以及事情是否按照应有的方式进行。这非常重要,而且非常模糊和难以实际做到。你每天可能要做很多事情,比如建立仪表盘、分析销售和产品成功等,可能还要查看内部绩效(例如员工离职率等)。有些人可能认为你的工作只是“给我做一个仪表盘”,但即使你做仪表盘,你也会花很多时间思考仪表盘应该测量什么,是否应该存在以及如何计算与目标实际对齐的指标。

在以前的十年中,你可能被称为运营分析师或商业智能专家(甚至现在有时还可能这样称呼你)。你需要处理来自奇怪来源的很多奇怪数据,并且你会使用大量的SQL。除非是处理反馈回复的自然语言处理(NLP)之类的机器学习,你不会进行太多机器学习的工作。如果你正在分析产品的有效性,你会进行大量的A/B测试。你可能在市场部门或独立的分析部门工作,但来自整个企业的人们都可能会向你索要“数字”。

特性构建师

与此相反,你在这里是为了通过某种数据科学/机器学习的方法使产品变得更好。你的高管们可能希望能够说你的产品包含人工智能,即使你只是在产品中提供一些推荐引擎或对搜索结果进行排序。如果你幸运的话,你可能会有机会构建创新的特性,为产品增加一些酷炫的东西,但如果你不能从一个空白页和一个模糊的指示开始做得好,这可能不是适合你的地方。

你需要了解客户和行业,这样你才能构建有用的东西,而不仅仅是酷炫的东西。你应该倾听客户的意见,并与面向客户的部门进行沟通,但在这个角色中,人们通常不会这样做。(这是一个错误的选择。)你可能会进行自己的A/B测试,或者这项工作可能会交给分析大师。当评估你构建的东西是否好用时,你肯定需要分析大师(或与他们重叠)。你使用Python进行工作。你可能在产品部门工作,但经常与工程部门进行交流。

基础设施构建师

与此有些相关,我认为更适合称为机器学习工程师——你将被要求构建将新模型放入产品中的管道,以便搜索结果按相关性排序或适用于适当人员的新小部件被展示出来。有时你可能会对模型本身进行一些操作,但并不经常(除非出现故障并需要你解决——你是最有可能需要轮班的数据科学家)。伸缩性和并行化对你来说将非常重要,你需要对延迟和滞后产生浓厚的兴趣,所以要适应这一点。

你的日常工具包包括Docker,产品所使用的任何语言以及Python,因为你要将特性构建师创建的东西与产品进行整合。一种可观测性工具在你的书签中也很重要。你可能在工程部门工作,或者可能是运维部门。

内部专用

在大公司之前,这种情况并不常见,但你是一个为公司内部其他部门构建机器学习工具的人。与特性构建师相比,并没有太大的不同,只是你创建的模型只是用于改进内部业务的工具。你的客户是在你公司工作的其他人,而不是为你公司支付货款或服务费的外部人员。因此,你不需要对外部客户了解太多,但你会对公司的组织结构非常了解。

要取得成功,找出你的同事们需要做的烦人重复工作,并自动化它或者训练一个模型来帮助他们完成。如果你这样做了,你将会非常受欢迎。有时你所创建的东西可能会成为开源项目,并最终可能成为产品,就像Airflow或H3一样。你可能在工程部门工作。

研究人员

这是一种罕见的角色,你被雇佣来进行纯粹的研究。也许你将撰写学术文章,提高公司的声誉,或者类似于此类的工作,但他们并不期望这个角色自负盈亏。这个角色可能属于首席执行官的特别项目之一。你会被介绍一些在线文章中看起来很酷的想法,并被要求弄清楚这些想法是什么,以及你的公司如何在这个领域做出贡献。你会被标记在所有关于LLM的Slack对话中。这是在这篇文章中唯一可能有资格寻找博士学位的角色。

解决方案工程师

与其为你公司构建数据科学特性,不如为你的客户构建它们。这包括数据科学咨询工作,尽管与数据科学相关的软件的构建和销售公司也常常拥有这种角色。如果你的客户需要专业的数据科学/机器学习人才来最好地使用你的产品,那么公司很可能会有一些这样的角色。

期望在客户试图向他人销售贵公司产品或服务的AI高级功能时,被引入客户电话中,因为销售人员不习惯回答技术问题。您拥有相当多样化的技术堆栈技能,因为您的客户可能会带来各种奇怪的事物供您帮助/构建,这实际上可能非常有趣。您需要了解行业,例如“特性构建器”,并且您必须能够与客户保持优雅和耐心。由于您花时间与客户互动,您可能会在客户成功或销售部门工作。

最后,我们来谈谈…

适合所有人的角色

这个角色似乎将所有这些工作的各种部分组合在一起,通常以杂乱的方式,并且雇佣经理可能意识不到这是三个或四个工作,或者他们希望他们可以说服某人只用一个薪水来完成所有这些工作。对于您将被要求做的事情,薪水可能太低。这在没有现有数据科学功能的组织中很常见,他们正在聘请他们的第一位数据科学家。这是一个通过实践来学习很多东西的机会,但可能没有更多技术技能的人来教你,所以你的谷歌/StackOverflow/其他搜索技巧需要非常出色。如果您不喜欢自学新东西,这个角色可能会很困难和孤立。正如我的一个朋友所说:“在你所做的事情上,你将是公司最好的,但这并不意味着你在这些方面表现得很好。”由于缺乏指导/帮助您的人,疲劳是一个真正的风险。

但实际上…

明确地说,大多数数据科学/机器学习工作将包含这些角色中的两个或更多部分。记住我上面告诉你的,这些是原型,而不是“我的工作描述”。(实际上,我的工作并不适合这些类别中的任何一个。)

明确地说,大多数数据科学/机器学习工作将包含这些角色中的两个或更多部分。

两种角色分割的例子:

  • 产品分析数据科学家:分析大师与特性构建器相结合。构建特性,进行自己的分析,并对其他特性/人们正在构建的内容进行分析。
  • 全栈机器学习数据科学家:特性构建器和基础设施构建器。您不仅构建模型,还构建将该模型提供给世界的管道。

如果您在一个单一角色中涉及到三个或更多不同的原型,那么我认为这太分散了。一个人无法成功地成为分析大师、特性构建器和基础设施构建器,例如-这只是需要保持平衡的太多工作。公司越小,您可能会被迫承担额外的工作,但要认识到这些是不同的职能,您可能会分散太多。

离开之前的几点说明

我认为随着您在数据科学/机器学习职业中的资历提高,您将承担更多的角色,而“我的工作是什么”这个边界将变得更加模糊。您会积累专业知识和经验,这些知识和经验在业务的许多不同部分都可以派上用场,人们会打电话来寻求您的意见。

此外,我没有在这里讨论战略或规划,但随着您的资历增加,您将更多地参与所有这些事情。即使作为一个个人贡献者,您的经验也具有价值-您可能之前见过类似于当前面临的任何想法或问题的东西。您应该提出自己对如何解决它的意见,即使负责人采取了不同的方式。这只是更高级别工作的一部分。

我没有在这里真正讨论战略或规划,但随着您的资历增加,您将更多地参与所有这些事情。

我希望这可以帮助市场上的人们或正在进入这个领域的学生更清楚地了解自己将要面对的情况。如果您在求职网站上发现了一个非常明显的适合所有人的例子,请将其发送给我或在评论中发布链接。也许我可以在将来发表一篇关于最糟糕的例子并对其进行剖析的帖子,以供我们所有人的娱乐!

您可以在www.stephaniekirmer.com找到更多我的作品。

Leave a Reply

Your email address will not be published. Required fields are marked *