Press "Enter" to skip to content

重新思考数据科学组合

为什么一个易于执行和用户友好的项目将超过一个高复杂性的华丽作品

Photo by Helena Lopes on Unsplash

在技术领域有一个长期存在的神话:认为项目越复杂,就越能展示能力。

在我早期的职业生涯中,我花费了无数个小时给我的项目添加了一层又一层的复杂性,希望通过展示我的技术能力和处理复杂算法的能力来给潜在雇主留下印象。随着时间的推移,我意识到这种方法不仅是事与愿违的,而且也是对我在工作中交付工作的方式的误解。

作为一名招聘经理和一个坚信良好作品集价值的人,我提出了强调易于运行和用户友好性的理由,以展示对真实世界数据科学任务的更准确的理解。

不要让目标复杂化

当我在数据科学职业生涯的第一年左右,我不得不构建一个模型来计算我们归因模型的基线网页流量。我立即看到了展示自己的机会。我经历了ARIMA、Prophet等迭代,希望展示我的机器学习技能。最终我选择了一个随机森林的实现。

当我与非技术高层讨论方法时,我不得不告诉他们内部运作是黑箱的。他们面无表情。我的经理事后找我谈话,建议我尝试一些可以完全在一个 PowerPoint 幻灯片(在你的显示器上贴个便利贴上的建议)中解释清楚的东西。我差点儿自嘲地尝试了一个滚动中位数。它正好处于合理紧密的误差得分范围的中间位置。

我们带着“调整更新”回到高层面前,我只需要说的是滚动平均值,没有人对此提出质疑。五年多以后,经过多次归因模型迭代,这个基线计算仍然在生产中,无需重新训练或模型漂移监控。它已经处理了数亿美元的广告花费,是我们工作中少数几个没有受到挑剔客户质疑的元素之一。

在作品集的背景下,这可能看起来是一个极端的例子,但它突出了一个关键点。复杂项目很容易变得难以控制、难以理解,从而更难以执行。这类项目对你和审查你工作的人都提供了递减的价值。

一个复杂的作品集项目可能展示了技术能力,但不一定反映了创造实用解决方案的能力。

在数据科学中的能力不仅仅取决于你处理复杂性的能力,还取决于你对该领域原理的理解、你创造实用、用户友好的解决方案的能力,以及最重要的是,你用数据讲述一个引人入胜的故事的能力。

保持你的工作易于访问

在追求复杂性的过程中很容易忽视这些基本原则。一个复杂的作品集项目可能展示了技术能力,但并不反映你创造与业务目标和约束相符的实用解决方案的能力。这种对复杂性的追求可能不仅会误解真实世界数据科学的需求,还会忽视学科的本质:利用数据创造有影响力、易于理解和可行动的见解。

当你的项目易于理解和简单易行时,它们变得更易于访问和吸引人。

上次我们的团队在招聘时,看到简历上有那么多作品集链接,我真的很兴奋。但很快我就失望了,因为其中超过一半只是包含一个 Jupyter 笔记本的几个仓库,没有任何说明,而且笔记本中的 markdown 也只限于对代码块的一句描述。我给那些有说明和要求文件的几乎所有人都安排了面试 —— 门槛确实可以这么低。

易于访问和引人入胜的项目使你的作品集在潜在雇主面前脱颖而出。是的,GitHub 显示你的笔记本内容,但如果一个寻找你工作的招聘经理可以克隆仓库,按照你的 README 文件操作,并且在不更改任何内容的情况下运行你的所有代码,你将发现自己位于候选人列表的顶部。

展示你的编码合作能力

以上所有内容也适用于代码质量与数量以及复杂性。能够编写易于维护和他人理解的代码表明您具备在团队中工作的能力,并明确展示了专业级软件工程技能。

这表明您意识到您的代码不是孤立存在的,而是一个更大生态系统的一部分,他人可能需要与之交互。注重用户友好性将展示出一种成熟度和对现实世界数据科学的理解,超越了纯粹的技术专业知识。

反思您学到的习惯

重要的是要从代码中退后一步,反思您对工作的方法。我在学校里遇到了巨大的困难,总是知道课程内容,但从未能够测试得好。我的学校生活变成了如何简单地通过考试,而考试的影响是我整个未来。

您可以想象,这并没有让我适应那种尽量不给首席执行官提供太多信息就能赢得大量加分的情况。

我们中的大多数人在工作了15-20年的时间里,为了在教育系统中取得成功,必须尽可能地吐出更多的知识。

特别是在寻找入门级职位时,摆脱被认为是常态的方式,并转向与您的直觉相悖的流程和工作流需要勇气。毕竟,我在学校的经历并不孤单;我们中的大多数人在工作了15-20年的时间里,为了在教育系统中取得成功,必须尽可能地吐出更多的知识。

专注于最终目标

记住,您的作品集是向潜在雇主介绍自己的机会,他们希望看到的不仅仅是技术能力。他们想要看到您解决问题的能力、沟通技巧和对现实问题的理解。

在招聘时,我最看重与某人一起工作时的无缝性。一个团队的优秀程度取决于他们有效地一起解决问题的能力。

Leave a Reply

Your email address will not be published. Required fields are marked *