Press "Enter" to skip to content

从商学生到科技领域的数据科学家

初入科技行业的数据科学家的第一年编年史

我从害怕数学到成为一名在著名科技公司拥有全面发展的数据科学家的时间轴

在 LinkedIn 上,我经常收到的最常问的问题之一是:我如何一夜之间从商业转行工程,并成为一名数据科学家?

所以在这个故事中,我将深入探讨我的个人经历,并与您分享我所遵循的步骤,我所面临的挑战,以及我所获得的宝贵经验,这些经验将我直接推向成为科技领域的数据科学家。

Photo by carolyn christine on Unsplash

成为一名数据科学家没有一种具体的方法。俗话说,条条大路通罗马。然而,我在这里要分享其中一种途径。 特别适用于那些以商业学位为起点,几乎没有科学背景的人。

在深入了解如何之前,我们首先需要为为什么打下基础。相信我,如果您不从一开始就确立起自己的目标,您将无法走得太远。

成为一名数据科学家的旅程是艰辛的,但肯定也是最有回报的之一。事实上,数据科学家拥有如此酷炫和令人垂涎的工作的原因之一是多种多样的。现在,我只关注排在我的列表顶部的原因。

为什么

无论是在面试中还是对于简单好奇的人,任何人问我为什么选择数据科学?我的回答总是一样的。 我想成为一名侦探,所以我决定成为一名数据科学家。

您可能想知道这两者有什么关联?我见过的第一批数据科学家立刻给我的感觉就像是现代版的福尔摩斯。

数据科学家每天都在使用知识解决谜题。最终,他们大部分的时间都在调查数字,以找到只有敏锐的分析思维才能解决的复杂问题的解决方案。这正是侦探所做的。

How I picture myself sometimes — Photo by alexey turenkov on Unsplash

我一直对福尔摩斯的冒险充满了激动的感觉,他不断地追踪线索,直到谜团被揭开。我想成为像他一样的冒险家,但是我几乎无法想象自己放下学业去和警察一起破案。我想这对我的口味来说有点过于极端了,我也不想在生活的早期与坏人对抗。所以成为一名数据科学家感觉就像是两全其美。

这个领悟只是需要一些时间来启示我。而到那时,成为一名数据科学家似乎与我当时追求的目标——商业学位相距甚远。

回首往事,我与福尔摩斯唯一的共同点就是我对于似乎不可能实现的任务充满了热情。考虑到我对编程毫无经验,这些任务几乎是天方夜谭。但我没有意识到,接受这种大胆的信仰飞跃将成为我追求生命中最大的激情的黄金通行证:音乐。

Taking a leap of faith — Photo by Julian Paul on Unsplash

如何

第一步 — 面对和拥抱数学怪兽

尽管对科学有着长期的迷恋,但上帝尚未认为我配得上轻松理解科学术语的高度独家礼物。我也没有得到完美的音准,但这与此无关。

所以,毕业后,我自然而然地被吸引到这个世界的大多数对科学学科不擅长的无知高中生所做的事情——商业学习。

我与数学的关系一直相当动荡。我是高中的经济学专业。物理学让我感觉自己处于平行宇宙中,数学概念听起来像外星文明的秘密代码。教训需要时间才能理解,但是…它们最终会在早晚之间产生效果。有时,非常晚。

JESHOOTS.COM在Unsplash上的照片

我很早就知道随身携带数学会在某个时候派上用场。因此,我不打算让自己的科学缺陷妨碍我超越自己的能力去梦想。在高中的最后一年,我决定彻底面对数学怪兽。我将所有的精力投入到驯服野兽上,直到它最终屈服。

这是一个改变游戏规则的时刻。

它给了我必要的信心,在大学期间在我的商业专业旁修数学专业。

在我修读数学专业期间,我追求的数学课程中,这些是为解决数据科学和机器学习问题奠定基础的基础课程:

  1. 微积分
  2. 线性代数
  3. 统计学和概率论

对于所有害怕数学的灵魂们,请记住,我们对某件事的厌恶程度取决于我们在其中表现得多么糟糕。我们越早在一个学科中提高和优秀,我们的认知就会发生更大的改变。因此,如果你的目标是成为一个厉害的数据科学家,是时候直面数学怪兽,向他展示谁才是老大了!

商业显然不是我的天职。我太享受被数学怪兽诱人的控制所折磨。因此,在我最后一个学期,我深入探索与数学相关的职业道路。最终,我的搜索将我引向数据科学领域。我抓住了一个作为数据分析师实习的机会,同时进入了纽约大学的城市信息学硕士课程(一个应用数据科学在智慧城市领域的花哨词)。

一个漫长系列中的第一个里程碑

第二步 – 建立编码直觉需要时间

你可能想知道一个没有任何编码经验的商业毕业生如何设法进入工程学院?嗯,还记得我在本科阶段学的那些数学课程吗?

事实证明,你只需要那3门课程就足够开始机器学习(ML)了。纽约大学的学位是一个沉浸式但紧张的12个月项目,在这个项目中,我立即开始用Python进行ML建模,用SQL建立数据库,同时试图处理大数据(至少试图)。

我必须在这里透明一点。从商业转向工程的一夜之间是一个繁忙的过程。那一年感觉就像是一次几乎接近死亡的经历。第一次学习多种编程语言意味着要培养对每种语言的独特直觉,这需要时间。在一个压缩的时间框架内同时掌握所有这些,背负沉重的学费(还有一场大流行病)不是我会建议胆小的人做的事情。

对于一个在此之前从未写过一行代码的人来说,这对我的大脑来说就像是一次大的冲击波,它从管理原理开始,然后一夜之间全面运行ML模型。

回想起来,我会做一件事情不同的是在深入研究机器学习之前先学习编码,而不是同时学习。

engin akyurt在Unsplash上的照片

玩弄机器学习是一种乐趣,但这远远不够。我仍然没有完全理解那些Python包背后发生的事情。除非你能深入挖掘,否则在科技就业市场上,你永远不会被视为真正的数据科学家。你必须能够流利地解释那些预打包的机器学习算法的基本原理。所以我知道我必须理解这些机制,但是从远处来说,我在一年内只能取得有限的成就。

那时,COVID-19爆发了,美国的工作机会就像我之前的编码技能一样不存在。所以我想我可以在学术界多待一年(或两年)。我申请并被法国的这个独特双学位项目录取,该项目结合了数据科学的两个最佳领域:商业和机器学习。

第3步-从库导入者到解释者:释放真正的数据科学家

追求这个学位后,我发现这是我一生中最好的决定之一。它让我有机会在法国顶级商学院和工程学院学习,这是曾经不可想象的壮举。我从来不是学校最聪明的人,但我一直有在最困难的道路上前进的才能。坚定和固执是我最重要的资产,所以我很早就把它们用到了好的方面。

在这两年的转变中,我学到了我甚至不知道自己需要学习的数据科学知识。我一路上学到的武器至今仍然指引着我,我来与你分享:

  1. 理解机器学习算法背后的数学区别专业人士和Python库用户。我学会了如何证明数学定理,但我相信理解理论背后的关键概念就足够了。没有必要直接涉及方程本身。
  2. 精通Python和SQL是“数据科学在技术领域”的起步技能包中的必备技能。提取和构建数据管道需要在数据仓库(如BigQuery)上停留,而这些仓库通常由SQL驱动。花时间掌握这些Python基础知识将有助于数据准备和分析。
  3. 你将需要线性代数和微积分来帮助你理解机器学习理论的基础,但没有什么能比拥有统计学和概率概念更重要了。统计学在数据科学家的日常工作中具有直接的应用,所以最好确保你早早地理解统计显著性和概率分布的基础知识。
  4. 如果你无法将数据洞察力传达给非技术人员,那么这些洞察力就毫无价值。提炼你的叙事技巧对于数据科学家来说是一次不断的旅程,所以最好尽早登上这艘船。
  5. 在与聪明的人和经验丰富的同事一起工作时,培养韧性和耐心。当你来自不同背景时,容易产生冒名顶替的感觉。自我怀疑是一个可怕的野兽,所以最好早早地熟悉它,以摆脱它。

通过接受这些教训,我作为一个数据科学家得到了提升。它们为我打开了在科技领域开始职业生涯所需的必要工具。

最好的程序员不一定是最好的数据科学家。要在科技世界中作为数据科学家蓬勃发展,从商业背景出发,我了解到必须:

  1. 拥抱数学的不适感。掌握线性代数、微积分和统计学与概率论的基本知识。
  2. 花时间彻底学习Python和SQL。不要让自己过度担心过多的编程框架。
  3. 深入研究机器学习的数学基础,揭开预打包算法的神秘面纱。能够解释它们的原理。
  4. 从一开始就磨练你的叙事技巧。掌握以引人入胜和易于理解的方式传达复杂概念的艺术。
  5. 将商业概念与前面步骤所获得的知识相结合,创造强大的组合。

过去,我低估了我在商业学士学位的价值。往往感觉自己花了几年时间追求错误的道路。但在加入Spotify之后,我发现商业和数据科学专业的融合创造了最优秀的数据科学家。真正的力量在于那些能够无缝地在两个领域中游刃有余的人。你没有理由不成为其中之一!

您的支持是无价的,如果您能做到以下几点,我将非常感激:

  • 关注我在 小猪AI
  • 订阅我的 通讯
  • 关注我在 LinkedIn
Leave a Reply

Your email address will not be published. Required fields are marked *