图片:
导航似乎是一个恰当的词语。数据科学有时候看起来像一片狂野的海洋,每隔几分钟就会冲上来一个新的职位头衔或专长。非常感谢你,数据科学。我们欣赏你的活力和狂野,但是我们该怎么处理它呢?
首先,让我们先搞清楚基本概念。当我说数据科学工作时,我指的是包括所有数据相关职位在内的更广义的数据科学。对我来说,所有这些都是数据科学职位头衔。
其次,数据分析师、数据科学家和数据工程师已经不再是新职位。但是它们仍然会引起一些关于谁做什么的混淆。这些职位之间存在一些轻微的重叠,这并没有帮助到我们。
有很多公司会让情况变得更糟,他们只有一个人的数据团队。是的,创业公司,我正在看着你们!
不,数据分析师、数据科学家和数据工程师不是同样的职位!谁能想到呢?
虽然这些职位在专业领域和重点上有所不同,但他们都是作为公司数据团队的一部分朝着同一个目标努力。
为什么数据岗位至关重要
每个公司都认识到数据的价值,并通过数据团队来提取数据。通常,大多数公司都希望通过数据达到以下五个共同的目标。
1. 决策支持
数据让公司能够不再基于决策者的商业直觉(可理解为运气)而胡乱尝试。随着技术的进步,数据的种类和使用可能性也增加了。
数据科学利用数据提供洞察来支持公司的战略和高层决策。
2. 提升客户体验
公司必须以客户为中心,因为他们的收入来自于客户。数据科学允许公司分析客户行为和反馈。这使得企业能够根据客户的需求量身定制产品和服务,并预测他们的需求。
3. 提升运营效率
尽可能从客户那里获得更多收入是企业的目标,但企业也希望以最高效的方式实现这一目标。也就是说,以最低成本实现这一目标。数据科学在这方面发挥了作用。它可以自动化和加速任务,优化任务,并发现瓶颈。简而言之,处理业务的成本方面。
4. 创新和竞争力
数据科学通过识别和预测客户需求、行业趋势、经济变化等推动创新。这里的创新不仅限于现有或新产品,还包括营销和销售策略以及制造流程。
5. 风险管理
企业是有风险的,咳咳,生意。数据科学帮助企业识别、评估和管理潜在风险。
数据科学职位头衔
如果我们没有对每个职位有清晰的定义,就无法分析这些职位之间的差异。让我们从这里开始。然后,我们将介绍它们的职责、技能、使用的工具和职业发展路径。
数据分析师
角色概述:数据分析师,顾名思义,分析数据。他们通过分析数据来识别模式并得出可行的洞察。这些模式和洞察以报告和仪表盘的形式呈现,帮助决策者做出明智的决策。
数据分析师主要负责描述性(发生了什么?)和诊断性(为什么会发生?)的数据分析。
关键职责:
- 数据清洗:标准化数据、更改数据格式,并处理重复、缺失值和数据不一致性,使数据准备好进行分析。
- 数据分析:使用统计方法来理解数据中的趋势、模式和洞察。
- 数据可视化和报告:通过报告、数据可视化和仪表盘传达数据分析结果。
关键技能和工具:主要的技能和工具可以从职位描述中获得。
职业路径:数据分析师可以晋升为更高级的分析师角色。通过更多的经验和额外的教育,他们可以过渡到专业角色,如统计学家,业务分析师,甚至数据科学家。
数据科学家
角色概述:数据科学家也进行数据分析,但在更高级别上进行。他们使用统计模型和机器学习算法来确定未来事件的可能性。这告诉我们,与数据分析师不同,他们关注的是预测性(会发生什么?)和指导性(应该做什么?)数据分析。
主要职责:
- 高级分析:使用高级统计技术从数据中提取见解。
- 机器学习:使用机器学习算法从现有数据中进行学习。
- 预测建模:构建和部署模型以预测实际数据和新数据中的未来事件。
这些主要职责建立在数据分析师进行的工作基础之上。数据科学家也无法离开数据清洗和数据可视化。
关键技能和工具:以下是成为数据科学家所需的技能和工具。你会发现与数据分析师有一些重叠。
职业路径:数据科学家从初级数据科学家开始,可以晋升为高级数据科学家、首席数据科学家和数据科学总监。他们还可以从事其他方向,比如成为人工智能专家、机器学习工程师或计算机和信息研究科学家。
数据工程师
角色概述:数据工程师构建数据系统,用于收集、存储和传输数据。他们确保所有数据用户的数据可用性、质量和可分析性。
主要职责:
- 数据架构:根据数据架构师设想的设计构建数据系统。
- 数据管道:构建系统,将数据从多个数据源流向数据库、数据仓库和数据湖,并为其他数据用户准备就绪。
- 确保数据质量:识别数据中的错误和不一致性,消除它们,并提高数据的准确性和可靠性。
是的,数据工程师专注于这些任务。但他们也不能回避数据清洗和数据可视化。
关键技能和工具:以下是数据工程师所使用的技能和工具。
职业路径:数据工程师的职业可以发展为高级数据工程师或数据架构师。他们还可以专攻大数据、机器学习或业务智能等领域。
数据分析师、数据科学家和数据工程师的维恩图
我们已经了解了这三个职位之间的差异。在这个过程中,我们还注意到这些职位所需技能的一些重叠。
为了快速了解,可以使用维恩图进行展示。
你可以看到所有三个职位共享的技能是:
- 编码
- 数据操作
- 云计算
- 数据可视化
除此之外,两个职位之间还分享了其他技能。
数据分析师没有任何独属于他们的技能;其他职位也需要具备这些技能,但在一定程度上。
数据科学家独有的技能包括:
- 模型构建、测试和部署
- 人工智能
数据工程师专有的技能包括:
- 数据集成、ETL/ELT和处理
- 数据仓库
现在让我们使用相同的可视化方式展示这些工作所使用的工具。
图像显示这三个工作都使用了以下工具:
- SQL
- Python
- 关系数据库
- 云数据库
- NoSQL数据库
- 商业智能和数据可视化工具
除此之外,两个职位之间还分享了其他工具。
数据分析师使用的工具至少还被其他一个职位使用。虽然这些工作可能使用相同类型的工具,但是在使用程度上可能有所不同,或者同一类别中的具体工具也可能不同。
数据科学家独有的工具包括:
- R
- 数据科学和机器学习工具
数据工程师独有的工具包括:
- Java
- Scala
- Go
- 数据集成、ETL/ELT和处理工具
- 数据仓库工具
架起鸿沟:合作至关重要
我们看到每个角色都有明确的责任和使用的工具。这三个工作之间也存在一些重叠。这表明数据分析师、数据科学家和数据工程师在数据团队中的合作至关重要。
数据分析师和数据科学家都依赖基础设施和高质量的清洁有序数据。另一方面,数据工程师必须与数据分析师和数据科学家合作,在构建数据架构和提供数据时,作为数据使用者。
数据科学家通常必须与数据分析师合作,以更好地理解业务环境。
结论:选择你的道路
现在,数据分析师、数据科学家和数据工程师之间的差异和相似之处应该更加清晰。
总而言之:
- 如果从数据中获取洞见并将其传达出去是你的强项,那么数据分析可能是你的路线。
- 如果构建预测模型和使用机器学习算法令你兴奋不已,那么考虑数据科学。
- 如果你觉得构建数据架构和确保数据流畅会让你快乐,那么数据工程可能是正确的选择。
如果你想了解更多,这里有更多关于数据工程师和数据科学家的区别,以及数据分析师和数据科学家的区别的详细信息。
****[Nate Rosidi](https://twitter.com/StrataScratch)**** 是一位数据科学家和产品战略家。他还是一位兼职教授,教授分析学,并担任StrataScratch的创始人,这是一个帮助数据科学家通过真实面试问题准备面试的平台。您可以通过Twitter: StrataScratch或LinkedIn与他联系。