Press "Enter" to skip to content

Kaggle竞赛对于现实世界的问题有用吗?

Kaggle竞赛对于现实世界的问题有用吗? 四海 第1张

如果您正在进入科技行业或者已经在其中一段时间了,您一定听说过Kaggle。Kaggle 是一个数据科学竞赛平台,旨在为数据科学家和机器学习爱好者提供帮助。

这个在线平台旨在通过提供强大的工具和资源,引导用户在他们的专业生涯中实现他们的数据科学或机器学习目标。

随着人们努力提升和发展自己的事业,你会看到很多人涌向在线课程、竞赛等等。Kaggle 是一个令人惊叹的平台,让人们可以测试自己,置身于挑战中,并面对他们技能水平的现实情况。

许多人已经在 Kaggle 平台上构建了项目,获得了各种各样的数据集,并拥有诸如在内核中免费使用 NVIDIA K80 GPU 等非常有价值的资源。今天我们要提出的问题是“Kaggle 的竞赛对于真实世界的问题有用吗?”

在 Quora 上有一个问题: 我应该花时间参加 Kaggle 还是投入到有趣的副业项目中?哪个对我的职业生涯更有益?

有很多不同的回答,但是如您所见,下面的图片截图解释了您的问题的答案。 Kaggle竞赛对于现实世界的问题有用吗? 四海 第2张 让我们来看看 Kaggle 的竞赛是否适用于真实世界的问题。

Kaggle 对比真实世界

所以我们已经谈论了 Kaggle 的竞赛如何帮助您的学习之旅以及其中的一些方面如何反映真实世界中发生的情况。但是它对于真实世界的问题有用吗?总体来说答案是否定的。让我解释一下为什么。

识别问题

作为一个数据科学家或机器学习工程师,您的第一个任务是识别问题或理解当前需要解决的业务问题。例如,您可能需要区分问题的类型是监督学习还是非监督学习,决定使用哪种模型等等。

这是您即将做出的最重要的决策之一。如果您对组织整体没有全面的了解,那么您将会在识别根本问题时感到困难。

真实世界:识别问题或理解当前需要解决的业务问题

Kaggle:您将获得对问题的详细描述以及您要评估的内容。

数据准备

在 Kaggle 的竞赛中,主办方会为您提供准备好的数据集,并详细描述所面临的问题。这节省了数据科学家大量收集、清理和组织数据的时间 – 这在真实世界中是必须的。

有人认为 Kaggle 给予新的数据科学家和机器学习工程师提供了数据,让他们直接开始工作。数据准备是数据科学生命周期中的重要阶段,而 Kaggle 已经为用户提供了一切。

在现实世界中,您的公司可能会为您提供数据,也可能不会。如果他们没有提供,您将需要自己收集数据,确保它与当前问题相吻合,并进行清理和组织。您还可以自由地寻找其他相关数据,而在 Kaggle 上,您只能使用外部数据。

真实世界:数据收集和准备有助于解决您识别的问题。

Kaggle:为您提供与所面临问题详细描述吻合的准备好的数据。

特征工程

一旦您获得了数据并且它已经全部整理好,作为数据科学家,下一步就是成为一个特征工程师。特征工程源于您所面临的问题,您尝试解决的问题以及您将如何解决它。

通过这个,您将更好地了解您在特征工程上花费的时间以及数据科学生命周期的其他要素是否更重要。

然而,在Kaggle竞赛中,特征工程在您在排行榜上的位置中起着重要作用。是的,特征工程是数据科学生命周期的一部分,但实际世界的数据科学项目更注重驱动模型的因素,而不是小幅增益。

实际世界:特征工程的水平取决于手头的问题和您的关注重点。

Kaggle:特征工程的水平被用作激励措施,以在排行榜上取得更高的位置。

 

建模

 

选择正确的模型基于许多因素,如模型的可解释性,您正在使用的数据,模型的性能以及将模型投入生产。这些都与手头的问题一致,因为由您来确定哪种模型适合您企业的需求。

而在Kaggle上,用户更关心哪种模型表现最佳并处理他们正在使用的数据。选择模型时考虑的因素比起实际世界要少得多。

实际世界:根据与您企业问题相关的各种因素选择正确的模型。

Kaggle:根据性能选择正确的模型,因为您参加竞赛。

 

验证

 

验证是Kaggle和实际世界中相似的一个方面。验证模型的性能是一个重要的方面,因为它可以帮助您探索可以进行改进的地方,并显示您的模型在实际世界中是否有价值。

Kaggle竞赛展示了在实际世界中构建强大模型的用途。

 

将模型投入生产

 

在实际世界中,您构建的大多数模型旨在投入生产。这是因为您的模型背后有一个目的,您试图解决一个实际世界的问题。您的模型将以某种方式被整合到业务流程中,以帮助未来的决策。

另一方面,在参加Kaggle竞赛时,您最关心的是在排行榜上的排名,而不是您的模型将如何被实施和在未来如何使用。

实际世界:您构建的每个模型都有一个目的,您想将其投入生产以解决您企业手头的问题。

Kaggle:构建模型的总体目标是看您在排行榜上的排名和与竞争对手相比下次如何做得更好。

 

学习曲线

 

Kaggle教给您很多东西。通过Kaggle竞赛和处理不同任务和数据集,您可以学到很多东西。就个人而言,我认为学到更多并面临挑战没有任何害处。您只会通过反思自己的弱点以及如何将其转化为优势来学会如何克服这些挑战。

您宁愿在找到梦想工作之前了解更多,还是不了解?答案很简单,这取决于您对职业的期望。

Kaggle竞赛展示了您模型的性能,这对您的学习过程很有好处。正如上面的截图所示,您可能会认为您模型的性能非常好,结果才意识到与同一竞赛中的其他人相比,它并不那么好。

总之,Kaggle竞赛在您的学习之旅中推动您,并让您与来自世界各地的人竞争,提升个人能力。

 

截止日期

 

在实际世界中,当您在项目上工作时,会给您设定截止日期。截止日期有助于您掌控与组织业务计划一致的任务。每个截止日期都是一个新项目的开始。

Kaggle竞赛的截止日期反映了你日常任务的典型样貌。这是理解你的时间如何使用以及克服拖延的好方法。

总结

根据我们提到的要点,Kaggle竞赛的有用性完全取决于个人。是的,Kaggle竞赛的每个方面可能并不完全反映现实世界中发生的情况,但我们中的许多人也可以这样说我们在学校学到的一些东西。

这足以说明它对解决现实世界问题没有用处吗?

Kaggle竞赛为您提供了很多学习经验,让您可以探索之前从未关注过的技能。在Kaggle竞赛中可以获得很多经验,这些经验可以在以后的职业生涯中使用。

**** [Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/) ****是一名数据科学家兼自由技术作家。她对提供数据科学职业建议或教程和理论知识特别感兴趣。她还希望探索人工智能对人类寿命的不同方式的益处。她是一位热心的学习者,希望扩展自己的技术知识和写作能力,同时帮助指导他人。

Leave a Reply

Your email address will not be published. Required fields are marked *