Press "Enter" to skip to content

学习新的数据科学技能,正确的方式

我们倾向于将学习曲线视为整洁、平滑、持续上升的线条。然而,仔细观察任何学习过程,你会发现其中有许多下降和平台期:事实上,即使是经验丰富的专业人士在面对新工具或工作流程时也会感觉像初学者。

本周,我们整理了一些我们最喜欢的最近的教程和入门指南。它们对于数据和机器学习从业者来说几乎没有任何先决条件;它们涵盖了非常不同的主题,从深度学习到异常检测,但都致力于耐心的解释、具体的细节和专家的背景知识。所以如果你发现自己在学习停滞期中,选择以下任何一个亮点:它们一定能帮助你立即恢复。

  • 有时候,跳入深水区是完全合理的:为什么不从头开始实现和训练一个卷积神经网络(CNN)呢?你将有Betty LD的逐步指导来帮助你完成这个过程;如果你一直想着尝试PyTorch Lightning库,这是个好机会。
  • 今年夏天似乎是开源大型语言模型的季节,每隔几天就会有一个新的样本出现在舞台上。Donato Riccio的新文章是一个适合初学者的入门指南,涵盖了关于Llama、Alpaca和更多内容的基础知识,并介绍了微调和使用这些LLM的基本方法。
Photo by Giulia Bertelli on Unsplash
  • 想要更深入地了解开源LLM领域?不需要救生圈:Shawhin Talebi将帮助你熟悉Hugging Face的Transformers库,该库提供了“一种简单且免费的方法来使用各种开源语言模型。”
  • 对于更传统的机器学习方法,Evie Fowler的最新贡献概述了使用异常检测方法来解决监督学习中由不平衡结果类别引起的问题的好处。

为什么要停在这里?如果你还想继续学习,我们还有一些优秀的阅读材料你不容错过:

  • Ruth Eneyi Ikwu通过对一个有问题的数据集进行批判性审视,探讨了未经检查的共线性如何导致意外偏见。
  • 是否有实现可持续人工智能的实用途径?Leonie Monigatti在Kaggle比赛中获奖的文章调查了提高深度学习模型在生产中的效率的潜在方法。
  • 如果你对音频和音乐数据感兴趣,Naman Agrawal对时间和频率域特征提取的深入探讨是必读的。
  • Mark Ridley对生成式人工智能的崛起可能如何影响产品工程团队进行了深入分析。(注意:这是这个优秀系列的第一篇文章)。
  • 数据科学和机器学习角色描述不断发展;Stephanie Kirmer聚焦于机器学习工程师,并思考他们的出现是否可能是数据科学中的粉领化现象的症状。
  • Pol Marin继续探索体育分析中的有趣主题;他最新研究的对象是巴塞罗那足球俱乐部的防守(及其不满)。

感谢您支持我们的作者!如果您喜欢在TDS上阅读的文章,请考虑成为VoAGI会员——它可以解锁我们的整个存档(以及VoAGI上的每篇文章)。

在下一个Variable出现之前,

TDS编辑

Leave a Reply

Your email address will not be published. Required fields are marked *