Press "Enter" to skip to content

《统计学习导论,Python版:免费书籍》

《统计学习导论,Python版:免费书籍》 四海 第1张  

多年来,《统计学习导论:R语言版》(简称ISLR)一直被机器学习初学者和从业者们珍爱,被誉为最好的机器学习教材之一。

现在,《统计学习导论:Python语言版》(或称为ISL with Python)来了,社区的热情更高涨了!

 

ISL with Python已经发布了。很棒!但为什么?

 

很高兴你问到了。😀

如果你在机器学习领域已经有一段时间了,很有可能你之前已经听说过、阅读过或使用过该书的R语言版本。你也知道你最喜欢它的哪些方面。但这是我的故事。

在我开始攻读研究生之前的那个夏天,我决定自学机器学习。我很幸运在我的机器学习之旅中很早就找到了ISLR。ISLR的作者们在以易于理解的方式分解复杂的机器学习算法,同时提供所需的数学基础,而不会给学习者们带来过多的压力。这是我喜欢这本书的一个方面。

然而,ISLR中的代码示例和实验室是用R语言编写的。可悲的是,那时候的我还不懂R语言,但在Python中编程很得心应手。所以我有两个选择。

我可以学习R语言。或者我可以使用其他资源(教程和文档)来在Python中构建模型。和大多数其他Python程序员一样,我选择了第二个选项(是的,这是一条更熟悉的路线,我知道)。

虽然R语言非常适合进行统计分析,但如果你刚开始进行数据之旅,Python是一个很好的第一门语言。

但现在这不再是个问题了!因为这个新的Python版本让你可以使用Python编写代码并构建机器学习模型。不再担心需要学习一门新的编程语言来跟进了。

故事时间到此结束!让我们更仔细地看一下这本书的内容。

 

《统计学习导论:Python语言版》的内容

 

在内容方面,Python版本与R版本非常相似。然而,它是Python的一个适当的改编,这是可以预料的。这本书还包括了一个Python编程速成课程,以学习基础知识。

这本书涵盖的范围非常广泛。从统计学习基础、有监督和无监督学习算法到深度学习等等,这本书的章节组织如下:

  • 统计学习
  • 线性回归
  • 分类
  • 重抽样方法
  • 线性模型选择和正则化
  • 超越线性
  • 基于树的方法
  • 支持向量机
  • 深度学习(涵盖普通神经网络、卷积神经网络和循环神经网络)
  • 生存分析和截断数据
  • 无监督学习
  • 多重测试(深入研究假设检验)

 

ISLP Python包

 

本书使用了从UCI机器学习库和其他类似资源中获取的数据集。一些示例包括自行车共享、信用卡违约、基金管理和犯罪率等数据集。

学习通过网络抓取数据和从不同来源导入数据的能力对于数据科学项目非常重要。

然而,对于一个不熟悉数据收集步骤的学习者来说,如果他们想通过这本书掌握理论和实践部分,这可能会在学习过程中引入阻力。

为了提供一个顺畅的学习体验,本书配套提供了一个ISLP包:

  • ISLP包适用于所有主要平台:Linux、Windows和MacOS。
  • 您可以使用pip来安装ISLP:pip install islp,最好在您的机器上的虚拟环境中进行安装。

ISLP软件包有全面的文档。ISLP软件包附带了数据加载工具。当您使用特定数据集时,文档页面会提供有关数据集中各个特征、记录数以及将数据加载到pandas dataframe的起始代码。

它还具有帮助函数和功能,可以创建多项式和样条特征等高阶特征。

  《统计学习导论,Python版:免费书籍》 四海 第2张  

为了获得更全面的学习体验,您可以从数据源中读取数据,在不使用ISLP软件包的情况下进行特征工程。

在构建模型时,您可以尝试仅使用scikit-learn实现以及用于深度学习部分的PyTorch或Keras。

 

那么,这本书适合谁呢?

 

数据科学和机器学习初学者:如果您是一个初学者,更喜欢自学机器学习,这本书是一个很好的学习资源。

机器学习从业者:作为一个机器学习从业者,您已经有了构建机器学习模型的经验。但是回到基础知识,如假设检验和其他算法,可能会有所帮助。

教育工作者:理论和实验结合起来,使这本书成为机器学习初级课程的良好教材。如今,大多数大学和数据科学训练营都教授机器学习。因此,如果您是一位教育工作者,正在教授或希望教授机器学习课程,这是一个很好的教材选择。

 

总结

 

就这样了。《Python统计学习导论》是今年夏天最令人兴奋的新书之一。

您可以访问statlearning.com开始阅读Python版。虽然电子版是免费阅读的,但亚马逊上的平装版在第一天就售罄了。因此,我们很高兴看到您充分利用这本书。立即开始阅读吧。祝学习愉快!     Bala Priya C来自印度,是一名开发人员和技术作家。她喜欢在数学、编程、数据科学和内容创作的交叉领域工作。她感兴趣和擅长的领域包括DevOps、数据科学和自然语言处理。她喜欢阅读、写作、编码和喝咖啡!目前,她正在通过撰写教程、指南、观点文章等,与开发者社区学习和分享她的知识。

Leave a Reply

Your email address will not be published. Required fields are marked *