Press "Enter" to skip to content

在Python中使用Pandas的全面指南

学习如何使用Python中最著名的数据处理库之一

Photo by stonewyq @ Unsplash.com

当你开始在数据分析、工程或科学的上下文中使用Python时,pandas(很可能)是你必须了解的第一个库之一。这个令人难以置信的库使你能够操作Python语言中的两个非常重要的对象——一维Series和二维DataFrame。这些对象是许多数据流程的一部分,掌握它们对于开始你的Python职业非常重要。

DataFrames在数据科学和分析中被广泛使用,因为它们可以创建多维和多类型的对象。本文的目标是提供一个关于如何使用一些著名的pandas函数以及如何使用该库的最重要功能的非常完整的指南。希望在阅读完本指南后,你将准备好使用最重要的pandas功能。你可能还经常从SQL背景迁移,所以我将尝试在帖子的一些指令中给出与SQL代码的比较,以便更容易比较两个框架之间的指令。但请记住,了解SQL绝对不是学习pandas的要求!

在本文中,我们将使用各种数据来了解pandas,包括:

  • 我们将使用对象创建命令构建自己的pandas Series和DataFrames。
  • 我们将使用三个包含有关股票价格信息的数据集,可以在此处找到(https://www.kaggle.com/datasets/rprkh15/sp500-stock-prices),即我们将使用Ford、Apple和Abbvie的股票价格数据。

在本文中,我们将介绍最著名的pandas功能,包括:

  • 创建数据框
  • 选择行
  • 选择列
  • 合并数据框
  • 绘制数据
  • 分组数据
  • 链式函数

言归正传,让我们开始吧!

导入库

Leave a Reply

Your email address will not be published. Required fields are marked *