Press "Enter" to skip to content

《使用 {dplyr} 进行 R 数据操作入门》

学习使用R中的{dplyr}包,它可以帮助你解决最常见的数据操作问题

照片由Claudio Schwarz提供

介绍

在之前的帖子中,我们展示了如何在R中操作数据。具体来说,我们演示了如何创建和操作向量、因子、列表和数据框。这样做是为了介绍R并且适用于初学者。而且,只要可能,所有操作都是在基础R中进行的,也就是说,不需要加载任何包。

在本文中,我们想再次展示如何在R中操作数据,但这次使用{dplyr}包。

由Hadley Wickham及其在posit的同事开发的{dplyr}包提供了一套完整的函数集,帮助您解决最常见的数据操作问题,包括:

  • 基于值筛选观察结果
  • 基于值或位置提取观察结果
  • 基于特定行数或行占比抽样观察结果
  • 基于一个或多个变量对观察结果排序
  • 基于名称或位置选择变量
  • 重命名变量
  • 基于现有变量添加新变量
  • 将观察结果或变量汇总为单一描述性测量
  • 按组执行任何操作
  • 将观察结果划分为两个或多个组
  • 等等

有关该包的更多信息,请访问dplyr.tidyverse.org

在本文中,我们将介绍使用{dplyr}包进行数据操作和数据管理的最常用函数(以数据框为示例)。但这并不是详尽无遗的列表!您可能还需要其他函数,而不仅限于此处介绍的函数。对于感兴趣的读者,请见本文末尾的进一步资源。

我经常被问到的一个问题是,是先学习基础R然后再学习{dplyr},还是直接学习{dplyr}。

Leave a Reply

Your email address will not be published. Required fields are marked *