Press "Enter" to skip to content

如何在R中自动导入和合并多个文件

停止浪费时间手动导入多个文件

ThisisEngineering RAEng在Unsplash上的照片

在我的数据科学家工作中,由于不同软件的导出限制,我经常需要导入包含相同类型信息的几个不同文件。如果您处于类似情况,下面是一种明确且简单的方式,可以自动将文件导入为单独的数据框或将它们合并为一个数据框。

准备您的文件

在开始编写代码之前,我们首先必须准备好我们的文件。我们需要有一种以编程方式选择要导入R的文件的方法。虽然您可以选择任何方法来区分这些文件,但以下是两种最简单的方法:

  1. 为您要一次导入的所有文件创建一个唯一前缀。
  2. 在您的工作目录中创建一个单独的文件夹,并仅将这些文件放入该文件夹中。

例如,如果我有一组名为“SA#.xlsx”的Excel文件。如果我没有其他以SA开头的类似文件,那么我已经有了我的前缀。如果我的文件夹中有其他以SA开头的文件,例如“SAT.xlsx”,我可以轻松创建一个文件夹,并将其命名为“SA”。然后,我只会将我想要导入为SA的文件放入那个文件夹中。

创建您的文件列表

一旦我们有了编程方式来识别我们的文件,我们需要创建一个包含所有文件名的列表。我们可以使用R函数list.files()来实现这一点。

带有前缀的文件列表

如果您选择为文件名添加前缀,我们将使用list.files()的pattern参数来选择我们想要的特定文件。

# Formulafilelist <- list.files(pattern = "^<prefix>")#Examplefilelist <- list.files(pattern = "^SA")

pattern接受一个正则表达式。因此,我们可以使用“^”符号来表示字符串的开头。这样可以确保任何其他文件名中包含“SA”但不在开头的名称将不包含在这组名称中。注意:这将仅从您的工作目录中提取文件。您可以更改

Leave a Reply

Your email address will not be published. Required fields are marked *