让我们看看它可以有多好和多坏

大多数与数据相关的工作的一大部分是数据清洗。通常没有标准化的数据清洗方法,因为数据可能以各种不同的方式呈现。
我们会遇到不一致性、数据输入错误以及许多其他类型的问题,需要在数据可以用于下游处理之前加以处理。
我测试了ChatGPT高级数据分析(ADA)插件,用于处理一份关于汽车数据集的数据清洗任务。
简而言之,ChatGPT ADA在使用数据清洗库执行所需任务方面非常有帮助,但在某些情况下无法确定该做什么。
实际上,我之前自己清理了数据集。现在,我想看看ChatGPT ADA插件将如何处理任务并进行清理。我将分享我的代码以及ChatGPT的代码,以供您进行比较。
要能够使用ADA,您需要在设置中的测试功能下激活它。然后,在开始一次新的聊天之前,只需在写入任何指令之前点击ADA。

下一步是将数据集上传到聊天中,可以通过在提示窗口旁边点击“+”来完成。

以下是数据集的前5行:

我是用模拟数据创建的这个数据集。然而,它就像你从网上爬取的一个汽车数据集一样。我知道这一点,因为我之前做过。如果您想测试这个插件的话,你可以从我的数据集仓库下载这个数据集。它叫做“mock_car_dataset”。
提示
我首先向ChatGPT提了一个普通问题:
我:告诉我关于这个数据集