Press "Enter" to skip to content

我对ChatGPT ADA进行了数据清理任务的测试它非常有帮助,但在逻辑推理中失败了

让我们看看它可以有多好和多坏

(本文作者使用Midjourney创建的图片)

大多数与数据相关的工作的一大部分是数据清洗。通常没有标准化的数据清洗方法,因为数据可能以各种不同的方式呈现。

我们会遇到不一致性、数据输入错误以及许多其他类型的问题,需要在数据可以用于下游处理之前加以处理。

我测试了ChatGPT高级数据分析(ADA)插件,用于处理一份关于汽车数据集的数据清洗任务。

简而言之,ChatGPT ADA在使用数据清洗库执行所需任务方面非常有帮助,但在某些情况下无法确定该做什么。

实际上,我之前自己清理了数据集。现在,我想看看ChatGPT ADA插件将如何处理任务并进行清理。我将分享我的代码以及ChatGPT的代码,以供您进行比较。

要能够使用ADA,您需要在设置中的测试功能下激活它。然后,在开始一次新的聊天之前,只需在写入任何指令之前点击ADA。

如何激活ADA(本文作者提供的图片)

下一步是将数据集上传到聊天中,可以通过在提示窗口旁边点击“+”来完成。

如何在聊天中上传数据集(本文作者提供的图片)

以下是数据集的前5行:

(本文作者提供的图片)

我是用模拟数据创建的这个数据集。然而,它就像你从网上爬取的一个汽车数据集一样。我知道这一点,因为我之前做过。如果您想测试这个插件的话,你可以从我的数据集仓库下载这个数据集。它叫做“mock_car_dataset”。

提示

我首先向ChatGPT提了一个普通问题:

我:告诉我关于这个数据集

Leave a Reply

Your email address will not be published. Required fields are marked *