使用ChatGPT的最新插件构建一个端到端的数据科学项目。
作为一名同时从事全职数据科学工作和多个自由项目的人,我通常是第一个尝试可以减少工作时间的工具的人。
当ChatGPT在过去的一周开始向订阅者推出Code Interpreter插件时,我迫不及待地想将其应用到我的数据科学项目中。
如果你还没有听说过这个工具,Code Interpreter是一个插件,允许你在ChatGPT界面内上传文档并运行Python程序。
过去我们手动复制和粘贴数据到ChatGPT中等待回复的日子已经过去了。
有了Code Interpreter,你只需上传你的数据集,让工具分析你的数据,构建机器学习模型,并在几分钟内生成可视化结果。
在本文中,我将向你展示如何使用Code Interpreter执行一个端到端的数据科学项目。
任务-客户细分
在我之前的公司,我担任市场营销数据科学家的职位。
这意味着我会使用客户数据来增加销售额-通过识别我们最有利润的用户,预测流失率,并建立未来营销活动的目标用户档案。
我甚至写了一个使用Python构建客户细分模型的教程,在其中使用了一个公开可用的数据集来确定每个客户对一家电子商务公司的价值。
在本文中,我们将对相同的数据集进行客户细分。然而,这次我们将使用ChatGPT的Code Interpreter来帮助我们构建模型。
前提条件
我们将使用Kaggle的电子商务数据集进行分析。该数据集来自于UCI机器学习仓库,包含了一家总部位于英国的电子商务公司的真实零售交易信息。
该数据集采用知识共享署名4.0国际许可协议(CC BY 4.0)。