Press "Enter" to skip to content

勾勒未来的表格数据探索与研究

对于在表格数据上进行探索性数据分析的人们:有一个名为 “Sketch”(草图)的代码编写助手,可以无缝地将您的数据框的部分整合到提示中。

I’ve made this map using Sketch, Jupyter, Geopandas, and Keplergl

对于我们数据专业人士来说,人工智能的进步带来了新的工作流程,并增强了我们的工具集。在本文中,我将分享我使用这些新工具解决实际问题的经验。

什么是 Sketch

Sketch是一个 PyPI 包,将 OpenAI API 的强大功能带给了使用 Pandas 和 Jupyter 进行传统探索性数据分析的人们。根据官方文档的描述,Sketch 是一个面向 Pandas 用户的人工智能代码编写助手,可以理解数据的上下文,极大地提高了建议的相关性。Sketch 可以在几秒钟内使用,并且不需要将插件添加到您的集成开发环境中。

GitHub — approximatelabs/sketch: AI code-writing assistant that understands data content

Sketch 是针对 Pandas 用户的 AI 代码编写助手,可以理解数据的上下文,极大地提高……

github.com

Sketch 可以在几秒钟内安装,并且不需要搞乱 API 密钥或复杂的设置过程。只需通过 pip install sketch 进行安装,并运行 import 将其插入。

import pandas as pdimport geopandas as gpdimport sketch

简言之,Sketch 使用实际数据框的上下文来增强提示,极大地提高了响应的质量。我尝试过它,并感到非常印象深刻。

df.sketch.ask()

df.sketch.ask() 语法是 Sketch 上使用问答系统的一种方式。为了测试它是否真正有用,我加载了一个来自布鲁维克县的地块 shapefile(在任何房地产科技的探索性数据分析中都非常典型)到 GeoPandas 数据框中:

Data columns (total 8 columns): #   Column      Non-Null Count   Dtype   ---  ------      --------------   -----    0   PIN         149686 non-null  object   1   CALCAC      152593 non-null  float64  2   PARCEL_ID   148871 non-null  object   3   PARCELTYPE  152593 non-null  int64    4   SUBCODE...
Leave a Reply

Your email address will not be published. Required fields are marked *