一个带有Python代码的实用数据分析文章。
介绍
地理空间数据科学是我感兴趣的领域之一。我发现我们如何在地图上可视化数据以及数据点之间的关系往往能够快速提供深刻的见解,这让我觉得非常有趣。
我相信这个数据科学的子领域在任何业务中都非常有用,尤其是杂货店、汽车租赁、物流和房地产等领域。在这篇文章中,我们将介绍美国北卡罗来纳州阿什维尔市的AirBnb数据集。
顺便说一下:在那个城市里有一处美国最令人惊叹的房地产,我敢说也是世界上最令人惊叹的房地产之一。这处房地产属于范德比尔特家族,在很长一段时间内它是美国最大的私人财产。它非常值得一游,但这并不是本文的核心主题。
本练习中要使用的数据集是阿什维尔市的AirBnb出租房。可以直接从他们的网站http://insideairbnb.com/get-the-data下载,根据知识共享署名4.0国际许可证使用。
让我们开始工作吧。
地理空间数据科学
本文中的知识主要来自下面提到的书籍(《应用地理空间数据科学与Python》,作者David S. JORDAN)。所以让我们开始导入一些模块到我们的会话中。
import pandas as pdimport geopandas as gpdimport matplotlib.pyplot as pltimport pysalimport splotimport reimport seaborn as snsimport folium# 用于点地图import geoplot.crs as gcrsimport geoplot as gplt
现在请注意,其中一些对你来说可能是新的,对我来说也是如此。如果需要,可以使用pip install module_name
安装所需的任何包。在我的情况下,pysal
和geoplot
是我不熟悉的,所以它们需要被安装。
接下来,我们将从AirBnb读取数据。
# 打开列表文件listings = pd.read_csv('/content/listings.csv', usecols=['id', 'property_type', 'neighbourhood_cleansed', 'bedrooms', 'beds', 'bathrooms_text', 'price'…