让我们通过KDE图找出答案

歌手和词曲创作人在什么年龄段最成功?有一天我听到了一首史蒂夫·汪达(Stevie Wonder)的老歌,于是我想知道这个问题的答案。我的印象是,就像数学家一样,歌手和词曲创作人在中后期的二十多岁时达到巅峰。但是数据会告诉我们什么呢?
在这个快速成功的数据科学项目中,我们将使用Python、pandas和Seaborn绘图库来研究这个问题。我们将研究16位著名的歌手和词曲创作人的职业生涯,他们的歌曲总量超过500首。我们还将在分析中使用一种吸引人的图形,称为核密度估计图。
方法论
为了确定词曲创作人最成功的时期,我们需要一些指导方针。我们计划研究以下内容:
- 包括与其他创作人合作的歌手和词曲创作人。
- 职业生涯长达数十年的歌手和词曲创作人。
- 各种类型的歌手和词曲创作人以及音乐流派。
- 登上公告牌百强单曲榜的歌手和词曲创作人。
《Hot 100》是由《公告牌》杂志每周发布的排行榜,它排名美国最畅销的歌曲。排名是基于实体和数字销售额、广播播放量和在线流媒体播放量。我们将使用它作为一种一致和客观的方式来评判成功。
数据
我们将使用以下高度成功艺术家创作的歌曲:
我记录了每位艺术家在每首热门歌曲时的年龄,并将其保存为存储在此Gist上的CSV文件。如果他们在同一年中有多首热门歌曲,他们的年龄条目会被重复记录。以下是文件顶部的简要预览:
交叉参考这些信息是一项繁琐的任务(ChatGPT拒绝做这件事!)。因此,这些艺术家创作但由其他人演唱的一些热门歌曲可能被意外排除在外。
核密度估计图
核密度估计图是一种方法,类似于直方图,用于可视化数据点的分布。直方图将观察结果进行分组和计数,而核密度估计图使用高斯核将观察结果平滑处理。这个…