Press "Enter" to skip to content

研究文章元数据描述快速简便

用几行Python代码从研究元数据中总结关键信息的文本挖掘方法

Photo by fabrikasimf on Freepik

作者:Petr Koráb(德国弗里德里希港的泽普林大学;捷克的Lentiamo)和Jarko Fidrmuc(德国弗里德里希港的泽普林大学)

介绍

研究出版物的元数据(文章标题、发布日期、关键词)提供了宝贵的洞察力,能够揭示整个领域随时间的发展情况。使用适当的文本挖掘技术可以帮助发现研究人员在不同时间关注的概念、理论或模型。在社会科学中,文章标题还反映了它们所呈现结果的情感。例如,标题为“信贷紧缩和金融危机下企业的冲击:韩国的经验”的文章呈现了与逆境事件相关的结果,而文章“不要担心,要快乐:幸福经济学调查”可能提供更积极的结果。尽管这并不适用于所有科学学科,但本文将展示这种逻辑在最受尊敬的经济学期刊中是如何运作的。这种方法也可以应用于类似的问题,包括特定领域的新闻报道(新闻标题和标题)或社交媒体上的其他短文本(Twitter或Facebook评论)。我们将在Python代码中讨论以下主题:

  • 描述性分析:通过分析期刊元数据,了解经济研究中的关键主题
  • 情感分析:评估经济研究的当前情感以及研究人员对未来的看法

2. 研究元数据

让我们从元数据收集开始。Constellate是一个数据分析服务,提供来自JSTOR和Portico数据库的学习材料和文本数据集。这个平台允许研究人员下载其中索引的文章的元数据。

元数据是指用于发现、使用和理解数据所需的信息。在您的研究背景下,它描述了数据的谁、什么、何时、何地、为什么和如何,并且应该提供足够的信息,以使用户知道可以做什么和不能做什么…

Leave a Reply

Your email address will not be published. Required fields are marked *