这项人工智能研究介绍了AstroLLaMA：一种从LLaMA-2微调的70亿参数模型，使用了来自ArXiv的30万多个天文学摘要

这项人工智能研究介绍了AstroLLaMA：一种从LLaMA-2微调的70亿参数模型，使用了来自ArXiv的30万多个天文学摘要四海第1张

大型语言模型（LLM）的出现引起了许多领域的关注，因为几个重要因素同时出现。这些因素包括可获得的大量数据、计算机性能的提升以及神经网络设计的突破。像GPT-4、PaLM和LLaMA这样的著名模型表明，它们能够非常好地完成许多不同的任务。这些任务通常使用的方法包括给它们提示、微调它们的能力以及从人类那里获得反馈来帮助它们学习和改进。天文学学科既是一个独特的挑战，也是LLMs应用的肥沃土壤。

这项人工智能研究介绍了AstroLLaMA：一种从LLaMA-2微调的70亿参数模型，使用了来自ArXiv的30万多个天文学摘要四海第3张

在上面的图片中，我们可以注意到每个模型都以相同的短文本片段为提示，在各自的框中进行了突出显示。GPT-4往往产生更加通用的陈述，缺乏领域特定的细微差别。AstroLLaMA展示了最强大的完成能力，提供了更相关的概念和更深入的洞察，特别适用于天文学领域，因此在性能上显著优于LLaMA-2和GPT-4。

然而，AstroLLaMA确实存在一些需要认识到的局限性。一个重要的局限性是模型在天文学特定领域的知识缺乏，AstroLLaMA从Gaia-ESO数据中估计潜在星体候选者的能力明显不准确。为了解决这些问题，研究人员目前正在努力增强AstroLLaMA的训练数据集。研究人员计划不仅使用摘要，还将纳入现有天文学文章的完整LaTeX源代码。这样的扩展将大大增加模型能够学习的令牌数量。

AstroLLaMA是专门为天文学设计的令人印象深刻的大型语言模型（LLM）的原型。它展示了非凡的上下文感知能力，即使它的参数大大少于GPT-4，也能胜过GPT-4。这一进展不仅为回答问题、总结科学内容和生成假设等各种任务的性能提供了机会，而且对于多模型模型也具有重要意义。