Press "Enter" to skip to content

卡内基梅隆大学和清华大学的研究人员提出了Prompt2Model:一种从自然语言指令生成可部署的AI模型的通用方法

卡内基梅隆大学和清华大学的研究人员提出了Prompt2Model:一种从自然语言指令生成可部署的AI模型的通用方法 四海 第1张卡内基梅隆大学和清华大学的研究人员提出了Prompt2Model:一种从自然语言指令生成可部署的AI模型的通用方法 四海 第2张

假设您希望构建一个自然语言处理(NLP)模型来解决一个给定的问题。您需要定义任务范围,然后找到或创建能够指定预期系统行为的数据,选择适合的模型架构,训练模型,通过评估来评估其性能,然后将其部署供实际使用。研究人员已经通过一行代码使得原型化这种复杂的NLP模型成为可能!

卡内基梅隆大学和清华大学的研究人员提出了Prompt2Model:一种从自然语言指令生成可部署的AI模型的通用方法 四海 第3张
https://arxiv.org/abs/2308.12261

Prompt2Model是一个系统,它保留了使用简单提示指定系统行为的能力,并同时提供了一个可部署的特殊目的模型,保留了所有其优点。上图展示了我们Prompt2Model的工作架构。它实际上是一个自动化的流水线,从用户提示中提取关于任务的所有必要细节,然后收集和组合与任务相关的信息,并使用以下不同的通道进行部署。

  • 数据集检索:给定一个提示,第一个任务是发现现有的手动注释数据,以支持用户的任务描述。
  • 数据集生成:为了支持各种任务,存在一个数据集生成器,根据Prompt解析器解析的用户特定要求生成合成训练数据。Prompt解析器包含具有上下文学习的LLM,用于分段用户提示,使用OpenAI的gpt-3.5-turbo-0613。
  • 模型检索:使用提供的提示,选择一个预训练的语言模型,该模型具有适合用户目标的知识。这个选择的模型作为学生模型,进一步进行微调和评估,使用生成的和检索到的数据。
  • WebApp:最后,存在一个易于使用的图形用户界面,允许下游用户与训练好的模型进行交互。这个使用Gradio构建的Web应用程序可以轻松地在服务器上公开部署。

总之,Prompt2Model是一个快速构建小而有竞争力的NLP系统的工具。它可以直接用于在几小时内产生优于LLM的任务特定模型,无需手动数据注释或架构。鉴于该模型的可扩展设计,它可以提供一个平台,用于探索模型蒸馏、数据集生成、合成评估、数据集检索和模型检索等新技术。

展望未来,我们可以将Prompt2Model视为促进协作创新的催化剂。通过提出不同的挑战,研究人员旨在在未来在框架的各个组件上促进多样化的实现和改进。

Leave a Reply

Your email address will not be published. Required fields are marked *