Press "Enter" to skip to content

谷歌DeepMind研究人员推出Promptbreeder:一种自我参考和自我改进的人工智能系统,可以在给定领域自动演化有效的专业提示

将此HTML代码翻译为中文(保留HTML代码在结果中):

大型语言模型(LLMs)因其模拟人类特性而引起了很多关注。这些模型能够回答问题、生成内容、总结长文本段落等等。提示对于提高GPT-3.5和GPT-4等LLMs的性能至关重要。创建提示的方式可以对LLMs在推理、多模态处理、工具使用等方面的能力产生重大影响。研究人员设计的这些技术在模型蒸馏和智能体行为模拟等任务中显示出了潜力。

提示的手动工程方法引发了自动化的问题。通过基于数据集的输入-输出实例生成一组提示,Automatic Prompt Engineer (APE)试图解决这个问题,但APE在提示质量方面收益递减。研究人员建议使用一种维持多样性的进化算法,用于自指性自我改进LLMs的提示创建,以克服提示创建收益递减的问题。

LLMs可以改变它们的提示来提高自己的能力,就像神经网络可以改变其权重矩阵来提高性能一样。根据这种比较,LLMs可以被创建出来以增强它们自己的能力和增强它们提升能力的过程,从而使得人工智能能够不断改进。针对这些理念,谷歌DeepMind团队最近的研究中引入了PromptBreeder (PB),这是一种LLMs能够以自指性方式改进自己的技术。

PB需要领域特定的问题描述、一组初始变异提示(用于修改任务提示的指令)和思维风格(以文本形式呈现的通用认知启发式)。通过利用LLM作为变异运算符的能力,它生成不同的任务提示和变异提示。对这些演化出的任务提示在训练集上进行适应度评估,并选择一组包含任务提示及其关联变异提示的进化单元用于后续的演化。

团队表示,PromptBreeder观察到提示在几代中相对于特定领域进行了调整。例如,PB开发了一个明确说明如何解决数学领域中的数学问题的任务提示。在包括常识推理、算术和伦理等各种基准任务中,PB超越了最先进的提示技术。PB不需要参数更新来进行自我指向性自我改进,这表明更广泛、能力更强的LLMs未来可能从这种策略中获益。

PromptBreeder的工作过程可以总结如下:

  1. 任务提示变异:任务提示是为特定任务或领域创建的提示。PromptBreeder从这些提示的种群开始。然后,对任务提示进行变异,产生变体。
  1. 适应度评估:使用训练数据集评估这些修改后的任务提示的适应度。评估衡量LLM对这些变化的响应程度。
  1. 持续演化:类似于生物演化,变异和评估的过程在多个世代中重复。

总之,PromptBreeder被誉为一种独特而成功的技术,用于自主演化LLMs的提示。它试图通过迭代改进任务提示和变异提示来提高LLMs在各种任务和领域中的性能,最终胜过手动提示方法。

Leave a Reply

Your email address will not be published. Required fields are marked *