有效提示工程的通用思维模型。
介绍
在我最近的文章中,我探索了ChatGPT4的一种新的提示工程方法,我将其称为程序模拟。该方法展示了ChatGPT4模拟程序状态的令人印象深刻的能力。这些探索增强了我对语言的微妙力量的认识——词的重量、语义和整体上下文。本文探讨了其中一些细微之处,并提出了一个通用的提示工程框架,我将其称为“上下文支架框架”。正如我们将看到的,该框架具有很好的泛化能力,并且似乎能够将“思维链”、“奉承/角色分配”、“程序模拟”等技术统一起来。此外,它为在多种情景下有效地制定提示提供了一个易于使用的思维模型。
进入语用学的世界
我更仔细地研究语言的细微差别的努力始于语用学,这是语言学的一个分支,研究上下文如何塑造意义解释。其中两个概念特别突出:
- 含意:当说话者在没有明确陈述的情况下暗示某事,希望听者推断出其意图。
- 预设:对话参与者相信说话者和听者共享的假设或信息。
这些概念的核心见解是词语的含义远远超出其字面定义。以“狗”这个词为例。除了其基本定义,它还承载着丰富的隐含信息。我们没有明确陈述狗存在于时间中、在空间中移动、进食、听觉、叫声等等。预期听者在特定上下文中共享这些知识并提取适当的含义。每个语言表达,无论是一个词还是一部小说,都会散发出一种“含义光环”——隐含定义、言外之意、情感和内涵的混合。这些“含义光环”还可能在密度、复杂度和清晰度上有所不同,通常取决于情境。
大型语言模型(LLM)和“含义光环”
在某种意义上,LLMs将与人类的对话中的“含义光环”制度化。但从根本上说,这些模型只是逐字预测。它们是否已经隐含地建模了“含义光环”的相互作用?我们如何衡量?虽然回答这些问题需要深入研究,但我们在语用学中的短暂探索确实提供了一些即时的实际适用性,可以作为构建通用提示工程框架的重要基础。
上下文支架框架(CSF)
正如许多人之前指出的那样,像ChatGPT-4这样的模型的有效提示制作依赖于上下文。但我们还需要考虑对模型输出的期望和模型的“操作”方式,以满足这些期望。在考虑“含义光环”的概念的同时,让我们来看看一种将提示的上下文按类别的方式进行分解的方法。让我们将这些类别称为“支架”,并指定两个广泛适用的支架。
期望上下文支架——包括用户的期望、意图、目标以及当前情况的具体要素。如果用户的个人背景与此相关,也应考虑在内。
操作上下文支架——定义了AI的操作参数。它确定了模型的角色、要使用的技术、所需的外部数据以及其自主权和决策范围。
下面是该框架的直观展示:
现在,让我们通过ChatGPT-4的提示来看一下这种方法的实际应用。我们将重点选择具有语义丰富的“意义光环”并且很可能产生我们所期望的输出的脚手架语言。
脚手架上下文提示
“我的期望上下文 – 你的目标是帮助我写一篇关于人工智能泰迪熊的故事。我的故事观众是成年人。我最终会在我的博客上分享这个故事,而目前我的博客还没有追随者。
你的操作上下文 – 为了最大程度地满足我的期望上下文,你将从对话的这一点开始像一个自组装程序模拟一样行事。你应该尽力考虑我的期望上下文的所有方面。你在程序的功能和行为上具有自主权和自由裁量,但你应该始终保持一个持久的顶级菜单。请不要生成任何软件代码,并在输出文本中模拟程序。一旦收到此提示,请进行模拟。”
您所有会得到略有不同的内容,但大多数情况下应该是这样的:
从输出中您可以看到,ChatGPT-4启动了一个程序模拟,大部分满足了我的“期望上下文”。我通过在这两个脚手架中指定语言,对此产生了重大影响。
到目前为止,我们已经为提示构建定义了一个简单明了的通用框架。技术如奉承/角色分配、少样本学习和共同训练主要属于“操作上下文脚手架”。虽然我无法确定仅根据“期望上下文脚手架”而产生的技术,但大多数目标驱动型提示语言通常适用于这个脚手架。因此,在某种程度上,我们都默认地使用这种技术。
但是就这样结尾了吗?我们是否就此结束文章,还是有一些派生的见解?让我们进一步探讨一下…
优化上下文脚手架以进行提示工程
当与选择的LLM(大型语言模型)交互时,我们的最终希望是模型能够产生满足或超过我们期望的输出。如果我们从优化的角度来看待我们的脚手架,我们可以设想一个框架,其目标是准确定位一个或多个最佳的“操作上下文”,以最好地满足“期望上下文”。对于那些对数学术语感到担忧的人,请耐心等待;这只是一个简短的偏离。
我们可以将这样一个函数表示如下:
O = LLM(EC)
其中:
O是一组最佳操作上下文(OCₙ)
LLM是由大型语言模型代表的函数。
集合O中的每个元素,比如OCᵢ,代表给定期望上下文的不同最佳操作上下文:
O={OC₁,OC₂,…,OCₙ}
由于我们的操作上下文和期望上下文是多维的,我们可能需要以属性向量的更详细方式对它们进行建模:
EC={e₁,e₂,…,eₙ}
OC={o₁,o₂,…,oₙ}
最后,目标函数可以表示为在给定EC的所有可能OCs中最大化效用函数U:
这些数学抽象试图将期望上下文转化为操作上下文的过程系统化,同时承认对于给定的期望上下文,可能存在多个最佳的操作上下文的高概率。我们将在未来探讨使用这种类型框架进行微调模型的可能性,但现在,让我们看一看这些想法的实际影响。
假设您对如何阐述期望上下文脚手架有一定的把握,但对于包括在操作上下文脚手架中的元素感到不确定。ChatGPT-4能援助于此吗?
让我们相应地构建一个提示,看看我们得到了什么回应。
开放式操作上下文提示
“我的期望上下文 – 你的目标是帮助我写一篇关于人工智能泰迪熊的故事。我的故事观众是成年人。我最终会在我的博客上分享这个故事,而目前我的博客还没有追随者。
您的运营背景 – 为了最大限度地满足我的期望背景,请提供至少一个但不超过五个可使用的运营背景。您可以建议扮演一个人、一个团队、一种组织类型、程序或具有一个或多个特定能力的系统。您可以建议包含外部数据或要求提供培训示例。您还可以建议使用特定的技术或方法。您可以建议以上各种元素的任意组合。运营背景应按照最优到最次优的顺序排列。对于每一个,请提供导致其特定排名的理由。
忠于其本质,ChatGPT4为我们提供了5个运营背景;其中2个是组织实体,1个是系统,还有2个是个人。这些运营背景已经经过了排名,并包含了每个排名的理由。请思考像“文学智囊团”或“历史与科幻研究机构”这样的概念的”意义光环”。我相信您会同意它们在上下文中非常丰富且充满意义和暗示。通过这种方法,我们可以拥有各种各样的运营背景,这些背景我们可能自己本不会想到。它降低了有效提示构建的障碍,通过将起点缩小到聚焦于阐述“期望背景支架”。
结论
当我们深入探讨语用学的复杂性和”意义光环”的概念时,很明显,上下文以其多方面的形式,是优化与LLMs的互动的关键。上下文支架框架(CSF)为我们提供了一个简单明了的思维模型,可以帮助我们非常有效地阐述上下文。通过区分”期望”和”运营”背景,CSF为将用户期望与ChatGPT-4等模型的能力对齐提供了一条清晰的路径。此外,CSF具有可扩展性,当其他支架变得相关或必要时,可以根据需要添加或删除。同样,每个支架可以细分为代表给定上下文的不同特征的组成支架。
感谢您的阅读,希望您能够将CSF作为构建提示的有用模型!我正在进行进一步的探索,因此请确保关注我,以便在有新文章发布时收到通知。如果您想进一步讨论CSF或我的其他文章,请随时通过领英与我联系。
除非另有说明,本文中的所有图片均为作者所拍摄。