机器应该使用GenAI以英语进行交谈吗？

在《星际迷航：下一代》播出期间的许多场景中，机器人助理Data中尉利用口头英语与飞船计算机进行沟通。

当然，编剧希望我们，观众，能听到他们的对话。但是，两个基于人工智能的系统是否会通过英语（或任何其他自然的、即“人类”的语言）进行交流而合理呢？

现在，生成式人工智能已经发展起来，这个问题不再属于科幻领域。

自分布式计算诞生以来，我们一直在努力解决机器对机器（M2M）交互的问题。教会我们的机器用英语对话能否解决应用和数据集成中仍然困扰人的挑战？

我们从API中需要什么？

应用程序编程接口（API）已成为M2M通信的标准方法。只要交互的两端对这些交互的上下文有清楚的认知，创建和使用API就很简单。

在其他情况下，语义模糊、需求不明确或不断变化，以及后端系统能力的变化都可能导致基于API的交互出现问题。

多年来，许多技术和协议已经发展出来解决这些挑战。其中一个较新的技术，GraphQL，允许任何请求指定所需的信息，将生成所需信息的任务留给提供者。

GraphQL正在逐渐得到应用，但请求程序如果能利用生成式人工智能创建一个英语请求，并期望信息的提供者利用生成式人工智能解释请求并作出相应回应，是否更好、更快？

这种方法最明显的问题是生成式人工智能的精确性不足。总体而言，人工智能很少是精确的；很多情况下，期望其成功率达到95%就已经是最好的结果。

利用生成式人工智能进行M2M交互将受到这个限制的影响，同时还要面对解释交互意图的其他挑战。毕竟，口头英语永远不如RESTful交互或SQL查询那么精确。

然而，这种交互在精确性方面的不足会得到在显著性方面的弥补。

显著性是人类对与手头任务更突出或更相关的信息进行关注的倾向。当某个查询返回大量数据时，人们往往难以理清其中的意义，辨别哪些数据是重要的，哪些是不重要的。换句话说，传统的数据查询方法在显著性方面存在问题。

然而，如果查询应用使用生成式人工智能，那么显著性就内置在其基于大型语言模型（LLM）的底层。基于其性质，LLM寻找更匹配手头任务的语言模式，因此即使数据量大、数据模棱两可或者数据质量不完美，也能提供显著的结果。

除了改善显著性之外，使用生成式人工智能实现M2M集成还有其他几个潜在的好处：

查询更有可能符合用户意图。 使用传统查询时，相关系统只会按照指令执行。查询是否符合用户意图对交互不起作用。

相比之下，生成式人工智能将其行为与英语用户提示相对应。其结果更有可能符合提示的原始意图。

隐含的偏见更有可能抵消。 因为基于生成式人工智能的M2M交互涉及两个独立的人工智能（请求者和提供者），一个人工智能驱动的数据集中的任何偏见可能会抵消（或至少减轻）另一个的偏见。

例如，如果源数据包含有倾向于偏向白人男性的偏见招聘信息，但查询提示要求平衡种族和性别的简历，则最终结果可能比传统查询更少保留原始的偏见。

交互是可读的，因此可以解释。 只要用户对结果满意，他们不太可能关心M2M交互中的数据。如果结果很差，或者有理由检查这样的交互（例如作为审计的一部分），那么M2M交互使用英语有助于调试并提供任何人都能理解的审计跟踪。

加入操作将更直观和准确。将来自多个来源的数据进行组合可能是数据集成中最困难的部分，特别是当数据源有语义差异时。

GenAI可以消除这些差异，并根据表达人类意图的英语语言提示构建更符合的查询。

对话交互更直接。在许多情况下，一次查询是不够的。所需的互动需要在终端之间进行多次来回，后续查询依赖于先前查询的结果。

通过GenAI，这样的互动只是简单的对话 – 两个AI交替生成彼此的回应。这样的对话更有可能揭示所需的信息，甚至可能比传统的M2M交互更快。

更好地支持自主代理。在典型的M2M交互中，除非人类采取行动生成查询，否则不会发生任何事情。不需要前任人类请求而主动采取行动的软件组件（自主代理）不在此类M2M交互范围之内。

与之相反，通过GenAI存在一种从响应人类查询到自主操作之间的连续性。即使在自主场景中，仍然需要人类启动过程。随着AI变得更加复杂（以及我们对其的信任增长），它更有可能在更多情况下自主行动。

然而，需要注意的是，在这些场景中，我们并不期望AI是完美的 – 尤其是在技术仍在发展阶段时。GenAI会产生显著的结果吗？它会根据人类意图采取行动吗？也许会，也许不会。

如果您一直在关注我关于GenAI的文章 – 尤其是那篇我称之为胡扯的文章，您会知道我是持怀疑态度的。然而，这篇文章探讨了这项技术的潜在能力，超越了今天大多数讨论的范围。是什么原因呢？

答案是M2M交互在人类与其互动时很大程度上避免了GenAI面临的胡扯问题。

鉴于人类对于理解的倾向，当人们与GenAI互动时，他们会赋予它同理心、智能和其他其实它并没有的人类特征。

与之相反，对于M2M交互，我们并不关心那些特征。我们所关心的是AI多么好地代表用户意图以及它如何提供显著的回应。

换句话说，与写简历、提供治疗和其他人们认为它适用的胡扯应用相比，M2M交互可能更适合GenAI的使用案例。