Press "Enter" to skip to content

这篇来自斯坦福大学和谷歌的AI论文介绍了生成代理:交互式计算代理模拟人类行为

这篇来自斯坦福大学和谷歌的AI论文介绍了生成代理:交互式计算代理模拟人类行为 四海 第1张这篇来自斯坦福大学和谷歌的AI论文介绍了生成代理:交互式计算代理模拟人类行为 四海 第2张

毫无疑问,AI机器人能够生成高质量和流畅的自然语言。长期以来,研究人员和从业者一直在思考构建一个充满具有人类行为的代理人的沙盒文明,以了解不同类型的互动、人际关系、社会理论等。可靠的人类行为替身可能会推动各种交互应用的发展,从虚拟现实到社交技能培训到原型程序。研究人员从斯坦福大学和谷歌研究中提出了一种利用生成模型模仿类人个体和紧急集体行为以响应其身份、变化经验和环境的代理人。

该小组的主要贡献可总结如下:

  • 行为是合理的,因为它在代理人不断演化的经验和环境条件下进行动态调节,被称为生成代理人。
  • 为实现生成代理人在快速变化的条件下具备长期记忆、检索、反思、社交互动和场景规划的能力而提出了革命性的框架。
  • 使用两种类型的测试(控制试验和端到端测试)来确定架构的不同部分的价值,并发现类似故障记忆检索等问题。
  • 讨论了应用生成代理人的交互系统对社会和伦理学带来的优势和潜在危险。

该小组的目标是创建一个虚拟开放世界框架,在这个框架中,智能代理人以自然语言安排日程、交换信息、建立友谊,并根据环境和历史线索协调团体活动。通过将大型语言模型(LLM)与基于LLM输出合成和提取数据的机制相结合,团队创建了一种新颖的代理人架构,使代理人能够从过去的错误中学习,并在保持长期角色连贯性的同时进行更精确的实时推理。

复杂行为可以通过代理人对录音进行递归合成来进行引导。代理人的内存流是一个数据库,包含代理人先前经历的完整记录。为了适应不断变化的环境,代理人可以从其内存流中获取相关数据,处理这些知识,并制定行动计划。

研究人员招募了人类评分员,并让他们建议的25个生成代理人在使用Phaser在线游戏开发框架开发的Smallville沙盒环境中作为非玩家角色(NPCs)运行。实验的标志是代理人对角色的一致表现以及对类人记忆、计划、反应和反思的令人信服的模仿。他们在两个完整的游戏日内用自然语言相互交流。

应用

  • 通过将生成代理人与多模型相结合,有朝一日可以拥有能够在线和离线与人类互动的社交机器人。因此,现在可以原型化社会系统和想法,测试新的交互体验,并构建越来越逼真的人类行为模型。
  • 人本设计过程是另一个可以使用GOMS和Keystroke Level Model等认知模型的领域。
  • 使用生成代理人作为用户替身可以更多了解他们的需求和偏好,从而实现更个性化和高效的技术交互。

通过在角色扮演、社交原型、沉浸式环境和游戏中使用,这项研究有助于推动基于LLM的由动态和交互人类行为的代理人构成的模拟系统的发展。在进一步的研究中,可以进一步发展本文中建议的生成代理人架构的组成部分。例如,可以调整检索功能中包含的相关性、新近性和重要性函数,以提高检索模块在特定上下文中找到最相关材料的能力。还可以采取措施提高架构的性能,节省成本。

未来的研究应该通过更长时间的观察生成代理人的行为,以全面了解它们的能力和限制,因为本研究对其行为的评估仅限于非常短的时间线。

Leave a Reply

Your email address will not be published. Required fields are marked *