Press "Enter" to skip to content

见面 MetaGPT:将GPT转化为工程师、建筑师和经理的开源AI框架

见面 MetaGPT:将GPT转化为工程师、建筑师和经理的开源AI框架 四海 第1张见面 MetaGPT:将GPT转化为工程师、建筑师和经理的开源AI框架 四海 第2张

基于大型语言模型(LLMs)的多agent系统具有模拟和改进人类操作的特殊机会。然而,最近的研究表明,当前系统在现实应用中的复杂性中有时需要更准确。这些系统主要需要通过口头和基于工具的交流来促进建设性的协作,这在生成连贯的交流、减少反生产性的反馈循环和促进有益的协作交互方面存在困难。对于多方面的过程来说,有良好结构化的标准化操作程序(SOPs)是必要的。对现实世界实践的全面认识和整合至关重要。

解决这些常见限制并将这些见解纳入LLM-based多agent系统的设计和结构以提高其效力和应用至关重要。此外,通过广泛的集体实践,人们在各个领域已经建立了广泛认可的SOPs。这些SOPs对于促进有效的工作拆分和协调至关重要。例如,软件工程中的瀑布流程为需求分析、系统设计、编码、测试和可交付物建立了逻辑步骤。

借助这种共识工作流程,几个工程师可以有效地合作。此外,人类职位具有适合其工作的专业知识:软件工程师利用其编程技能来创建代码,而产品经理利用市场研究来确定客户需求。协作偏离了典型的输出,并变得杂乱无章。例如,产品经理必须进行全面的竞争研究,对用户需求、市场趋势和竞争产品进行研究以推动开发。这些分析必须紧接着创建具有清晰的、标准化格式和优先目标的产品需求文档(PRDs)。

这些规范性的工件对于推进复杂的、多样化的项目,需要各种角色的相关贡献,是必不可少的。它们凝聚了共同的理解。因此,使用组织良好的文档、报告和显示依赖关系的图形是至关重要的。在这项研究中,来自DeepWisdom、厦门大学、香港中文大学深圳分校、南京大学、宾夕法尼亚大学和加州大学伯克利分校的研究人员介绍了MetaGPT,这是一个具有基于SOPs的实用知识的开创性多agent框架。首先,他们使用描述其职责的职位名称来标识每个agent。这使得系统能够以正确的角色特定提示前缀初始化。这样,不再需要笨拙的角色扮演线索,而是将领域知识融入到agent定义中。其次,他们审查有效的人类过程,提取用于群体项目所需的SOPs的过程知识。

这些SOPs在agent架构中使用基于角色的操作规范进行编码。第三,为了促进信息交流,agent创建标准化的操作输出。MetaGPT通过形式化人类专家交流的工件,简化了相互依赖的工作之间的协调。agent通过共享环境相连接,这个环境提供有关活动和工具资源的洞察力。所有agent之间的通信都包含在这个环境中。它们还提供了一个全局内存池,存储所有合作记录,允许任何agent订阅或搜索所需的数据。agent可以从这个内存池中检索以获取更多上下文。

与通过对话被动吸收信息相反,这种架构使agent能够主动观察和提取相关信息。这个环境模拟了鼓励团队合作的实际工作场所中的系统。他们展示了协作式软件开发工作流程和相关的代码实现实验,涵盖了小游戏的开发和更复杂的大系统的生产,以说明他们的架构的效力。MetaGPT管理的软件复杂性远远超过GPT-3.5或其他开源框架如AutoGPT和AgentVerse,以产生的代码行数来衡量。

此外,MetaGPT通过自动化的端到端过程生成高质量的需求文档、设计工件、流程图和接口规范。这些中间标准化的输出极大地增加了最终代码执行的成功率。借助自动生成的文档,人类开发者可以迅速学习和提高他们的专业知识,以进一步改进他们的需求、设计和代码。它还实现了更复杂的人工智能与人类的互动。总之,他们通过对不同软件项目进行广泛的研究来验证MetaGPT。

通过定量的代码生成基准和整体过程输出的定性评估,展示了MetaGPT基于角色的专家agent合作范式所带来的可能性。总结起来,他们主要做出了以下贡献:

• 设计了一种新的元编程机制,包括角色定义、任务分解、流程标准化和其他技术设计。

• 他们提出了MetaGPT,这是一种基于LLM的多代理协作框架,将人类的标准操作规程编码到LLM代理中,从根本上扩展了复杂问题解决的能力。

• 他们使用AutoGPT、AgentVerse、LangChain和MetaGPT对开发CRUD2代码、基本数据分析任务和Python游戏进行了广泛的测试。

通过采用标准操作规程,MetaGPT可以创建复杂的软件。总体研究结果表明,MetaGPT在代码质量和符合预期流程方面显著优于竞争对手。

Leave a Reply

Your email address will not be published. Required fields are marked *