点燃认知燃烧：融合认知架构和LLMs构建下一代计算机

点燃认知燃烧：融合认知架构和LLMs构建下一代计算机四海第1张

“一个系统从来不是部分的总和，而是它们相互作用的产物” – Russell Ackoff。

我们往往专注于最新的设备和算法，然而仅靠技术本身无法推动现实世界的变革。真正的进步取决于将技术整合到解决方案中的系统。单个工具只是达到目的的手段，而系统本身就是目的。

让我们以这个例子为例。人类几个世纪以来一直利用燃烧的力量，但并没有完全发挥其潜力。我们点燃火焰，拿着火把，居住在偏远的地方。但是要提取其潜力，就需要设计一种复杂的舞蹈 – 内燃机，以产生旋转曲柄和驱动活塞的爆炸。尽管发动机部件取得了巨大的进步，但这种概念设计仍然存在，因为它产生的结果远远超出了单个部件的能力。

同样，在计算领域，进步很大程度上归功于系统思维。1945年，数学家冯·诺伊曼将存储器、输入、输出、控制和处理集成到一个解决计算问题的综合架构中。这个系统 – 不是任何一个组件 – 催生了现代计算。78年后，虽然技术有很大不同，但冯·诺伊曼的原则基本保持不变。如今的计算机比1940年代的祖先更加强大，因为体系结构而不仅仅是组件本身塑造了如何解决现实世界的问题。

我们正处在另一次重新思考的边缘，这一次是由语言模型的崛起驱动的。但在进入这个话题之前，让我们看看我们正在使用的技术。

符号和子符号

对于我们大多数人来说，技术意味着基于代码、数字和语言等符号的逻辑、可解释的系统。我们给计算机明确的符号指令，它们按照我们的指令确定性地产生预期的输出。这些基于规则的系统是杂乱、非结构化的子符号系统的阴阳对立。

类似于神经网络的子符号系统模仿生物神经元的分布式、并行性质。它们通过个体节点的不协调活动产生答案，就像蚂蚁按照简单的模式产生群落一样。虽然符号系统是由人类逻辑构建的，但子符号系统能够自主地识别模式并进行模糊的关联。与符号透明的过程相比，它们的结果似乎是神奇但不透明的。

然而，就像阴阳符号一样，我们的思维将这两种模式统一起来。我们的符号能力使我们能够制定和遵循规则，建立逻辑论证，并通过语言进行清晰的交流。我们的子符号能力能够识别面孔、感知情绪，并在混乱的物理世界中流畅移动。

方块钉子。圆孔。

我们受到了一个不守规矩的陌生人的挑战 – 大型语言模型（LLM）。我们要求我们的技术在逻辑上表现并产生一致的结果，然而LLM以概率思考，看到我们看到死胡同的可能性。我们将它们的创造力视为幻觉，通过符号思维的方形镜头进行评判。但未来需要一个引擎，能够点燃符号和子符号的认知燃烧，利用它们的能量推动我们达到新的计算高度。

好消息是科学家们已经在这方面进行了一段时间的研究。谁不想破解让机器像人类一样行动的密码？

认知架构

自1950年代以来，研究人员一直致力于“认知架构” – 能够广泛推理、获得洞察力、适应变化甚至反思自己思考的系统。

经过几十年的研究，认知架构已经发展到了300多个提案。在他们的综述中，科斯特鲁巴和Tsotsos分析了84个架构，并将它们组织成了一个分类系统。他们发现，架构从受生物启发的神经网络到刚性的符号规则系统，中间还有许多混合系统。

认知的通用模型

幸运的是，我们不必分析所有这些模型。在2017年，John Laird和他的同事提出了一个“心智标准模型”，为讨论这些架构提供了一个共同的框架。他们的模型综合了三个开创性架构的关键概念：

ACT-R，由John Anderson自1976年以来开发，通过交互的程序性和声明性记忆来建模认知。程序性记忆编码了技能和例程，而声明性记忆存储了事实。通过遵循程序来访问和应用声明性知识，ACT-R演示了“知道什么”和“知道如何”之间的相互作用如何实现智能行为。
Soar，由John Laird在1980年代创建，提供了一个统一的基于规则的系统，涵盖了感知、学习、规划、解决问题和决策。 “Productions”代表以条件-动作规则形式表示的知识，作用于工作内存。Soar通过动态地遵循productions来模拟心智的灵活、目标导向的能力。
Sigma，由Polk和Newell于1988年构想，将心智视为一种异步的行为社会。心智模块传递消息，触发其他行为，直到欲望得到满足或放弃。这种“行为生成和管理”循环产生复杂、适应性的行为。

点燃认知燃烧：融合认知架构和LLMs构建下一代计算机四海第4张

心智的标准模型包括三个交互式记忆系统：

声明性记忆是我们的知识库，存储我们可以有意识地声明的事实和概念。它保留像你最喜欢的颜色、历史事件、交通标志或词汇等信息。声明性记忆为思维提供了原始材料，其他系统依赖它。

程序性记忆编码了技能和例程，即“如何做”知识，使行为成为可能。它使我们能够骑自行车、系鞋带或演奏乐器。程序性记忆将知识转化为行动。

工作内存是我们的心智工作空间，临时保留和操作信息，以实现规划、问题解决和决策。在解决数学问题时，工作内存保存数字、运算符和中间步骤，直到找到解决方案。它整合了从声明性和程序性记忆中访问和应用知识。

在这个模型中，没有控制器；相反，它由“认知循环”驱动。就像计算机中的时钟周期一样，这个“认知循环”通过执行程序来驱动系统的运行，以实现目标。

例如，驾驶汽车需要：

交通标志、控制和路线的声明性知识
驾驶的程序性技能
工作内存来监视条件并在当下做出反应

将语言模型整合到心智的标准模型中

标准模型在当前语言模型繁荣之前就明确了关键能力。虽然现在还为时过早，但今天的代理框架（AutoGPT、BabyAGI等）已经创造了一些这些能力。

这些框架不再使用独立的记忆模块，而是通过向量搜索访问外部知识源。感知和运动模块以API调用和插件的形式实现。语言模型的上下文窗口成为临时的工作内存。

一个重要的差距仍然存在：强大的学习能力。现在的系统缺乏一种从经验中持续积累知识和技能的机制。它们依赖于提示和模型调优。下一个突破将是整合一种能够通过相互作用持续学习、在实践中积累知识和技能的机制，就像人类思维一样！

进步的新配方？打造认知架构

今天我们拥有了新的成分——语言模型、向量搜索、API等，以及来自认知架构的旧配方。目前尚不清楚是否可以将它们搅拌成一个具有超越任何单一部分能力的新系统。历史上有一些经久不衰的配方，比如冯·诺伊曼的计算框架或内燃机。但对于每一种有远见的配方，都有许多失败的混合物。

有一件事是清楚的。当我们找到这个新的“认知引擎”时，它将比以往任何技术更深刻地推动进步。