通过自我纠正方法增强大型语言模型（LLMs）

“`html
通过自我纠正方法增强大型语言模型（LLMs）四海第1张通过自我纠正方法增强大型语言模型（LLMs）四海第2张

近年来，大型语言模型（LLMs）在各种自然语言处理（NLP）、自然语言理解（NLU）和自然语言生成（NLG）任务中取得了惊人的成果。这些成功一直在各种基准测试中有所记录，并展示了在语言理解方面令人印象深刻的能力。从推理到突出不良和不一致的行为，LLMs已经取得了长足的进步。尽管LLMs已经取得了巨大的进步，但仍然存在一些不利和不一致的行为，这些行为削弱了它们的实用性，例如创建虚假但可信的材料、使用错误的逻辑以及创建有毒或有害的输出。

克服这些限制的一个可能方法是自我校正的思想，即鼓励或引导LLM修复其自身生成的信息中的问题。最近，使用自动化反馈机制的方法，无论是来自LLM本身还是其他系统，都引起了很大的兴趣。通过降低对大量人类反馈的依赖，这些技术有潜力提高基于LLM的解决方案的可行性和实用性。

通过自我校正的方法，模型通过自动生成的反馈信号进行迭代学习，了解其行为的影响，并根据需要改变其行为。自动化反馈可以来自各种来源，包括LLM本身、独立的反馈模型、外部工具以及维基百科或互联网等外部信息源。为了通过自动反馈来纠正LLMs，已经开发了一些技术，包括自我训练、生成-排序、反馈引导解码和迭代事后修订。这些方法在推理、代码生成和毒素检测等各种任务中取得了成功。

加利福尼亚大学圣塔芭芭拉分校的最新研究论文专注于对这一新兴方法群进行全面分析。该团队对许多使用这些策略的当代研究项目进行了深入研究和分类。校正训练时间、生成时间校正和事后校正是已经研究过的自我校正技术的三个主要类别。通过在模型的训练阶段接触输入，已经提高了校正训练时间中的模型。

该团队强调了这些自我校正技术取得成功的各种情景。这些程序涵盖了广泛的主题，如推理、代码生成和毒性检测。该论文通过提供对这些技术的广泛影响的洞察，突出了这些策略的实际意义和在各种环境中的应用潜力。

该团队分享了生成时间校正的内容，即在内容生成过程中根据实时反馈信号对输出进行精炼。事后校正涉及使用后续反馈对已经生成的内容进行修订，因此，这种分类有助于理解这些技术运作和改善LLM行为的微妙方式。随着自我校正程序领域的发展，存在改进和增长的机会，通过解决这些问题和改进这些方法，该领域可能会更进一步，从而导致LLMs及其在现实世界中的应用更加一致的行为。

“`