Press "Enter" to skip to content

您自己的个人ChatGPT

Published September 15, 2023 by 四海吧

如何使用您的自定义数据对OpenAI的GPT-3.5 Turbo模型进行微调以执行新任务

“一个可爱的机器人在艺术课上的极简主义绘画”，Midjourney图像，作者编辑 — “一个可爱的机器人在艺术课上的极简主义绘画”，Midjourney图像，作者编辑

当我收到OpenAI的电子邮件宣布可以对ChatGPT进行微调时，我感到非常兴奋。这个更新是为了响应开发人员和企业的要求，以便更好地根据他们的特定需求定制模型。通过利用这种微调，现在可以提高可操纵性，实现更一致的输出格式，并建立所需的自定义语气。另一个值得注意的方面是，用户可以发送较短的提示而不会明显降低性能。

这是OpenAI在他们的开发博客[1]上的说法。

这个更新使开发人员能够定制适用于他们用例的模型，并以大规模运行这些定制模型。早期测试表明，经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与甚至胜过基本的GPT-4级能力。与我们的所有API一样，通过微调API发送和接收的数据由客户拥有，并且不会被OpenAI或任何其他组织用于训练其他模型。 —— Andrew Peng等人，OpenAI

在本文中，我将演示如何将我的VoAGI文章中的文本用作训练和测试数据，以自动将纯文本转换为Markdown格式。在我描述实验之前，我将向您介绍一下ChatGPT的背景。

背景

ChatGPT是在2022年11月推出的AI模型[2]。这是OpenAI发布的第一个公共聊天机器人，我在VoAGI上多次写过相关文章。该模型的工作效果与一般的聊天机器人一样好，但也有一些限制。例如，它的训练截止日期是2021年9月，所以它没有直接了解此后的任何新信息。使用浏览器插件来获取和增加模型的数据是可能的，但目前这种方法速度慢且繁琐。

向ChatGPT注入新信息和技能的更好方法是使用OpenAI的微调API。通过API对ChatGPT进行微调可以获得比常规提示更好的结果。它可以训练比提示能处理的更多的示例，导致更短的提示以节省标记，并且可以更快地产生结果…

Published in 四海

Leave a Reply

Web Analytics