Press "Enter" to skip to content

您自己的个人ChatGPT

如何使用您的自定义数据对OpenAI的GPT-3.5 Turbo模型进行微调以执行新任务

“一个可爱的机器人在艺术课上的极简主义绘画”,Midjourney图像,作者编辑

当我收到OpenAI的电子邮件宣布可以对ChatGPT进行微调时,我感到非常兴奋。这个更新是为了响应开发人员和企业的要求,以便更好地根据他们的特定需求定制模型。通过利用这种微调,现在可以提高可操纵性,实现更一致的输出格式,并建立所需的自定义语气。另一个值得注意的方面是,用户可以发送较短的提示而不会明显降低性能。

这是OpenAI在他们的开发博客[1]上的说法。

这个更新使开发人员能够定制适用于他们用例的模型,并以大规模运行这些定制模型。早期测试表明,经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与甚至胜过基本的GPT-4级能力。与我们的所有API一样,通过微调API发送和接收的数据由客户拥有,并且不会被OpenAI或任何其他组织用于训练其他模型。 —— Andrew Peng等人,OpenAI

在本文中,我将演示如何将我的VoAGI文章中的文本用作训练和测试数据,以自动将纯文本转换为Markdown格式。在我描述实验之前,我将向您介绍一下ChatGPT的背景。

背景

ChatGPT是在2022年11月推出的AI模型[2]。这是OpenAI发布的第一个公共聊天机器人,我在VoAGI上多次写过相关文章。该模型的工作效果与一般的聊天机器人一样好,但也有一些限制。例如,它的训练截止日期是2021年9月,所以它没有直接了解此后的任何新信息。使用浏览器插件来获取和增加模型的数据是可能的,但目前这种方法速度慢且繁琐。

向ChatGPT注入新信息和技能的更好方法是使用OpenAI的微调API。通过API对ChatGPT进行微调可以获得比常规提示更好的结果。它可以训练比提示能处理的更多的示例,导致更短的提示以节省标记,并且可以更快地产生结果…

Leave a Reply

Your email address will not be published. Required fields are marked *