深入了解ChatGPT的背景进程,了解其运作方式并找到关于人工智能的问题的答案。
我们都知道ChatGPT是一个用户友好的AI聊天机器人,它回答我们的问题并满足我们的指令,给我们提供人类般的输出。但是你们中有多少人实际上知道ChatGPT是如何工作的呢?你们中有多少人熟悉生成回复的过程?你们中可能有些人知道,但我敢打赌还有很多人不知道。
关于ChatGPT有很多问题。在阅读了很多资料并对其进行了解之后,我发现一些关于ChatGPT的常见问题的答案隐藏在其内部工作方法中。通过了解ChatGPT如何处理数据以及如何生成回复,你可以找到自己一直对人工智能提出的问题的答案。
内部工作原理
网络数据训练
ChatGPT使用来自全球各地的数据进行训练。这些数据来自于网络上发布的所有书籍、文章、网站、文本文件、博客、评论等等。基本上,所有公开可用的文本数据。
所有这些数据被用来“教育”模型,使其对世界有一个普遍的了解。通过处理和分析这些数据,它学习语言结构、语法规则、关系、表达方式、模式以及各种有助于生成更高质量回复的内容。
它并不直接使用这些数据来生成回复。当然,它会使用这些数据来呈现事实并回答问题,但这不是它的主要目标。这些数据的目的是训练ChatGPT,使其理解一些事情,并为其提供一点“起始知识”,以便它能够理解和帮助我们。要真正生成回复,ChatGPT使用另一种技术…
句子补全
这就是ChatGPT生成回复的方式。句子补全或聊天补全是它用来创建和生成输出的技术。在分析用户的输入之后,ChatGPT预测接下来句子中应该出现的单词。
我们在手机上发送消息时都有类似的功能。我指的是自动建议。但这并不完全相同。这里,算法更加先进和优化。它可以预测单词、句子,甚至整段文字。
这种“预测”是一系列复杂的数学计算。它运用从训练中学到的技能(上下文、语法、模式、关系)来评估可能出现的单词的不同概率和情况。在进行这些计算之后,模型会得出一些最佳结果中的一个,然后生成回复。
人类训练
句子补全技术并不足以覆盖用户可能输入的所有可能情况。如果用户输入了类似这样的内容:“什么是工程学?”,那么句子补全模型应该能够胜任,但如果用户输入了这样的内容:“向我解释工程学如何工作。”,就是另外一回事了。
这就是为什么ChatGPT还有另一个技巧:人类对话训练。你可能知道,你作为用户与ChatGPT的对话会被保存下来作为反馈,模型会从中学习并改进自己。这对他来说非常有帮助,可以在未来的用户对话中表现更好。
但还有一种技术。它被称为“强化学习”,是一种人工智能训练师根据ChatGPT生成的回复进行排名和评估以提高其性能的场景。假设模型对相同的输入提供了4个不同的回复。那么,人工智能训练师将根据特定的评分标准(从1到10,简化起见)对这4个回复进行评分,并将评分加载到AI中。
常见问题的答案
为什么ChatGPT在英文输入方面表现更好?
ChatGPT精通多种语言,这使得那些只会一种语言且难以学习其他语言的人来说更容易使用。但是,当输入是英文时,ChatGPT的回答质量通常会更好。
这是因为它训练所使用的数据来自于网络,就像我之前提到的那样。而在网络上最常用的语言是什么?没错,就是英文。相比其他语言,英文有更多的文章、文本文件、网页和评论。因此,ChatGPT可以从更多英文资源中学习和提高自己的性能。
但是你有没有注意到我说回答的质量“通常”更好?我之所以这么说是因为这取决于你所寻找的内容。如果你搜索的主题与语言或特定国家相关,那么在其他语言中可能会得到比英文更好的回答。
让我给你解释一下。假设你对西班牙征服美洲的历史感兴趣。由于这个主题与西班牙文化和历史高度相关,使用西班牙文的信息可能比英文更丰富。如果是这样,那么用西班牙文回答会更好。
为什么ChatGPT会犯错?
众所周知,ChatGPT并不完美,有时候会犯错。当我揭示原因时,你会感到惊讶。ChatGPT犯错是我们的责任,是人类的责任,或者更准确地说,是那些在网络上写东西的人的责任。
由于我们众所周知的AI聊天机器人的训练数据是由像你我一样的人类编写的,其中存在有关某些事实和事件的错误和误解。人类是犯错的,机器不会。不幸的是,ChatGPT没有“虚假信息检测器”,它无法验证信息的真实性,但事实就是如此。现在你知道原因了。
但是嘿,当我说是我们的错时,请不要个人化。每个人都会犯错。如果你正在阅读的这篇文章被用于未来的GPT模型的训练,并且其中存在错误,那么由于我的原因,聊天机器人可能会给你提供错误的信息。所以,在你在网络上写东西时,请不要感到不安。顺便说一下,如果真的发生这种情况,我很抱歉😇😅。
为什么ChatGPT的回答一直在变化?
你有没有注意到当你给ChatGPT一个提示,然后再次给他完全相同的提示而不做任何改变时,回答与之前的回答不同?这个机制来自于句子补全模型。
当句子补全模型选择下一步应该是什么单词时,会加入一些随机性。我告诉过你,它会从多个被视为足够好的提议中选择。第一次,它会选择其中一个提议,第二次选择另一个。这样做是为了避免重复性。
ChatGPT如何理解和解释对话中的上下文?
在生成回答之前,ChatGPT通过分析用户先前输入的对话内容来浏览对话。它关注对话历史中的重要部分。这与它训练所使用的网络数据是一样的,但这一次,它直接从对话中学习。
这被称为“注意机制”。这使得聊天机器人能够理解对话的流程,以及用户的意图和参照。它还帮助它优先考虑相关信息,以便给出适当的回答,而不会通过不必要的解释和上下文细节来打扰用户。
结论
通过分析和理解事物的内部运作,我们可以找到很多问题的答案。了解我们每天使用的工具和技术的隐藏过程和算法非常有用。ChatGPT就是其中之一,这就是为什么我写了这篇文章。
希望这篇文章没有太复杂,能够对ChatGPT的功能和运作方式有所理解。现在你知道了这些,把它与那些不知道的人分享,让他们也变得聪明吧。当然,我是开玩笑的。
资源
- AI BOX
- Zapier
- Arvin Ash — Youtube