“Inflection-2超越了Google的PaLM-2 AI语言模型的突破性进展”

在一项具有突破性的宣布中，Inflection AI，即备受欢迎的PI AI个人助理的创建者，揭示了他们的最新成就。一款强大的语言模型名为Inflection-2不仅超过了谷歌强大的PaLM-2，而且在各种基准测试数据集中表现出了优越性。

Inflection-2大型语言模型

经过广泛的研究和开发，Inflection-2在大型语言模型领域树立了新的标准。在与谷歌的PaLM-2和Meta的LLaMA-2进行比较测试后，Inflection-2被评为领先者。值得注意的是，在自然问题（Natural Questions）语料库中，Inflection-2的37.3分数仅仅略逊于PaLM-2的37.5分数，明显优于LLaMA-2。

“Inflection-2超越了Google的PaLM-2 AI语言模型的突破性进展” 四海第1张

MMLU – 大规模多任务语言理解

Inflection AI的MMLU基准测试成绩公开了该模型的优势和不足之处。该数据集覆盖了STEM（科学、技术、工程和数学）以及各种科目的57项任务，目的是评估模型的世界知识和问题解决能力。Inflection-2令人印象深刻的79.6分数使其跻身于顶级表现者之列，表明它在不同领域具有全面的理解能力。

MBPP – 代码和数学推理能力

在MBPP数据集的直接比较中，该数据集侧重于代码和数学推理，Inflection-2展现了意外的高水平。尽管没有专门针对这些任务进行训练，但它以53.0分数超越了针对编码进行微调的PaLM-2S的50.0分数。

HumanEval数据集测试

Inflection-2的成功不仅限于HumanEval问题解决数据集，它以44.5分数超过了PaLM-2。值得注意的是，尽管没有针对这些挑战进行专门训练，但Inflection-2的性能堪比强大的GPT-4。

更强大的LLM即将到来

Inflection AI的宣告暗示着正在制作中的更加强大的语言模型。通过计划在庞大的22,000个GPU集群上进行训练（比Inflection-2的5,000个GPU集群大几倍），Inflection AI有望加剧人工智能领域的竞争。随着Inflection AI等初创公司不断推出强大的AI模型，谷歌和OpenAI等已经建立起来的重要参与者面临着更加激烈的竞争。

还阅读：伊隆·马斯克发布碧色：带有叛逆倾向的时髦AI聊天机器人

我们的看法

Inflection-2作为一款领先的语言模型，在AI能力方面迈出了重要的一步。该模型在任务中的出色表现，尤其是在其训练范围之外的任务中，突显了其适应性和在各种应用中的潜力。随着技术行业见证AI创新的蓬勃发展，PI个人助理等对话式人工智能平台正在不断演变，为用户提供前沿体验。Inflection AI展示出的不懈创新追求将其置于人工智能竞争的前沿，承诺未来的语言模型将重新定义可能性的边界。