“构建更好的模型始于重新审视指标”

南加州大学（USC）的研究人员强调了衡量生成式人工智能（AI）模型性能的重要性，以便改进它们。

研究人员表示，使用“精确度”和“召回率”作为度量生成模型质量和多样性的指标存在缺陷。

他们说，这意味着为了构建一个“更好”的生成模型，必须重新审视用于评估性能的指标。

南加州大学计算机科学家Mahyar Khayatkhoei说：“当这些度量存在缺陷时，这意味着所有这些决策也可能存在缺陷。

“我们创建了实验来证明这个问题存在，并且我们在某些假设下数学上证明它实际上是一个非常普遍的问题。然后根据数学分析的洞察，我们创建了一个修改版的计算这些指标的方法来缓解这个问题。”来自南加州大学威特比工程学院查看完整文章