南加州大学(USC)的研究人员强调了衡量生成式人工智能(AI)模型性能的重要性,以便改进它们。
研究人员表示,使用“精确度”和“召回率”作为度量生成模型质量和多样性的指标存在缺陷。
他们说,这意味着为了构建一个“更好”的生成模型,必须重新审视用于评估性能的指标。
南加州大学计算机科学家Mahyar Khayatkhoei说:“当这些度量存在缺陷时,这意味着所有这些决策也可能存在缺陷。
“我们创建了实验来证明这个问题存在,并且我们在某些假设下数学上证明它实际上是一个非常普遍的问题。然后根据数学分析的洞察,我们创建了一个修改版的计算这些指标的方法来缓解这个问题。”来自南加州大学威特比工程学院 查看完整文章
摘要版权所有 © 2023 SmithBucklin,华盛顿特区,美国