86 search results for "排行榜"

本周从11月20日至11月26日的重要LLM论文排行榜

Published November 29, 2023 by 四海吧

大型语言模型（LLMs）在近年来取得了快速的进展随着新一代模型的开发，研究人员和工程师保持对最新进展的了解是非常重要的

欢迎来到我们最新的排行榜和模型评估领域的深入探索。在之前的一篇文章中，我们探索了对大型语言模型进行评估的方法。今天，我们将转向一个不同但同样具有挑战性的领域-目标检测。最近，我们发布了我们的目标检测排行榜，根据一些指标对Hub中可用的目标检测模型进行排名。在这篇博客中，我们将演示模型是如何进行评估的，并揭示目标检测中常用的指标，从交并比（IoU）到平均精度（AP）和平均召回率（AR）。更重要的是，我们将重点介绍在评估过程中可能出现的差异和陷阱，确保您具备不仅能理解而且能够批判性评估模型性能的知识。每个开发者和研究人员都希望拥有一个能够准确检测和描绘对象的模型。我们的目标检测排行榜是找到最适合其应用需求的开源模型的正确地方。但在这个背景下，“准确”到底意味着什么？应该相信哪些指标？它们是如何计算的？而且，更关键的是，为什么一些模型在不同的报告中可能呈现出不同的结果？所有这些问题将在本博客中得到回答。因此，让我们一起展开这次探索，揭开目标检测排行榜的秘密！如果您想跳过介绍，直接了解如何计算目标检测指标，请前往指标部分。如果您想了解如何根据目标检测排行榜选择最佳模型，请查看目标检测排行榜部分。目录介绍什么是目标检测指标什么是平均精度，如何计算？什么是平均召回率，如何计算？平均精度和平均召回率的变体有哪些？目标检测排行榜根据指标选择最佳模型的方法哪些参数可能会影响平均精度的结果？结论其他资源什么是目标检测？在计算机视觉领域，目标检测是指在图像中识别和定位各个对象的任务。与图像分类不同，图像分类的任务是确定图像中占主导地位的对象或场景，目标检测不仅对出现的对象类别进行分类，还提供空间信息，绘制出每个检测到的对象的边界框。一个目标检测器还可以对每个检测到的对象输出一个“分数”（或“置信度”）。它表示根据模型预测，检测到的对象属于每个边界框预测类别的概率。例如，下面的图像显示了五个检测结果：一个“球”置信度为98%，以及四个“人”置信度分别为98%、95%、97%和97%。目标检测模型具有各种各样的应用，涵盖各个领域。其中一些用例包括自动驾驶中的视觉、人脸检测、监控和安全、医学成像、增强现实、体育分析、智慧城市、手势识别等。 Hugging Face Hub拥有数百个目标检测模型，它们在不同的数据集上进行了预训练，能够识别和定位各种对象类别。一种特殊类型的目标检测模型称为零样本模型，它可以接收额外的文本查询，以搜索在文本中描述的目标对象。这些模型可以检测到它们在训练期间没有见过的对象，而不仅仅局限于训练时使用的类别集合。检测器的多样性不仅限于它们能识别的输出类别范围。它们在底层架构、模型大小、处理速度和预测准确性等方面都有所不同。…