Press "Enter" to skip to content

遇见FathomNet:一个使用人工智能和机器学习算法的开源图像数据库,以帮助处理视觉数据积压,以理解我们的海洋及其居民

遇见FathomNet:一个使用人工智能和机器学习算法的开源图像数据库,以帮助处理视觉数据积压,以理解我们的海洋及其居民 四海 第1张遇见FathomNet:一个使用人工智能和机器学习算法的开源图像数据库,以帮助处理视觉数据积压,以理解我们的海洋及其居民 四海 第2张

海洋正在以前所未有的速度发生变化,使得在视觉监测大量海洋数据的同时保持负责任的管理变得具有挑战性。由于研究界正在寻求基线,所需数据的数量和速度正在超过我们快速处理和分析它们的能力。数据一致性的缺乏、不充分的格式以及对重要标记数据集的需求,这些都导致了最近机器学习的进展在快速和更复杂的视觉数据分析方面取得的有限成功。

为了满足这一需求,几个研究机构与MBARI合作,利用人工智能和机器学习的能力加速海洋研究。这种合作的一个结果是FathomNet,这是一个开源的图像数据库,利用先进的数据处理算法来标准化和聚合精心策划的标记数据。团队认为,使用人工智能和机器学习将是加速海洋健康关键研究并消除处理水下图像的瓶颈的唯一途径。关于这个新图像数据库背后的开发过程的详细信息可以在《Scientific Reports》杂志的最近一篇研究论文中找到。

机器学习在历史上在自动化视觉分析领域产生了转变,部分原因在于大量的注释数据。对于陆地应用来说,机器学习和计算机视觉研究人员争相使用的基准数据集是ImageNet和Microsoft COCO。为了给研究人员提供一个丰富、引人入胜的水下视觉分析标准,团队创建了FathomNet。为了建立一个自由可访问、高度维护的水下图像训练资源,FathomNet结合了来自许多不同来源的图像和记录。

MBARI的视频实验室的研究人员精心注释了近28,000小时的深海视频和超过1百万张MBARI在35年间收集到的深海照片。MBARI的视频库中有约820万个关于动物、生态系统和物体观察的注释。探险技术实验室从各种海洋栖息地和所有海洋盆地的各个地方收集了超过1,000小时的视频数据。这些录像还被CVision AI开发的基于云的协作分析平台使用,并由夏威夷大学和OceansTurn的专家进行了注释。

此外,2010年,美国国家海洋和大气管理局(NOAA)海洋探索团队在NOAA Okeanos Explorer船上使用双重远程操作车系统收集了视频数据。为了更广泛地注释收集到的视频,他们从2015年开始资助专业分类学家。最初,他们通过志愿参与的科学家众包注释。MBARI的一部分数据集,以及国家地理和NOAA的材料都包含在FathomNet中。

由于FathomNet是开源的,其他机构可以随时为其做出贡献,并将其用作处理和分析视觉数据的更耗时和资源消耗大的传统方法的替代品。此外,MBARI启动了一个试点计划,使用从FathomNet训练的机器学习模型分析由远程控制水下车辆(ROVs)拍摄的视频。使用AI算法使标记速度提高了十倍,同时减少了人力成本81%。基于FathomNet数据的机器学习算法可能会改变海洋探索和监测领域。其中一个例子包括使用配备摄像头和增强的机器学习算法的机器人车辆自动搜索和监测海洋生物和其他水下物体。

通过不断的贡献,FathomNet目前拥有84,454张图像,反映了来自81个不同收藏的175,875个定位,涉及2,243个概念。在各种位置和成像设置中,该数据集将很快获得超过2亿次观察,为超过20万种动物物种获得1,000次独立观察。四年前,由于缺乏注释照片,机器学习无法检查数千小时的海洋电影。通过解锁发现和提供工具,探险家、科学家和普通公众可以利用这些工具加快海洋研究的步伐,FathomNet将这一愿景变为现实。

FathomNet是协作和社区科学如何促进我们对海洋的认识的巨大例证。团队认为,该数据集可以在理解海洋变得比以往任何时候都更重要的情况下加速海洋研究,以MBARI和其他合作伙伴的数据为基础。研究人员还强调他们希望FathomNet成为一个社区,在这个社区中,来自各个领域的海洋爱好者和探险家可以分享他们的知识和技能。这将成为解决海洋视觉数据问题的跳板,否则这是不可能没有广泛参与的。为了加快视觉数据的处理并创建一个可持续和健康的海洋,FathomNet不断改进,包括来自社区的更多标记数据。

这篇文章是由Marktechpost工作人员撰写的研究摘要,基于研究论文《FathomNet:一个用于在海洋中实现人工智能的全球图像数据库》。这项研究的所有功劳归功于该项目的研究人员。请查看论文、工具和参考文章。此外,别忘了加入我们的26k+ ML SubRedditDiscord频道电子邮件通讯,我们会分享最新的人工智能研究新闻、酷炫的人工智能项目等等。

这篇文章介绍了FathomNet:一个开源的图像数据库,利用人工智能和机器学习算法来帮助处理我们的海洋和其生物居民的视觉数据积压问题。

本文首发于MarkTechPost。

Leave a Reply

Your email address will not be published. Required fields are marked *