Press "Enter" to skip to content

向量数据库:是什么以及为什么如此受瞩目?

选择矢量数据库解决方案时需要考虑的多个权衡的概述

İsmail Enes Ayhan在Unsplash上的照片

在过去几个月中,矢量数据库引起了很多关注,有超过10家公司提供了某种类型的矢量数据库架构。为什么会存在这么多类型?什么是矢量数据库?我应该将我的数据库迁移到矢量数据库吗?为了回答这些问题,让我们首先尝试定义什么是数据。

数据库的历史概述

数据是以数字形式存储在计算机中的信息,可以进行组织或半结构化。数据通常存储在用于轻松访问和管理的系统中,即数据库。矢量由一种特定类型的数据组成,通常是一种包含其底层标识的语义表示的压缩表示。使用矢量的主要目的是它们的底层标识可以是从文本文档到音频文件的任何内容。矢量数据库是一种设计用于处理大规模矢量的数据库系统。其思想是能够根据查询的语义检索矢量,因为语义理解比基于关键字的查询能够产生更好的查询转换和结果。

在思考数据库时,SQL数据库是首先想到的一种类型。这是因为它们起源于1970年代,是最成熟的数据库类型之一。它们被广泛使用,以至于在数据相关领域工作过的任何人在某个时候都与它们有过一些互动。它们的成功在于它们将数据视为结构化的,并且在现实世界中,大量数据的创建以事务形式发生。使用这些事务按顺序存储数据会产生一个结构化的表。关系数据库在不同表之间建立链接以反映世界的复杂性时变得有趣起来。尽管它们的成功是不可否认的,但关系数据库的主要缺点是其缺乏灵活性。现实世界的数据可以来自各种来源,并且随着大数据的出现,数据收集速度很快。能够从这些多样化的来源中收集数据要求我们保存有时可能是…

Leave a Reply

Your email address will not be published. Required fields are marked *