逐步指南:发现和利用向量数据库的力量
目录
简介
向量数据库有什么特别之处?我们如何将句子的含义映射为数值表示?这对我们的LLM应用程序有何帮助?为什么我们不能将所有数据都提供给LLM?
实践教程 — 文本到嵌入和距离度量
1. 文本到嵌入2. 使用PCA在2D中绘制384维度3. 计算距离度量
走向向量存储器
如何加速相似性搜索?我们可以选择哪些不同的向量存储器?
实践教程 — 设置您的第一个向量存储器
1. 安装chroma2. 获取/创建chroma客户端和集合3. 向集合中添加一些文本文档4. 从数据库中提取所有条目到Excel文件5. 查询集合
摘要参考
向量数据库是当前热门话题。公司不断筹集资金开发他们的向量数据库或将向量搜索功能添加到现有的SQL或NoSQL数据库中。
向量数据库有什么特别之处?
向量数据库可以快速搜索和比较大量的向量集合。这非常有趣,因为最新的嵌入模型非常擅长理解单词背后的语义/含义,并将其转换为向量。这使我们能够高效地比较句子。