24 search results for "Faiss"

介绍在数据科学快速发展的领域中，向量数据库在实现高维数据的高效存储、检索和操作方面发挥着关键作用。本文探讨了向量数据库的定义和意义，将其与传统数据库进行了比较，并详细介绍了2024年考虑的前15个向量数据库。什么是向量数据库？向量数据库的核心设计是高效处理向量化数据。与擅长结构化数据存储的传统数据库不同，向量数据库专注于管理多维空间中的数据点，使其非常适用于人工智能、机器学习和自然语言处理等应用。向量数据库的目的在于促进向量嵌入、相似搜索和高维数据的高效处理。与可能难以处理非结构化数据的传统数据库不同，向量数据库在数据点之间的关系和相似性至关重要的场景中表现出色。向量数据库 vs 传统数据库方面传统数据库向量数据库数据类型表格格式的简单数据（文字、数字）。具有专门搜索功能的复杂数据（向量）。搜索方法精确匹配数据。使用近似最近邻（ANN）搜索进行最接近匹配。搜索技术标准查询方法。使用哈希和基于图的搜索等专门方法进行ANN搜索。处理非结构化数据由于缺乏预定义格式而具有挑战性。将非结构化数据转化为数值表示（嵌入）。表示基于表格的表示形式。…

Leave a Comment

如何通过Langchain来掌握简历排名？

Published October 20, 2023 by 四海吧

介绍在不断发展的就业市场中，雇主经常为每个职位空缺收到大量的简历而感到不知所措。筛选这些简历，确定最合适的候选人，是一项耗时且令人望而却步的任务。为应对这一挑战，我们将深入介绍使用Langchain这个强大的语言处理工具来创建一个复杂的简历排序应用程序。该应用程序将根据指定的关键技能自动过滤简历，并根据技能匹配程度对其进行排序。学习目标在Langchain下开发简历排序应用程序的深入理解简化候选人评估过程高效地确定适合的求职申请者本文发表在Data Science Blogathon中。人工智能驱动简历排序的重要性节省时间：将人工智能视为您节省时间的助手。它可以在几秒钟内处理大量简历，因此您不需要花费数小时在此上。这使您可以专注于其他重要任务。智能选择：人工智能不仅快速，而且智能。它可以发现与您的职位要求完全匹配的简历，帮助您做出更好的招聘决策，并更快地找到合适的人才。竞争优势：在一个职位空缺吸引数十甚至数百位申请者的世界中，使用人工智能可以使您具备竞争优势。您不仅跟上了竞争的脚步，还在高效和有效的招聘方面走在了前列。减轻压力：翻阅简历可能会带来压力。人工智能可以减轻压力，使招聘过程更加顺利和令人愉快。因此，让我们踏上这个旅程，逐步了解如何创建自己的人工智能驱动简历排序工具。设定舞台为何需要简历排序？招聘过程是任何组织增长的重要部分。然而，随着求职者数量的增加，手动筛选简历可能是一项耗时的任务，容易出现人为错误。简历排序通过自动化识别最合适的候选人的过程来减轻这一负担。这不仅节省时间，还确保不会忽视任何潜在的候选人。介绍Langchain Langchain是一个全面的语言处理工具，赋予开发人员执行复杂文本分析和信息提取任务的能力。它的功能包括文本分割、嵌入、顺序搜索和问答检索。通过利用Langchain，我们可以自动从简历中提取重要信息，使排序过程更加高效。语言模型在简历排序中的作用在数字时代，每天都会产生大量的文本数据，能够利用和理解语言的能力变得至关重要。语言模型结合自然语言处理（NLP）技术，已经成为自动化各种与文本相关任务的重要工具。本节探讨了语言模型的重要性、NLP的重要性以及Langchain如何增强简历排序中的NLP功能。理解语言模型语言模型是设计用于理解、生成和操作人类语言的计算系统。它们本质上是通过处理大量文本数据来学习语言的结构、语法和语义的算法。由于深度学习和神经网络的进步，这些模型已经得到了显著的发展。现代语言模型的一个关键特点是它们能够预测在给定上下文中某个单词或短语出现的概率。这种预测能力使它们能够生成连贯且与语境相关的文本。像OpenAI开发的GPT-3这样的语言模型，在各种自然语言理解任务中表现出色，使其成为广泛应用的有价值工具。…

Leave a Comment

了解亚马逊药店如何使用亚马逊SageMaker创建了他们基于LLM的聊天机器人

Published October 17, 2023 by 四海吧

亚马逊药房是亚马逊网站上的一家全方位药房，提供透明的定价、临床和客户支持，以及免费将药品送到您的门口客户服务代理在快速准确地获取与药房信息相关的信息方面起着至关重要的作用，包括处方澄清和转移状态、订单和发药详细信息以及患者信息

Leave a Comment

如何使用向量数据库构建LLM应用程序？

Published October 12, 2023 by 四海吧

介绍在人工智能领域，大型语言模型（LLMs）和生成型AI模型，如OpenAI的GPT-4、Anthropic的Claude 2、Meta的Llama、Falcon、Google的Palm等，已经彻底改变了我们解决问题的方式。LLMs使用深度学习技术来执行自然语言处理任务。本文将教你如何使用向量数据库构建LLM应用程序。你可能已经与类似亚马逊客服或Flipkart决策助手的聊天机器人进行过交互。它们能生成类似人类的文本，并提供几乎与现实对话无异的交互用户体验。然而，这些LLMs需要进行优化，以产生高度相关和具体的结果，才能真正对特定的使用案例有用。例如，如果你询问亚马逊客服应用程序：“如何在Android应用中更改语言？”可能没有经过训练来处理这个确切的文本，因此可能无法回答。这就是向量数据库发挥作用的时候。向量数据库将领域文本（在这种情况下是帮助文档）和所有用户的过去查询（包括订单历史等）存储为数值嵌入，并提供实时查找相似向量的功能。在这种情况下，它将这个查询编码成一个数值向量，并使用它在其向量数据库中执行相似性搜索，找到最相似的邻居。有了这个帮助，聊天机器人可以正确地指导用户进入亚马逊应用程序的“更改语言偏好设置”部分。学习目标 LLMs是如何工作的，它们的限制是什么，为什么它们需要向量数据库？嵌入模型的介绍以及如何在应用程序中对其进行编码和使用。学习什么是向量数据库，以及它们如何成为LLM应用程序架构的一部分。学习如何使用向量数据库和tensorflow编写LLM/生成型AI应用程序。本文是数据科学博客马拉松的一部分。什么是LLMs？大型语言模型（LLMs）是基础的机器学习模型，使用深度学习算法处理和理解自然语言。这些模型被训练使用大量的文本数据来学习语言中的模式和实体关系。LLMs可以执行许多类型的语言任务，例如翻译语言、分析情感、聊天机器人对话等。它们能够理解复杂的文本数据，识别实体及其之间的关系，并生成连贯且语法正确的新文本。在这里阅读更多关于LLMs的信息。 LLMs是如何工作的？ LLMs使用大量数据进行训练，通常是以太字节，甚至是拍字节，拥有数十亿或数万亿个参数，使其能够根据用户的提示或查询进行预测和生成相关的响应。它们通过词嵌入、自注意层和前馈网络处理输入数据，生成有意义的文本。你可以在这里阅读更多关于LLM架构的信息。 LLMs的限制虽然LLMs似乎以相当高的准确性生成响应，甚至在许多标准化测试中比人类表现得更好，但这些模型仍然有限制。首先，它们完全依赖于它们的训练数据来构建推理，因此可能在数据中缺乏特定或当前的信息。这导致模型生成不正确或不寻常的响应，也被称为“幻觉”。有持续的努力在减轻这个问题。其次，模型可能无法按照用户的期望行为或响应。为了解决这个问题，向量数据库和嵌入模型通过为用户寻找信息提供了额外的类似性查询（文本、图像、视频等）。以下是一个例子，LLMs无法回答用户询问的信息，而是依靠向量数据库找到该信息。 LLM和向量数据库大型语言模型(LLM)被广泛应用于电子商务、旅游、搜索、内容创作和金融等行业的许多部分。这些模型依赖于一种相对较新的数据库类型，称为向量数据库，它以一种称为嵌入的二进制表示存储文本、图像、视频和其他数据的数值表示。本节介绍了向量数据库和嵌入的基本原理，更重要的是介绍了如何将它们与LLM应用程序集成使用。向量数据库是一种使用高维空间存储和搜索嵌入的数据库。这些向量是数据特征或属性的数值表示。使用计算向量在高维空间中的距离或相似度的算法，向量数据库可以快速高效地检索相似的数据。与传统的基于标量的数据库不同，后者将数据存储在行或列中，并使用精确匹配或基于关键词的搜索方法，向量数据库的操作方式不同。它们使用向量数据库来在非常短的时间内(毫秒级别)搜索和比较大量向量，使用近似最近邻(ANN)等技术。嵌入的简要教程 AI模型通过将原始数据如文本、视频和图像输入到诸如word2vec之类的向量嵌入库中，生成嵌入。在AI和机器学习的背景下，这些特征代表数据的不同维度，这些维度对于理解模式、关系和底层结构至关重要。下面是使用word2vec生成词嵌入的示例。 1.…

Leave a Comment

使用AWS AI服务和Amazon Bedrock的智能文件处理

Published October 8, 2023 by 四海吧

医疗保健、金融、法律、零售和制造等行业的公司经常处理大量文件，作为他们日常运营的一部分这些文件通常包含重要信息，推动及时决策，确保顶级客户满意度，并减少客户流失传统上，从文件中提取数据是…

Leave a Comment

《LLM 中的检索增强生成的深入研究》

Published October 6, 2023 by 四海吧

探索检索增强生成，这是一个无缝集成大型语言模型和外部数据源的框架，可以消除幻觉和其他常见缺点

Leave a Comment

创造一台由维基百科知识赋能的 LLaMa 2 代理人

Published September 28, 2023 by 四海吧

大型语言模型（LLM）是人工智能中最热门的趋势之一它们展示出令人印象深刻的文本生成能力，范围涵盖与人类用户进行对话的能力…

Leave a Comment

“解锁LangChain和Flan-T5 XXL | 高效文档查询指南”

Published September 23, 2023 by 四海吧

介绍大型语言模型（LLMs）是一类特定的人工智能模型，旨在理解和生成类似于人类的文本。术语“大型”通常通过它们拥有的参数数量来量化。例如，OpenAI的GPT-3模型有1750亿个参数。可以将其用于各种任务，例如文本翻译、回答问题、写作论文、总结文本。尽管有很多资源展示了LLMs的能力，并提供了有关如何设置聊天应用程序的指导，但很少有人深入研究它们在现实业务场景中的适用性。在本文中，您将学习如何使用LangChain和Flan-T5 XXL构建基于大型语言的应用程序来创建文档查询系统。学习目标在深入研究技术细节之前，让我们确定本文的学习目标：了解如何利用LangChain构建基于大型语言的应用程序简要介绍文本到文本框架和Flan-T5模型如何使用LangChain和任何LLM模型创建文档查询系统现在让我们深入了解这些部分，以理解每个概念。本文是Data Science Blogathon的一部分。 LangChain在构建LLM应用程序中的作用 LangChain框架旨在开发各种应用程序，例如聊天机器人、生成式问答（GQA）和摘要，以发挥大型语言模型（LLMs）的能力。LangChain为构建文档查询系统提供了全面的解决方案。这涉及通过分块对语料库进行预处理，将这些块转换为向量空间，在提出查询时识别相似块，并利用语言模型将检索到的文档细化为合适的答案。 Flan-T5模型概述 Flan-T5是谷歌研究人员开发的一种商业可用的开源LLM。它是T5（文本到文本转换Transformer）模型的变体。T5是一种先进的语言模型，它通过将NLP任务转换为基于文本的格式来训练。FLAN是Finetuned Language Net的缩写。让我们深入构建文档查询系统我们可以利用LangChain和Flan-T5 XXL模型在Google Colab的免费版中构建此文档查询系统。要在Google Colab中执行以下代码，我们必须选择“T4 GPU”作为我们的运行时。按照以下步骤构建文档查询系统： 1：导入必要的库…

Leave a Comment

这份AI新闻通讯是你所需要的一切 #63

Published September 13, 2023 by 四海吧

本周在人工智能领域，我们重点关注到大语言模型（LLMs）在西方市场推动了显著的收入增长的进一步证据，以及新的人工智能模型的引入…

Leave a Comment

在Amazon SageMaker上使用LLMs实现智能视频和音频问答，并提供多语言支持

Published August 25, 2023 by 四海吧

在日益数字化的世界中，数字资产是企业产品、服务、文化和品牌身份的重要视觉表现数字资产与记录的用户行为一起，可以通过提供互动和个性化体验来促进客户参与，使公司能够与目标受众更深入地连接高效地发现和搜索特定的数字资产[…]

Leave a Comment

使用Python进行零到高级的Langchain提示工程化

Published August 5, 2023 by 四海吧

大型语言模型（LLM）的一个重要方面是这些模型用于学习的参数数量模型拥有的参数越多，它就越能理解单词和短语之间的关系这意味着拥有数十亿参数的模型具备生成各种创造性文本格式和回答开放性问题的能力

Leave a Comment

见面GPTCache：开发LLM查询语义缓存的库

Published August 5, 2023 by 四海吧

ChatGPT和大型语言模型（LLMs）非常灵活，可以创建多种程序。然而，当应用程序受欢迎并且流量增加时，与LLM API调用相关的成本可能变得显著。在处理许多查询时，LLM服务可能还需要较长的等待时间。为了直面这一困难，研究人员开发了GPTCache，这是一个旨在存储LLM答案的语义缓存项目。开源的GPTCache程序可以通过缓存其输出答案来加快LLMs的速度。当所请求的响应已经在缓存中存储并且之前已经请求过时，这将极大地减少获取它所需的时间。 GPTCache具有灵活和简单的特点，非常适合任何应用。它与许多语言学习机器（LLMs）兼容，例如OpenAI的ChatGPT。它是如何工作的？为了正常运行，GPTCache会缓存LLM的最终回复。缓存是用于快速检索最近使用的信息的内存缓冲区。每当向LLM发出新请求时，GPTCache首先查找缓存，以确定所请求的响应是否已经存储在其中。如果答案可以在缓存中找到，它将立即返回。如果缓存中没有找到，LLM将生成响应并将其添加到缓存中。 GPTCache的模块化架构使其易于实施定制的语义缓存解决方案。用户可以通过选择不同的设置来定制每个模块的体验。 LLM适配器通过将各种LLM模型使用的API和请求协议标准化为OpenAI API，统一了它们之间的接口。由于LLM适配器可以在不需要重写代码或熟悉新API的情况下在LLM模型之间移动，它简化了测试和实验。嵌入生成器使用所请求的模型创建嵌入，以进行相似性搜索。支持的模型可以使用OpenAI的嵌入API。这是使用GPTCache/paraphrase-albert-onnx模型的ONNX，Hugging Face嵌入API，Cohere嵌入API，fastText嵌入API和SentenceTransformers嵌入API。在缓存存储中，像ChatGPT这样的LLM的响应被保留，直到可以检索。在确定两个实体是否在语义上相似时，会获取缓存的回复并将其发送回请求方。GPTCache与许多不同的数据库管理系统兼容。用户可以选择最符合其性能、可扩展性和最常用数据库成本要求的数据库。向量存储的选择：GPTCache包括一个向量存储模块，它使用从原始请求中导出的嵌入来识别K个最相似的请求。此功能可用于确定两个请求的相似程度。此外，GPTCache支持多个向量存储，例如Milvus、Zilliz Cloud和FAISS，并为与它们一起使用提供了简单的接口。用户可以选择各种向量存储选项，其中任何一个都可能影响GPTCache的相似性搜索性能。凭借对各种向量存储的支持，GPTCache承诺是可适应的，并满足更多种用例的需求。 GPTCache缓存管理器管理缓存存储和向量存储组件的驱逐策略。当缓存被填满时，替换策略决定哪些旧数据应该从缓存中删除，以为新数据腾出空间。相似性评估器的信息来自于GPTCache的缓存存储和向量存储部分。它使用几种不同的方法将输入请求与向量存储中的请求进行比较。是否从缓存中提供请求取决于相似度的程度。GPTCache提供了统一的接口和可用实现的库，以确定缓存匹配。GPTCache通过各种相似度算法来确定缓存匹配的能力，使其能够适应大范围的用例和用户需求。特点和优势通过GPTCache减少LLM查询延迟，提高响应速度和速度。由于许多LLM服务采用基于令牌和请求的定价结构，GPTCache可以减少服务成本，限制API调用次数。 GPTCache具有从LLM服务卸载工作的能力，提高可扩展性。随着您接收的请求数量增加，这可以帮助您保持高效运行。借助GPTCache，可以将创建LLM应用程序的成本降至最低。通过缓存由LLM生成或模拟的数据，您可以在不向LLM服务发出API请求的情况下测试您的应用程序。 GPTCache可以与您选择的应用程序（LLM ChatGPT）、缓存存储（SQLite、PostgreSQL、MySQL、MariaDB、SQL Server或Oracle）和向量存储（FAISS、Milvus、Ziliz Cloud）配合使用。GPTCache项目的目标是在GPT-based应用程序中尽可能地重用先前生成的回复，而不是每次都从空白开始，从而实现对语言模型的最有效利用。

Leave a Comment

面向文档的代理使用向量数据库、LLMs、Langchain、FastAPI和Docker的旅程

Published July 9, 2023 by 四海吧

利用ChromaDB、Langchain和ChatGPT：从大型文档数据库中增强响应并引用来源

Leave a Comment

70%的开发者今天拥抱人工智能：深入研究大型语言模型、LangChain和向量数据库在当前技术领域的崛起

Published July 3, 2023 by 四海吧

人工智能具有无限的可能性，这在其引入每个人的新产品和发展中显而易见。随着OpenAI开发的最新聊天机器人ChatGPT的发布，由于其GPT的变压器架构，AI领域已经席卷全球。从深度学习、自然语言处理（NLP）和自然语言理解（NLU）到计算机视觉，AI正将每个人推向一个拥有无尽创新的未来。几乎每个行业都在利用AI的潜力并进行革命性的改变。特别是在大规模语言模型（LLMs），LangChain和向量数据库等领域的卓越技术进步，是这一显著发展的原因。大规模语言模型大规模语言模型（LLMs）的发展代表了人工智能的一大步进。这些基于深度学习的模型在处理和理解自然语言时表现出令人印象深刻的准确性和流畅性。LLMs通过从各种来源（包括书籍、期刊、网页和其他文本资源）获取大量文本数据进行训练。它们通过学习语言来获取语言结构、模式和语义链接，从而帮助它们理解人类交流的复杂性。 LLMs的基本架构通常涉及具有多层的深度神经网络。根据训练数据中发现的模式和连接，该网络分析输入文本并生成预测。为了减少模型预期输出和预期输出之间的差异，模型的参数在训练阶段进行调整。LLM在训练过程中消耗文本数据，并试图根据上下文预测下一个单词或一系列单词。 LLMs的应用回答问题：LLMs擅长回答问题，并通过搜索大量的文本语料库（如书籍、论文或网站）来提供精确而简洁的回答。内容生成：LLMs在涉及内容生成的活动中证明了其有用性。它们能够生成语法正确、连贯的文章、博客条目和其他书面内容。文本摘要：LLMs在文本摘要方面表现出色，能够在将冗长的文本压缩为更短、更易消化的摘要时保留重要信息。聊天机器人：LLMs经常被用于创建聊天机器人和使用对话式AI的系统。它们使得这些系统能够用正常语言与用户进行交互，理解他们的问题并适当地回答，并在整个交互过程中保持上下文。语言翻译：LLMs能够准确地在不同语言之间进行文本翻译，克服语言障碍，促进成功的交流。训练LLMs的步骤训练LLMs的初始阶段是编制一个庞大的文本数据集，模型将使用该数据集来发现语言模式和结构。一旦收集到数据集，就需要进行预处理，以便为训练做准备。为此，必须通过删除任何不必要或冗余的条目来清理数据。选择适当的模型架构对于训练LLMs至关重要。基于变压器的架构已经显示出在处理和生成自然语言方面非常高效，包括GPT模型。使用反向传播等深度学习方法调整模型的参数来训练LLMs，并提高其准确性。模型在训练过程中处理输入数据并基于识别出的模式生成预测。在初始训练之后，LLMs将进一步在特定任务或领域上进行微调，以提高其在这些领域的性能。为了评估经过训练的LLMs的性能，使用多种指标（包括困惑度和准确性）来评估模型的性能。经过训练和评估后，LLMs将在实际应用中的生产环境中使用于实际应用。一些著名的语言模型 GPT（Generative Pre-trained Transformer）是OpenAI的GPT模型系列的重要成员，也是知名的ChatGPT的底层模型。它是一个仅解码器的单向自回归模型，通过根据先前生成的单词预测下一个单词来生成文本。GPT拥有1750亿个参数，广泛用于内容生成、问题回答等方面。 BERT – 双向Transformer编码器表示（BERT）是最早的基于Transformer的自监督语言模型之一。它是一个强大的模型，用于理解和处理自然语言，具有3.4亿个参数。…

Leave a Comment

使用Langchain为YouTube视频构建ChatGPT

Published June 28, 2023 by 四海吧

介绍你是否曾经想过与视频聊天有多么好？作为一个博客作者，我经常觉得看一个长达一小时的视频来获取相关信息很无聊。有时候，看一个视频以获取任何有用的信息感觉像是一份工作。所以，我构建了一个聊天机器人，让你可以与 YouTube 视频或任何视频进行聊天。这得益于 GPT-3.5-turbo、Langchain、ChromaDB、Whisper 和 Gradio。因此，在本文中，我将介绍如何使用 Langchain 构建一个功能强大的聊天机器人，用于与 YouTube 视频交互。学习目标使用 Gradio 构建 Web 界面使用 Whisper 处理 YouTube 视频并提取文本数据适当处理和格式化文本创建文本数据的嵌入配置…

Leave a Comment