Press "Enter" to skip to content

274 search results for "this"

使用Amazon SageMaker Model Registry、HashiCorp Terraform、GitHub和Jenkins CI/CD在多环境设置中推广管道

在人工智能(AI)和机器学习(ML)的快速发展环境中,为组织构建一个机器学习操作(MLOps)平台对于无缝衔接数据科学实验和部署,同时满足模型性能、安全性和合规性要求至关重要为了满足监管和合规要求,

Leave a Comment

KOSMOS-2:微软的多模态大型语言模型

介绍 2023年是一个人工智能的年份,从语言模型到稳定的扩散模型。其中一个新的玩家登上了舞台,那就是由微软开发的KOSMOS-2。它是一个多模态大型语言模型(MLLM),在理解文本和图像方面具有开创性的能力。开发语言模型是一回事,而为视觉创建模型是另一回事,但拥有同时具备这两种技术的模型则是另一个全新层次的人工智能。在本文中,我们将深入探讨KOSMOS-2的特点和潜在应用,以及它对人工智能和机器学习的影响。 学习目标 了解KOSMOS-2多模态大型语言模型。 了解KOSMOS-2如何执行多模态接地和指称表达生成。 深入了解KOSMOS-2在现实世界中的应用。 在Colab中使用KOSMOS运行推理。 本文是作为 数据科学博客马拉松 的一部分发布的。 了解KOSMOS-2模型 KOSMOS-2是微软研究团队的一项成果,他们在一篇名为“Kosmos-2:将多模态大型语言模型接地到世界”的论文中介绍了这个模型。KOSMOS-2旨在同时处理文本和图像,并重新定义我们与多模态数据的交互方式。KOSMOS-2基于基于Transformer的因果语言模型架构构建,类似于其他著名模型如LLaMa-2和Mistral AI的7b模型。 然而,KOSMOS-2的独特训练过程是其与众不同之处。它使用一组庞大的图像-文本对训练数据集,称为GRIT,其中文本以特殊令牌形式包含了对图像中物体的引用边界框。这种创新的方法使KOSMOS-2能够提供对文本和图像的新理解。 什么是多模态接地? KOSMOS-2的一个亮点功能是其执行“多模态接地”的能力。这意味着它可以为图像生成描述对象及其在图像中的位置的字幕。这大大减少了语言模型中的“幻觉”问题,极大地提高了模型的准确性和可靠性。 这个概念通过独特的令牌将文本与图像中的对象联系起来,有效地将对象“接地”到视觉环境中。这减少了幻觉,增强了模型生成准确图像字幕的能力。 指称表达生成 KOSMOS-2在“指称表达生成”方面也表现出色。这个功能允许用户以图像中特定边界框和问题的方式提示模型。然后,模型可以回答有关图像中特定位置的问题,为理解和解释视觉内容提供了强大的工具。 这种令人印象深刻的“指称表达生成”用例允许用户使用提示,并为与视觉内容的自然语言交互打开了新的途径。 使用KOSMOS-2进行代码演示 我们将看到如何在Colab上使用KOSMOS-2模式进行推理。在这里找到完整的代码:https://github.com/inuwamobarak/KOSMOS-2 步骤1:设置环境 在这一步中,我们安装必要的依赖库,如🤗 Transformers、Accelerate和Bitsandbytes。这些库对使用KOSMOS-2进行高效推理至关重要。 !pip install…

Leave a Comment

在Amazon SageMaker JumpStart中通过两行代码部署和优化基础模型

我们非常高兴地宣布推出了简化版的Amazon SageMaker JumpStart SDK,它能够轻松构建、训练和部署基础模型预测代码也得到了简化在本文中,我们将演示如何使用简化版SageMaker Jumpstart SDK只需几行代码便能开始使用基础模型

Leave a Comment

使用Amazon SageMaker地理空間功能進行甲烷排放點源的檢測和高頻監測

甲烷(CH4)是一个重要的人为温室气体,它是石油和天然气提取、煤矿开采、大规模养殖业以及废物处理等活动的副产品CH4的全球变暖潜势是二氧化碳的86倍,气候变化政府间专门委员会(IPCC)估计,甲烷对观察到的温室效应贡献了30%[…]

Leave a Comment

随着生成式人工智能的突破,现在是应对负责任人工智能的时候了

在2022年,公司平均每个公司已有3.8个AI模型正在生产中今天,10家公司中有7家正在尝试生成AI,这意味着未来几年将有更多的AI模型投入生产因此,关于负责任的AI的行业讨论变得更加紧迫好消息是[…]

Leave a Comment

《在Langchain中使用链条的综合指南》

介绍 迈入语言处理的前沿!在语言成为人类与技术之间的重要纽带的领域中,自然语言处理取得了一些非凡的成就。在这一进展中,有一项具有突破性意义的大型语言模型,它正在重塑我们与基于文本的信息的互动方式。在这个全面的学习之旅中,你将深入了解 LangChain,这是一种前沿工具,正在重新塑造我们与基于文本的信息的互动方式。你是否曾经想过,“Langchain”是什么链条? LangChain作为大型语言模型领域的门户独树一帜,它提供了深入理解这些模型如何将原始输入转化为精细和类似人类回答的能力。通过这种探索,你将揭开 LangChain 的基本构建模块,从LLMChain和Sequential Chains到Router Chains的复杂运作。 学习目标 了解 LangChain 的核心组成部分,包括LLMChains和Sequential Chains,看看输入是如何在系统中流动的。 学会以连贯的方式整合不同的元素,探索提示模板和语言模型之间的联系。 获得在实际任务中创建功能性链条的实际经验。 培养通过微调结构、模板和解析技术来提高链条效率的技能。 本文是“数据科学博文马拉松”的一部分。 什么是LLM? 大语言模型(LLM)是一种旨在理解和生成类似人类文本的人工智能类型。这些模型(如OpenAI的GPT-3.5)通过训练大量文本数据来了解人类语言的模式和结构。它们可以执行各种与语言相关的任务,包括翻译、内容生成、回答问题等。 LLMs是自然语言处理中宝贵的工具,广泛应用于聊天机器人、内容生成和语言翻译等领域。 什么是LangChain? 在我们揭开 LangChain Chains 的复杂性之前,让我们先理解…

Leave a Comment

Can't find what you're looking for? Try refining your search: