Press "Enter" to skip to content

Tag: Generative AI

沃尔玛的大胆举措:为5万名企业员工配备生成式AI助手

在一项具有开创性的举措中,零售巨头沃尔玛宣布计划为其5万名企业员工提供生成式人工智能助手沃尔玛的执行副总裁唐娜·莫里斯宣布了这一举措,旨在简化操作,提高生产力,并改善组织内的决策能力尽管许多公司一直都在尝试将人工智能融入业务中,[…]

Leave a Comment

在您的本地机器上释放GenAI LLMs的潜力!

介绍 自从GenAI LLMs发布以来,我们已经开始以各种方式使用它们。最常见的方式是通过像OpenAI网站这样的网站使用ChatGPT或通过OpenAI的GPT3.5 API、Google的PaLM API或其他网站(如Hugging Face、Perplexity.ai)使用大型语言模型的API进行交互。 在所有这些方法中,我们的数据被发送到我们的计算机之外。它们可能容易受到网络攻击(尽管所有这些网站都保证最高的安全性,但我们不知道会发生什么)。有时,我们希望在本地运行这些大型语言模型,如果可能的话,对它们进行本地调整。在本文中,我们将介绍如何设置LLMs以在Oobabooga上本地运行。 学习目标 了解在本地系统上部署大型语言模型的重要性和挑战。 学习在本地创建运行大型语言模型的设置。 探索可以在给定的CPU、RAM和GPU Vram规格下运行的模型。 学习从Hugging Face下载任何大型语言模型以在本地使用。 检查如何为大型语言模型分配GPU内存以运行。 本文是作为数据科学博文马拉松的一部分发表的。 什么是Oobabooga? Oobabooga是一个用于大型语言模型的文本生成Web界面。Oobabooga是一个基于Gradio的Web UI。Gradio是一个被机器学习爱好者广泛使用的Python库,用于构建Web应用程序,Oobabooga就是使用这个库构建的。Oobabooga将所有在尝试在本地运行大型语言模型时需要设置的复杂事物都抽象出来。Oobabooga附带了许多扩展来集成其他功能。 使用Oobabooga,您可以提供来自Hugging Face的模型链接,它将下载模型,然后您可以立即开始推理模型。Oobabooga具有许多功能,并支持不同的模型后端,如GGML、GPTQ、exllama和llama.cpp版本。您甚至可以在LLM之上使用这个UI加载一个LoRA(低秩适应)。Oobabooga可以让您训练大型语言模型,创建聊天机器人/ LoRA。在本文中,我们将详细介绍使用Conda安装此软件。 设置环境 在本节中,我们将使用conda创建一个虚拟环境。所以,要创建一个新的环境,打开Anaconda Prompt并输入以下命令。…

Leave a Comment

Llama 2:深入探究ChatGPT的开源挑战者

“能够进行复杂推理任务的大型语言模型(LLMs)在编程和创意写作等专业领域显示出潜力然而,LLMs的世界并不仅仅是一个即插即用的天堂;在可用性、安全性和计算需求方面存在一些挑战在本文中,我们将深入探讨Llama 2的能力,同时提供一个[…]”

Leave a Comment

提升生成式人工智能体验:Amazon SageMaker 托管中引入流媒体支持

我们很高兴地宣布,通过Amazon SageMaker实时推理,响应流式传输已经可用现在,当使用SageMaker实时推理构建生成式AI应用程序(如聊天机器人、虚拟助手和音乐生成器)时,您可以连续地将推理响应流返回给客户端,以帮助您构建交互式体验通过这个新功能,您可以在可用时立即开始流式传输响应,而不是等待整个响应生成这降低了生成式AI应用程序的首字节响应时间在本文中,我们将展示如何使用SageMaker实时终端节点和新的响应流式传输功能为交互式聊天用例构建流式网络应用程序我们在示例演示应用程序UI中使用Streamlit

Leave a Comment

生成式人工智能从GPT-3.5转向GPT-4之旅

介绍 从GPT-3.5到GPT-4在生成人工智能(AI)领域的转变标志着语言生成和理解的一个重大飞跃。GPT-4是“生成预训练变压器4”的简称,是迭代改进的成果,利用改进的架构和训练方法。 虽然GPT-3.5展示了在理解上下文和生成连贯文本方面的令人印象深刻的能力,但GPT-4进一步推动了这一发展轨迹。通过整合精细调整的训练数据、更大的模型尺寸和增强的微调技术,GPT-4产生了更精确和上下文感知的响应。 这一旅程凸显了人工智能语言能力卓越追求的不懈努力,突显了人工智能演进的迭代性质。从内容创作到客户服务,GPT-4在各个领域的应用展示了它改变人机交互的潜力。 GPT-4凸显了生成型人工智能的潜力,思考了技术的迅速演进。这一转变标志着一个精炼的里程碑,将人工智能引向深入的类人语言理解和生成。 学习目标 了解推动GPT-4丰富语言能力的基本技术进展。 解决道德复杂性,处理偏见和错误信息的影响。 探索GPT-4对行业、通信和社会的深远影响。 与GPT-4进行对话式发现,揭示其创造力。 想象GPT-4在塑造未来人工智能领域和创造力方面的作用。 在组织和行业中培养道德的人工智能整合方法。 本文作为数据科学博客马拉松的一部分发表。 揭开生成型人工智能语言模型的演进 探索人工智能的动态领域,创新扩展了人类成就的界限,我们深入探讨了生成型人工智能语言模型的故事,从GPT-3.5到具有变革性的GPT-4的里程碑。将这一旅程想象为技术智慧的叙事,每个阶段代表了在AI中复制人类语言的里程碑,从早期的语言处理到神经网络。GPT-3.5的背景凸显了GPT-4到来的重要性,这是一个超越数字的飞跃,为语言理解开启了新时代。一个时间轴或齿轮融合之类的图像可以在视觉上增强这个叙事。GPT-4体现了人类智慧和技术的融合,是AI生成语言未来的门槛。从GPT-3.5过渡到GPT-4标志着一个深刻的转变;我们的旅程展开,探索其中的影响、进步和更广阔的视野。 GPT-3.5的出现凸显了GPT-4的重要性,超越了数字的转变。它标志着一个转折点,超越了简单的数字,而是引领了一种语言理解和生成相互交织,重新构想沟通方式的时代。视觉隐喻,如时间轴展示语言AI进展的进程或齿轮融合象征着语言生成背后复杂的机制,可以增强这个叙事的共鸣。GPT-4不仅是AI进步的象征,也是人类智慧和技术实力之间的桥梁,是AI生成语言未来的门户。当我们从GPT-3.5过渡到GPT-4时,这种深刻的转变成为我们探索的核心,引导我们深入探讨其中的影响、进步以及在AI领域中展开的广阔视野。 GPT-3.5的架构 自注意机制 自注意机制是变压器架构的关键要素。它允许模型在一个序列中相对于特定单词对不同单词的重要性进行加权。这个机制捕捉到单词之间的关系和依赖性,使模型能够理解上下文。 多头注意力 在GPT-3.5中,与其他Transformer模型一样,自注意力机制被用于多个“头”或子注意力机制。每个头关注输入序列的不同方面,为模型提供捕捉各种关系和模式的能力。 位置编码 Transformer模型对于序列中单词的顺序没有固有的知识,而这对于语言理解是必不可少的。为了解决这个问题,位置编码被添加到输入嵌入中。这些编码提供关于序列中单词位置的信息,使模型能够理解语言的顺序性。 前馈神经网络 每个Transformer层包含处理多头注意力层输出的前馈神经网络。这些网络由全连接层和非线性激活函数组成,帮助模型捕捉数据中的复杂模式。…

Leave a Comment

2023年9月最佳40+个生成式人工智能工具

ChatGPT – GPT-4 GPT-4是OpenAI的最新LLM,比其前身更有创造力、准确性和安全性。它还具有多模态能力,即它能够处理图像、PDF、CSV等。通过引入代码解释器,GPT-4现在可以运行自己的代码,以避免幻觉并提供准确的答案。 Bing AI Bing AI由OpenAI的GPT-4模型提供动力,可以遍历网络提供准确的答案。它还具有根据用户提示生成图像的能力。 GitHub Copilot GitHub Copilot是一个AI代码补全工具,它分析代码并提供即时反馈和相关的代码建议。 DALL-E 2 DALL-E 2是OpenAI开发的文本到图像生成工具,它根据用户的提示创建原始图像。它被设计为拒绝不适当的用户请求。 Cohere Generate Cohere Generate利用AI的潜力来增强业务运营。它为电子邮件、落地页、产品描述和其他各种需求提供个性化内容。 AlphaCode AlphaCode由DeepMind开发,能够以竞争水平编写计算机程序。 Adobe Firefly Firefly是一款以提示为图像输出准确性而闻名的图像生成和编辑工具。它包括各种图像修改功能,包括内容类型、颜色、色调、光照和构图工具。…

Leave a Comment

40+ 你应该查看的酷炫人工智能工具(2023年9月)

DeepSwap DeepSwap是一款基于人工智能的工具,适用于任何想要创作逼真换脸视频和图片的人。通过替换视频、图片、梗图、老电影、GIF等内容,您可以轻松创建自己的内容。该应用没有内容限制,用户可以上传任何类型的素材。此外,首次订阅该产品的用户可享受50%的折扣。 Aragon 使用Aragon,轻松获得令人惊叹的专业头像。利用最新的人工智能技术,快速创建高质量的个人头像!省去预约摄影工作室或穿着正装的麻烦。快速编辑和修饰您的照片,不用等上几天。获得40张高清照片,助您在下一个工作中脱颖而出。 AdCreative.ai 通过AdCreative.ai提升您的广告和社交媒体效果-这是终极的人工智能解决方案。告别数小时的创意工作,迎接几秒钟内生成的高转化广告和社交媒体帖子。立即使用AdCreative.ai,最大化您的成功,最小化您的努力。 Hostinger AI网站构建器 Hostinger利用先进的人工智能引擎为所有网站所有者打造最佳的AI网站构建器。构建器将指导您完成设计过程,为您的需求提供布局、配色方案和内容位置建议。在保持对各种设备的响应式设计的同时,拥抱自由定制每一个细节。 Otter AI Otter.AI利用人工智能技术,为用户提供实时会议笔记的转录,这些笔记可以共享、搜索、访问和保护。获得一个会议助手,可以记录音频、撰写笔记、自动捕捉幻灯片并生成摘要。 Notion Notion通过利用先进的人工智能技术,旨在扩大其用户群。他们的最新功能Notion AI是一个强大的生成式AI工具,可以帮助用户进行笔记总结、识别会议中的行动项,并创建和修改文本。Notion AI通过自动化繁琐的任务、提供建议和模板,简化和改善用户体验,从而简化工作流程。 Codium AI 为繁忙的开发人员生成有意义的测试。使用CodiumAI,您可以在IDE内部获得非平凡的测试建议(也可以是平凡的!),这样您就可以在推送时进行智能编码、创造更多价值并保持信心。借助CodiumAI,开发人员可以更快、更自信地进行创新,节省他们用于测试和分析代码的时间。代码就像您想的那样。 Docktopus AI Docktopus是一款由人工智能驱动的演示工具,通过100多个可定制模板简化在线内容创建,让用户能够在几秒钟内创建专业的演示文稿。 SaneBox 人工智能是未来,但在SaneBox,人工智能已经成功地为过去12年的电子邮件提供动力,每周为普通用户节省超过3小时的时间。 Promptpal…

Leave a Comment

Meta发布Code Llama:最新的AI编码工具

在一个令人难以置信的技术飞跃中,Meta发布了其最新的创作Code Llama,这是一个基于Llama 2语言模型构建的AI工具。这一创新就像是开发人员的超级英雄,使编码更加顺畅、快速和易于接触。无论您是经验丰富的程序员还是刚开始编码之旅,Code Llama都会全力支持您。以下是关于Meta最新的AI代码生成工具的一切需要了解的信息。 还阅读:Anthropic发布Claude 2:改变编码的下一代AI聊天程序 通过Code Llama破译代码 Meta的Code Llama并不是您每天都会遇到的AI。它是一个大型语言模型(LLM),可以阅读文本提示并生成代码解决方案。想象一下拥有自己的编码精灵-您输入您想要的内容,然后哇!Code Llama为您生成它。这不仅仅是任何代码,它是超高效、专业级的代码,可以使您的项目更加出色。 还阅读:10个可以生成代码的AI工具以帮助程序员 填补新手与高手之间的差距 学习编码就像是解读外星语言。但是有了Code Llama在身边,就像拥有一位智慧的导师,他可以讲您的语言和代码语言。这个AI代码生成器可以根据您的描述生成代码行,将复杂的想法变为现实。无论是Python、C++、Java还是其他任何顶级编程语言,这个AI都可以胜任! 不仅仅是代码生成器 Code Llama不仅仅是一个代码生成器;它是一个多功能工具,可以在编码的每个阶段提供帮助。它是您调试和完成代码的虚拟伙伴。想象一下,您正在编写代码,突然遇到了难题-您不确定如何继续。AI会提供建议,引导您完成整个过程,并确保您不会陷入困境。 还阅读:谷歌推出Project IDX:一款基于浏览器的AI工具,为开发者提供天堂般的环境 Llama系列产品:为各种需求提供多种选择 Code Llama有三种不同的规模-7B、13B和34B参数。这些规模决定了您的编码助手具有的能力。较大的模型提供更准确的结果和更好的指导,而较小的模型则速度极快,非常适合实时协助。 还阅读:新的AI模型仅使用30B参数就超越了GPT-3 量身定制:Code…

Leave a Comment

微软在Excel中引入Python:将分析能力与熟悉度相结合,以增强数据洞察力

数据分析领域长期以来一直在努力将Python的能力(一种广泛用于分析的强大编程语言)与Microsoft Excel的熟悉界面和功能无缝集成。这个挑战妨碍了依赖这两个工具进行任务的专业人士进行高效决策和数据处理。显然需要一个能够弥合这个差距的统一解决方案。 现有的合并Python和Excel的尝试经常是繁琐的,涉及到复杂的设置。分析师不得不使用外部脚本、第三方工具或在两个环境之间进行手动数据传输。这些方法引入了低效性,提高了安全风险,并使协作工作流变得困难。缺失的部分是融合这两个平台的强项的一个统一解决方案。 Microsoft 对这个长期存在的挑战的答案是将Python整合到Excel中。这种突破性的整合提供了一种本地和无缝的方式来结合Excel的数据组织、可视化能力和对Python的分析能力的熟悉。它承诺重新定义专业人士在数据分析、决策和协作方面的方法。 Python in Excel 允许用户使用新的 PY 函数直接在Excel单元格中输入Python代码。这消除了使用外部脚本或复杂数据传输的需要。该整合是专为分析师设计的,确保了Python分析库(如pandas、Matplotlib和scikit-learn)的可用性。这种整合超越了简单的并置,使用户能够创建将Excel的现有功能与Python分析相结合的端到端解决方案。 通过在Microsoft Cloud上的隔离容器中运行Python代码,整合确保了安全性。通过Python和Excel函数之间的受控交互来维护数据隐私。通过与Microsoft Teams和Outlook等工具的兼容性来简化协作,实现共同撰写和数据共享,并遵守安全策略。 Python in Excel 在数据分析工作流中引入了一个范式转变。分析师现在可以在不离开熟悉的Excel界面的情况下无缝访问Python丰富的分析能力。高级可视化、机器学习、预测分析和数据清洗是基于Excel的分析的重要组成部分。这种整合的成功度量可能包括数据分析效率的提高、减少数据传输所花费的时间、增强协作能力和改善数据安全性。 Python in Excel 的引入解决了各行业专业人士长期面临的一个挑战。通过融合Python和Excel的优势,Microsoft 打开了新的分析潜力和协作水平。这种整合简化了工作流程,增强了数据洞察力,优化了决策过程。作为一种具有变革性的工具,Python in Excel…

Leave a Comment

“认识Lilli:麦肯锡的内部生成式人工智能工具,释放洞察力,提升咨询效率”

在咨询领域,高效和有效地传播知识一直是一个持续追求的目标。咨询行业的开拓者麦肯锡认识到了利用其丰富的见解的挑战,并寻求简化这一过程的方法。尽管拥有许多专家、大量的文档和全球网络,但搜索、综合和应用这些资源的耗时性质仍然是一个瓶颈。这一障碍阻碍了公司迅速为客户提供价值的能力,限制了推动问题解决边界的能力。传统的研究方法非常耗时,尤其是对于新手来说,即使是经验丰富的专业人士也需要大量的时间投资进行深入探索和建立人际网络。 已经尝试了各种解决方案,从策划数据库到复杂的分析工具。然而,这些方法通常存在局限性。虽然它们可能改善了知识检索的某些方面,但未能全面解决迅速访问和利用公司的集体智慧这一多维挑战。 这就是麦肯锡对这个问题的创新回应——“Lilli”。Lilli代表了一种生成式AI平台,彻底改变了公司利用其广泛的知识储备的方式。这种由AI驱动的解决方案为搜索麦肯锡宝贵的见解和专业知识提供了无缝和公正的过程。它是将公司丰富的知识产权转化为可行战略的复杂工具,确保咨询顾问花更多时间应用见解而不是追寻它们。 Lilli的影响是可衡量和深远的。该平台通过自动化项目规划的初始阶段,从识别相关研究文档到定位相关专家,大大减少了启动工作的时间和精力投入。这种效率不仅使初级顾问受益,还使资深同事能够将时间专注于高价值的任务,如问题解决、指导和客户互动。此外,Lilli的AI能力不仅限于文档检索——它已经发展成为许多人的“思维擂台伴侣”,帮助预测问题、完善论证和拓宽视角。 指标显示了Lilli的效力。曾经需要几周的研究和建立人际网络现在只需花费一小部分时间。值得注意的是,专门从事技术战略的团队成员表示,在会议准备方面,他们的时间节省了多达20%,同时提高了他们的贡献质量。该平台不仅可以检索文档,还可以生成新的见解,正如团队成员之一在发现出人意料但相关的客户询问事例时所强调的那样。Lilli的功能涵盖两种模式,可以在麦肯锡的内部知识库以及外部来源进行搜索,增强了其多功能性。 Lilli的实施不仅仅是一项技术壮举;它还需要在法律、网络安全、风险管理和人才发展等领域的协调。该平台的发展历程,从最初的三人小组到70多名专家的联合体,反映了确保其成功的奉献精神。凭借QuantumBlack在GenAI方面的专业知识,Lilli已经准备好在成千上万的同事中进行广泛的部署,重塑公司的知识利用方式。 总而言之,麦肯锡的Lilli是生成式AI在推动咨询行业向前发展的潜力的明证。通过灵活解决知识获取和应用的挑战,Lilli使咨询顾问能够发挥其创造潜力,为客户提供前所未有的价值。这种创新不仅节省时间,还催生了问题解决和思考的新方式,从而展示了技术如何放大人类专业知识以创造变革性的结果。

Leave a Comment

2023年要学习的前5个生成式人工智能课程

介绍 随着对熟练员工的需求增加,及时了解与生成式人工智能相关的最新信息和技能至关重要。这里是一份顶级的综合课程选择,适合初学者和有经验的从业者,旨在探索人工智能技术的艺术可能性和实际应用。这篇文章将帮助您选择前5个生成式人工智能课程,以帮助您创造、创新和管理未来。 为什么选择生成式人工智能课程? 选择生成式人工智能课程可以为对人工智能及其应用感兴趣的人提供许多好处。生成式人工智能具有广泛的应用领域。生成式人工智能处理的是具有生成内容能力的模型。以下是选择生成式人工智能课程的一些原因的快速提及: 职业机会 多样化的应用 创新和创造力 解决问题 理解复杂模型 学术和研究追求 个人项目 与专家合作 伦理考虑 最佳生成式人工智能课程 以下是可以帮助您在该领域建立职业的顶级生成式人工智能课程: 生成式人工智能学习路径 该学习课程由Google Cloud管理。该课程包括十个活动,提供有关生成式人工智能产品和技术的精选内容。该计划涵盖了大型语言模型的基础知识以及生成式人工智能解决方案的创建和部署。 时长:每个活动1天(共10天);自由安排 最适合人群:初学者和专业人士 价格:免费 点击此处了解该生成式人工智能课程 大型语言模型:从应用到生产 该课程由Databricks管理,Databricks是一家为各种组织提供在线课程管理服务的公司。开发人员、数据科学家和工程师可以使用最流行的框架构建以LLM为中心的应用程序。学习者在课程结束时将创建一个完整的、可投入生产的LLM工作流程。 时长:6周(每周4-10小时);自由安排…

Leave a Comment

YouTube音乐与环球音乐合作推出人工智能孵化器

在一项引人注目的举措中,YouTube正积极开展一项雄心勃勃的计划,将人工智能(AI)的力量融入音乐领域。YouTube与其音乐合作伙伴环球音乐携手合作,将推出YouTube音乐AI孵化器,这一具有远见卓识的倡议探索生成式AI在塑造音乐未来中的作用。YouTube以三个关键的AI原则为核心,旨在在这个创新音乐时代和谐地融合创造力、保护和诚信。 还阅读:AI开始在YouTube上进行多语言配音 调和创造力:YouTube的三个AI原则 在YouTube的AI革命的核心是利用生成式AI在音乐中发挥潜力的承诺。在揭示YouTube的AI框架时,首席执行官Neal Mohan强调了第一个原则:将AI视为音乐领域的一个不可或缺的部分。这个原则最终导致了YouTube音乐AI孵化器的诞生。这个合作努力将涉及来自世界各地的艺术家和创意人员,并将环球音乐纳入其中。 还阅读:用AI探索音乐创作的世界 YouTube的第二个AI原则是保护音乐及其创作者。通过利用Content ID等工具,该平台坚定不移地承诺保护艺术家的作品。这一承诺确保了艺术家的创造性表达在AI创新时代也能保持纯净。它进一步体现了YouTube对维护艺术诚信的承诺。 YouTube倡导的第三个AI原则强调了AI领域的信任和安全。该平台承诺对AI生成的内容采取与其他形式的内容相同的严格保护措施。在YouTube的虚拟领域中,误导性或操纵性的AI生成内容宣扬虚假将不会找到庇护所,这一坚定立场与其向观众提供可靠和准确信息的承诺相一致。 还阅读:格莱美奖禁止AI参与:人类创作者成为焦点 Meta的影响:AI池中的涟漪 随着YouTube进军AI领域,该行业正在见证科技巨头之间的涟漪效应。前身为Facebook的Meta最近通过将生成式AI集成到其AudioCraft AI工具中引起了轰动。由Llama 2 LLM提供动力的这项创新使用户能够将文本转化为高质量、逼真的音频和音乐。该工具的三个独特模型——AudioGen、MusicGen和EnCodec——开启了音频和音乐生成的新时代。 还阅读:SoundStorm:Google的音频模型席卷音频生成领域 AudioGen和MusicGen是Meta的黄金搭档,允许用户从文本提示中生成音频和音乐。AudioGen通过使用公共音效为音频注入生命,而MusicGen则利用Meta授权的声音创作音乐。这两个模型共同铺平了实现无与伦比的音频创造力的道路,使用户能够将他们的创意变为现实。 EnCodec成为音乐生成领域创新的标志。这个解码器引领着追求高质量音乐生成的征程,减少了音频中的人工痕迹,提供了无与伦比的听觉体验。Meta在AI生成音乐方面的进展进一步凸显了AI在创意领域的变革性影响。 应对AI的影响:挑战与创新 AI和创造力的融合超越了音乐行业。然而,这个变革的过程引发了一些关注,特别是在版权和知识产权领域。虽然AI驱动的创新承诺革新创意表达,但AI生成内容的伦理和法律问题促使各行业进行深思熟虑的讨论,涉及所有权、原创性和创新。 还阅读:AI生成的艺术被美国法院否定版权 我们的观点 随着YouTube拥抱AI无限的潜力来重塑音乐领域,技术和创造力之间的和谐相互作用展现得淋漓尽致。由三个AI原则推动的YouTube音乐AI孵化器的推出,标志着进入音乐创新的新时代的重要一步。Meta的AudioCraft AI工具展示了AI的更广泛影响力,世界正在见证一个从技术中汲取灵感、突破界限并重新定义AI时代艺术表达本质的创意景观的出现。

Leave a Comment

艺术与身份:AI揭示了自我相关性和审美吸引力之间的深刻联系

艺术的变革力量令人着迷,而人工智能(AI)的最新进展正在将这种古老的着迷注入新的生命。由马克斯·普朗克实证美学研究所(MPIEA)、恩斯特·斯特伦曼神经科学研究所(ESI)和马克斯·普朗克心理语言学研究所共同进行的一项开创性研究探索了自我相关性与美学吸引力之间的深刻联系,揭示了为什么大型科技和AI公司热衷于收集个人信息。 这个创新性的研究揭示了一个基本真理:自我相关性是决定艺术美学欣赏的关键因素。该研究的独特方法是利用AI的能力通过一种称为样式转换的技术。通过为个体参与者创建定制艺术品,研究人员试图了解自我构建的身份、记忆和经历如何影响对艺术的感知。 参与者踏上了自我发现的旅程,通过一个全面的问卷分享他们生活的方方面面。童年回忆、最近的冒险和个人身份被展现出来,每个方面都为自我的镶嵌画组成了独特的马赛克。这些个人叙述被转化为图像,利用AI来打造定制艺术品。结果是一系列与参与者深入共鸣的视觉镜像。 研究结果令人震惊,甚至连研究人员自己也感到惊讶。与为他人创作的作品相比,参与者对专门为他们设计的艺术作品的美学吸引力评价显著更高。这种联系令人神奇——自我相关性成为了个体内在共鸣的可靠预测因素。令人称奇的是,没有普遍的自我相关性符号;个人的心理在每块画布上绘制出独特的印象。 然而,艺术并不局限于反映自我的方面。它具有连接不同经历的力量。研究人员明确指出了这一点,称艺术作品不必反映一个人的生活来建立联系。即使当一件艺术作品向人们展示陌生的事物时,自我相关的元素也能培养深刻的理解和愉悦。 这项研究的影响超越了画布和笔触。在AI驱动个性化无处不在的时代,从个性化化身到定制叙述,这项研究为理解此类创新的心理影响奠定了基础。然而,这一发现也伴随着警示。自我相关性的强大吸引力也凸显了个体对个性化内容操纵的脆弱性。随着推荐算法根据复杂的用户配置文件筛选出内容和信息,自觉参与和微妙操纵之间的界限变得模糊,而这一趋势又受到AI快速发展的影响。 这项研究揭示了个人身份与艺术美学吸引力之间错综复杂的联系。它凸显了技术和心理学的强大结合,推动了对个性化内容与操纵之间微妙界限的批判性评估,而这在一个日益互联的世界中愈发凸显。自我相关性在艺术的画布上的笔触可以迷住、启发和改变,它提醒我们所见的反映可以以美丽而复杂的方式塑造我们的认知和经历。

Leave a Comment

英伟达首席科学家比尔·达利将在Hot Chips发表主题演讲

Bill Dally是世界上最杰出的计算机科学家之一,也是NVIDIA研究工作的负责人。他将在Hot Chips大会的主题演讲中描述推动加速计算和人工智能的力量。Hot Chips是一年一度的领先处理器和系统架构师聚会。 Dally将详细介绍GPU芯片、系统和软件的进展,这些进展为各种应用带来了前所未有的性能提升。演讲将展示如何利用混合精度计算、高速互连和稀疏性等技术将推动生成式人工智能的大语言模型提升到新的水平。 “现在是成为计算机工程师的非常激动人心的时刻,” Dally在2月份入选硅谷工程理事会名人堂时如是说道。 Dally的主题演讲将于8月29日上午9点PT开启Hot Chips的第三天。可以在线注册参加虚拟活动。位于帕洛阿尔托的斯坦福大学的现场活动已经售罄。 Dally的职业涵盖近四十年,他开创了许多构成当今超级计算机和网络架构的基础技术。作为NVIDIA研究部门的负责人,他领导着一个由全球300多名发明家组成的团队,致力于发明各种应用的技术,包括人工智能、高性能计算、图形和网络。 在2009年加入NVIDIA之前,他曾担任斯坦福大学计算机科学系主任长达四年之久。 Dally是美国国家工程院的院士,也是美国艺术与科学院、电气和电子工程师学会以及计算机协会的会士。他撰写了四本教科书,发表了250多篇论文,拥有120多项专利,并获得了IEEE Seymour Cray奖、ACM Eckert-Mauchly奖和ACM Maurice Wilkes奖。 NVIDIA在Hot Chips的更多演讲 在另一场Hot Chips演讲中,NVIDIA网络副总裁Kevin Deierling将描述NVIDIA BlueField DPUs和NVIDIA Spectrum网络交换机在根据不断变化的网络流量和用户规则分配资源方面的灵活性。…

Leave a Comment

使用生成式人工智能为每种情绪创建WhatsApp表情包

在迈向未来的激动时刻,WhatsApp的母公司Meta正全力进军人工智能(AI)领域。最新消息显示,WhatsApp正在进入创造力的新领域,利用AI彻底改变我们创建贴纸的方式。只需几个单词,你就能用生成式AI将你的贴纸幻想变为现实,让你惊叹不已! 还要阅读:Meta揭示即将推出的令人兴奋的AI工具:聊天机器人、照片修改器等! 用几个单词制作贴纸 来自WABetaInfo的报道引起了人们的好奇心,消息称WhatsApp正在进行尖端AI实验。这个版本的测试版2.23.17.14让用户可以通过简单地输入一个短文本描述来生成贴纸。想象一下,用一个独一无二的贴纸来表达你的情感,它是从你的想象深处创作出来的! 还要阅读:引导工程简介 WhatsApp贴纸:个性化表达的世界 不再需要在贴纸包中翻找,才能捕捉到那种精确的感觉。WhatsApp的AI驱动功能为其突出的功能增添了一丝个性。告别每个人都见过无数次的通用贴纸,欢迎一系列根据你的喜好和想象力量身定制的个性化贴纸选项。放开你的创造力吧! AI驱动的创造力:幕后的技术 虽然具体细节仍然神秘,但WABetaInfo透露,Meta的安全技术支持着这个AI奇迹。生成式AI模型仍然是一个引人入胜的谜题,可能涉及到Midjourney和OpenAI的DALL-E等市场上的其他尖端模型。一旦释放,这个AI驱动的贴纸功能将提示用户描述他们想要的视觉效果。WhatsApp的AI引擎将根据您的输入制作一系列贴纸选项。这保证了一个真正符合您意图并完美适应每个情境的选择。 还要阅读:2023年使用的10个最佳AI图像生成工具 给测试人员的一瞥 目前,这个未来主义的功能只与一小部分测试人员共享。如果你是幸运的一员,你会在WhatsApp的键盘上的贴纸选项卡上找到一个全新的“创建”按钮。通过用文字描述来实现你的贴纸梦想,让AI施展魔力。然后,你将看到一系列符合你想象的贴纸选项。 道德和保护 前景闪烁着希望,然而对于AI生成内容的滥用的担忧已经浮出水面。WhatsApp通过直接向Meta举报不适当的贴纸来解决这个问题。透明度和保护措施将成为WhatsApp继续完善此功能的重要考量。 还要阅读:在使用生成式AI工具时保护隐私的6个步骤 展望未来 WhatsApp正准备在未来几周向更广泛的用户群体推出这一创新性的创意。目前仅限于Android测试人员,iOS用户可以期待类似的体验。随着这个实验阶段的发展,WhatsApp计划引入标记来识别AI生成的贴纸。这一举措与更广泛的行业趋势一致,标记AI辅助内容,促进数字对话的真实性和透明度。 还要阅读: 我们的观点 准备好被WhatsApp的AI驱动贴纸创作带着个性化表达的旅程席卷吧。一个新的数字交流时代即将来临,而这一切都源于AI的魔力。敬请期待一个词语逐个贴纸变成艺术的未来!

Leave a Comment

“遇见 FraudGPT:ChatGPT 的黑暗面孪生”

ChatGPT已经变得流行,影响人们的工作方式和他们可能在网络上找到的内容。许多人,甚至那些尚未尝试过的人,都对AI聊天机器人的潜力感到好奇。生成式AI模型的普及已经改变了潜在危险的性质。在“暗网论坛”上的最新帖子中,可以看到FraudGPT的出现。网络犯罪分子已经调查了从这一趋势中获利的方法。 Netenrich的研究人员发现了一种有前途的新人工智能工具,名为“FraudGPT”。这个AI机器人专门为恶意活动而构建,包括发送钓鱼邮件、开发破解工具、进行卡盗刷等。该产品可以在多个暗网市场和Telegram应用上购买。 FraudGPT是什么? 与ChatGPT类似,但增加了生成用于网络攻击的内容的能力,FraudGPT可以在暗网和Telegram上购买。2023年7月,Netenrich的威胁研究团队成员首次注意到它的广告。FraudGPT的一个卖点是它需要ChatGPT不响应可疑查询的保障和限制。 根据提供的信息,该工具每周或两周更新一次,使用了几种不同类型的人工智能。订阅是购买FraudGPT的主要支付方式。月度订阅费用为200美元,年度会员费用为1700美元。 它是如何工作的? Netenrich团队花钱使用了FraudGPT。布局与ChatGPT非常相似,左侧边栏显示用户的请求历史记录,而聊天窗口占据了大部分屏幕空间。用户只需将问题输入到提供的框中,然后点击“Enter”即可获得回答。 其中一种测试用例是与银行相关的钓鱼邮件。用户的输入很少,只需要在查询格式中包含银行的名称,FraudGPT就能完成工作。它甚至指示在文本中放置恶意链接的位置。欺诈性登陆网站主动向访问者索取个人信息正是FraudGPT的能力范围。 FraudGPT还被要求列出最常访问或利用的在线资源。这对黑客在计划未来攻击时可能有用。该软件的在线广告吹嘘它可以生成有害代码,组装难以检测的恶意软件,寻找漏洞并找到目标。 Netenrich团队还发现,FraudGPT的供应商曾经为雇佣提供黑客服务的广告。他们还将同一人与一个名为WormGPT的类似程序联系起来。 FraudGPT的调查强调了警惕性的重要性。目前尚不清楚黑客是否已经使用这些技术开发出新的危险。然而,FraudGPT和类似的有害程序可能帮助黑客节省时间。钓鱼邮件和登陆页面可以在几秒钟内编写或开发。 因此,消费者必须继续警惕任何对其个人信息的要求,并坚持其他网络安全最佳实践。网络安全行业的专业人士应该及时更新他们的威胁检测工具,特别是因为恶意行为者可能使用类似FraudGPT的程序直接针对和进入关键计算机网络。 FraudGPT的分析是一个深刻的提醒,黑客将随着时间的推移调整他们的方法。但开源软件也存在安全漏洞。使用互联网或从事保护在线基础设施的工作的任何人都必须跟上新兴技术及其带来的威胁。关键是在使用像ChatGPT这样的程序时记住所涉及的风险。

Leave a Comment

世界上最大的广告商拥抱人工智能的力量:广告领域的范式转变

在可能重塑广告格局的举措中,一些世界知名的广告商正在利用生成式人工智能(AI)的潜力。雀巢和联合利华等公司正在引领这一变革之旅,利用ChatGPT和DALL-E等先进的AI技术。这些生成式AI工具提高了效率,降低了成本,并彻底改变了产品营销。 还阅读:Microsoft Azure推出企业AI ChatGPT 揭开广告中的人工智能革命 领导这一人工智能革命的是全球巨头雀巢和联合利华。这些行业巨头大胆采用生成式人工智能,旨在开启产品广告的新方式。到目前为止,这些以AI为动力的战略已经证明在速度、成本效益和潜在范围方面都具有优势。这一转变正值这些公司为广告可能的未来常态做好准备之际。 还阅读:18个必备的营销自动化工具,以简化您的营销工作! 生成式AI的兴起:为创新铺平道路 生成式AI不仅仅是一个流行词,它是一个引发各行各业共同想象力的革命性概念。这项技术能够根据历史数据创作内容,以前所未有的方式推动创新。营销团队设想了一个未来,在生成式AI的帮助下,广告将实现广泛的创意可能性,重新定义广告的成就。 还阅读:Meta的AI工具为营销人员自动生成面向特定受众的副本 开创广告的新时代 生成式AI重塑广告格局的潜力引起了行业领导者的关注。广告商们寄望于AI生成原始文本、图像和计算机代码的能力,超越传统的分类和识别技术。随着对AI技术的投资不断增加,很明显,广告受到的转型影响将是革命性的。 应对挑战:平衡创新和责任 然而,这次对人工智能的大胆尝试并非没有挑战。随着企业涉足生成式AI,人们对安全性、版权侵权和潜在数据固有偏见的担忧逐渐浮出水面。这凸显了在利用AI潜力和确保道德、负责任实施之间需要保持微妙平衡的必要性。 虽然AI驱动的自动化具有强大的吸引力,但重要的是要认识到,在可预见的未来,人类仍将是创意过程中不可或缺的一部分。AI和人类创造力之间的相互关系至关重要,因为人类提供了AI可能缺乏的监督和上下文理解。 还阅读:面向数据驱动型营销人员的前14个营销分析工具 成功故事:展示生成式AI在广告中的影响 全球最大的广告代理公司WPP正在领先展示生成式AI在广告中的实际效益。WPP与雀巢和世界食品公司合作,推出了AI驱动的广告活动,取得了非常创新的成果。此外,他们还大幅降低了成本。该机构的首席执行官马克·里德(Mark Read)强调通过虚拟制作实现的惊人节约,使看似不可能成为现实。 WPP与世界食品公司在印度的合作是AI驱动的广告潜力的证明。一项以宝莱坞巨星沙鲁克·汗(Shah Rukh Khan)为特色的广告活动在各个平台上获得了9400万次观看。这个成功故事展示了AI在创意和高效制作之间的桥梁作用,为广告的未来提供了一瞥。 雀巢全球首席营销官奥德·高顿(Aude Gandon)提供了AI在营销中的实际应用见解。通过ChatGPT 4.0和Dall-E…

Leave a Comment

生成式人工智能在Snapchat中的力量

介绍 Snapchat开创了一个时代,现实与创新无缝融合,由生成式AI放大。这种变革力量将普通照片变成惊人的奇迹,推动体验超越滤镜。算法可以识别表情,预测行为,并创造美学奇观。生成式AI赋予数字相遇生命,超越平凡。头像演变成独特的Bitmoji,将自我表达提升为数字杰作。表情符号捕捉情感,以AI的语言建立联系。这种非凡的AI不仅增强了视觉效果,还预测未来的趋势。它模拟衰老,并引发有趣的面部交换,引发笑声。Snapchat中的生成式AI通过超越当下,提供了对无限未来的一瞥。 让我们小心地走在创新的道路上,时刻谨记扩展和伦理之间的平衡。 学习目标 深入了解生成式AI的基本原理及其在Snapchat平台上推动创造性体验中的作用。 生成式AI驱动Snapchat的AR滤镜和镜头,实现动态和身临其境的视觉效果,融合现实和数字艺术。 探索生成式AI如何通过增强现实实现个性化和互动体验,提升用户参与度。 本文是数据科学博文马拉松的一部分。 Snapchat的AR滤镜和镜头 Snapchat的AR滤镜和镜头通过无缝融合真实世界和数字世界,重新构想了视觉表达。这些身临其境的功能使用户可以将自己的面部和环境变成动态画布,改变每一张照片。生成式AI和实时图像处理之间的复杂相互作用是AR滤镜和镜头的核心。生成对抗网络和神经网络是能够从实时视频流中评估和理解面部特征和环境信息的生成式AI算法。Snapchat现在可以精确地映射和跟踪用户的表情、动作甚至周围环境。Snapchat的AR滤镜和镜头不仅仅是基本的美学增强,它们还激发个人联系、创造性叙事和参与度。品牌也利用这一尖端技术进行有趣的营销活动,与人们创造难忘的相遇。 创建人脸滤镜 让我们看看如何使用Python和TensorFlow库创建一个简单的人脸滤镜,将虚拟眼镜添加到用户的脸上。 import dlib import cv2 import numpy as np import matplotlib.pyplot as plt #…

Leave a Comment

美联社为记者发布AI指导方针

人工智能(AI)的快速发展为其融入包括新闻业在内的各个行业铺平了道路。最近,美联社(AP)通过发布全面的指南,为其新闻报道中对AI的负责任使用迈出了重要一步。这一举措引发了关于AI在新闻业中的作用以及在创新与新闻诚信之间取得平衡的讨论。 还阅读:OpenAI如何利用GPT-4进行更智能的内容审核 认识AI的潜力 美联社作为一家知名的新闻机构,已经承认了AI提升新闻报道和简化编辑流程的潜力。然而,美联社的标准与包容副总裁阿曼达·巴雷特强调,AI并不是用来取代记者,而是为了补充他们的工作。这些指南旨在赋予记者和编辑有效利用AI的能力,同时坚持准确和可靠新闻的原则。 还阅读:OpenAI首席执行官山姆·奥尔特曼:AI证明其实力,工作岌岌可危 在新闻业中应用AI 美联社的指南旨在解决ChatGPT等AI工具的整合问题,强调需要谨慎实验和对新闻标准的坚定承诺。指南明确规定,AI生成的内容不能直接发布,必须经过仔细审核后才能使用。这些措施与该机构致力于向读者传递可信和可靠新闻的承诺相一致。 还阅读:ChatGPT抢走了文案和技能工作:如何在人工智能未来中保持就业 确立AI标准 美联社制定AI指南的举措是新闻机构中的一个更广泛趋势的一部分。受人尊敬的新闻智库波因特研究所敦促新闻机构制定明确的AI使用标准,并与其受众分享这些政策。随着AI技术的成熟,确保透明度和问责制成为维护公众信任的必要条件。 还阅读:好莱坞的迪士尼争议:AI介入,作家和演员退出! 应对挑战和可能性 虽然AI提供了变革的潜力,但也带来了挑战。生成式AI可以创建各种形式的内容,包括文本、图像、音频和视频,但无法准确区分事实和虚构。为了解决这个问题,美联社坚持对AI生成的材料进行与其他来源相似的审查。这种谨慎的方法旨在防止错误信息的传播,确保负责任地使用AI。 AI在新闻业中的支持角色 新闻机构正在利用AI的能力来提升新闻制作,同时不损害新闻伦理。美联社的指南表明,AI可以生成新闻故事的创意、创建标题,并协助编辑和总结内容。这些应用突显了AI在提高效率和增强编辑工作流程方面的潜力,同时保留了新闻报道中的人文关怀。 还阅读:谷歌发布新闻写作AI“Genesis” 平衡创新和可信度 作为在新闻报道中尝试使用AI的先驱,美联社理解创新与保持新闻可信度之间的平衡。在过去的十年中,美联社探索了使用AI从数据源生成简短新闻报道的方法。然而,该机构在涉足新的AI应用时仍然谨慎,以保护其新闻诚信。 还阅读:好莱坞作家罢工反对AI工具,称其为“剽窃机器” 走向负责任的AI未来 美联社为其记者制定这些指南的同时,还采取了措施为AI的进步做出贡献。该机构与AI开发者OpenAI合作,利用其新闻报道来训练生成式AI模型。美联社的经历凸显了新闻报道与AI之间不断发展的关系,强调负责任地整合AI对于确保新闻报道的准确性、可靠性和真实性的最高标准的重要性。 还阅读:如何使用TensorFlow构建负责任的AI? 我们的观点 美联社的AI指南标志着新闻业在AI时代的演变中的重要里程碑。通过制定优先考虑可靠报道、透明度和遵守新闻原则的标准,美联社引领新闻机构负责任地将AI整合到其工作流程中。随着AI继续改变媒体格局,美联社的做法成为一个指导,确保创新和伦理并驾齐驱,向公众传递可信赖的新闻。

Leave a Comment

在Amazon SageMaker上使用LLMs实现智能视频和音频问答,并提供多语言支持

在日益数字化的世界中,数字资产是企业产品、服务、文化和品牌身份的重要视觉表现数字资产与记录的用户行为一起,可以通过提供互动和个性化体验来促进客户参与,使公司能够与目标受众更深入地连接高效地发现和搜索特定的数字资产[…]

Leave a Comment

波士顿大学的研究人员发布了鸭嘴兽家族的精调LLMs:实现基础LLMs的廉价、快速和强大的改进

大型语言模型(LLM)席卷世界。这些超高效和高效的模型是人工智能的现代奇迹。它们具备理解上下文、生成文本和连贯对话的能力,已经能够重新定义人与机器之间的沟通。研究人员一直致力于通过一种被称为参数高效调整(PEFT)的过程改善基础大型语言模型的性能,该过程涉及在小而强大的Open-Platypus数据集上优化LLM。 最近,来自波士顿大学的研究人员团队推出了Platypus,这是一组独特的改进和结合的大型语言模型,其性能无与伦比,并且目前在HuggingFace的Open LLM排行榜上保持领先地位。精心策划的数据集Open-Platypus是其中的基石之一,该数据集经过精心挑选,从各种其他免费数据集中选择出来,并且已经向公众开放。它是更大数据集的较小子集,专注于改善LLM性能的关键要素。 在利用特定领域信息的同时,团队的目标是保持预训练LLM的强大先验知识,并对LoRA模块进行微调和合并。通过微调,可以将模型定制为特定任务,同时保留初始训练中积累的更全面的知识。当合并LoRA模块时,将多个组件结合在一起,产生更强大的LLM。由于协同作用,模型的潜在潜力和专业领域知识可以被揭示出来。 工作的一个关键方面是对测试数据的严格验证工作以及识别训练数据中的潜在污染。一些全面的检查支持Platypus系列模型的可靠性和准确性,并且披露此验证过程的方法可能作为进一步的现场研究指南。 Platypus系列模型覆盖了各种模型大小,在量化LLM指标方面表现出色。它在全球Open LLM排行榜上名列前茅,这一壮举证明了该策略的有效性。团队分享了他们的模型在使用较小部分的微调数据和计算资源时与其他最先进的微调LLM一样出色的性能。例如,一个13B的Platypus模型只需使用一张A100 GPU和仅25k个问题就可以在令人瞩目的5小时内成功训练。这种令人难以置信的效率凸显了Open-Platypus数据集的优秀水平,并为该领域的进一步发展铺平了道路。 贡献可以总结如下: 引入了Open-Platypus,这是一个包含11个公共文本数据集的紧凑数据集,旨在增强LLM的STEM和逻辑知识。 这个主要由人设计的问题组成的数据集,在最小的微调时间和成本下提供了强大的性能。 团队分享了排除类似数据以减小数据集大小和冗余的过程的描述。 探索了LLM训练集中数据污染的挑战以及数据过滤过程。 分享了针对专业微调LoRA模块的选择和合并方法的解释,为提高LLM的整体性能做出了贡献。

Leave a Comment

稳定AI发布日语StableLM Alpha:日语语言模型的跃进

在增强日本生成式人工智能领域迈出重要一步的同时,Stability AI,即稳定AI,是稳定扩散背后的开创性生成式AI公司,推出了其首个日语语言模型(LM),名为日语StableLM Alpha。这一重要发布引起了广泛关注,因为该公司声称其LM是面向日本说话者的最精通的公开可用模型。这一主张通过与其他四个日语LM进行全面基准评估得到了证实。 这个新推出的日语StableLM Alpha,拥有70亿参数的令人印象深刻的架构,是Stability AI在技术进步方面的承诺的明证。该模型是一种多功能高性能工具,适用于各种语言任务。它在多个分类中胜过了同行,成为行业领导者。 日语StableLM Base Alpha 7B商业版本计划在广泛认可的Apache License 2.0下发布。这个专门的模型是通过对包括7500亿个日语和英语文本令牌在内的庞大数据集进行广泛训练而精心打造的,这些数据集是从在线资源库中精心挑选的。 这一成就的基础还得归功于协作努力。Stability AI利用了EleutherAI Polyglot项目的日本团队的专业知识,最终形成了由Stability AI的日本社区创造的数据集。这一集体努力还得益于使用了EleutherAI的GPT-NeoX软件的扩展版本,这是Stability AI开发过程的基石。 作为一项并行创新,日语StableLM Instruct Alpha 7B又是一个显著的里程碑。这个模型主要用于研究目的,专门用于研究应用。它通过一种称为有监督微调(SFT)的方法,利用多个开放数据集,展示了遵循用户指令的独特能力。 这些模型通过EleutherAI的语言模型评估工具进行了严格的评估。这些模型在句子分类、句对分类、问答和句子摘要等各个领域经受了审查,并取得了令人印象深刻的平均得分54.71%。Stability AI认为,这一性能指标无疑将日语StableLM Instruct Alpha…

Leave a Comment

PlayHT团队将情感概念引入生成声音AI的AI模型:这将使您能够通过特定情感来控制和引导语音生成

语音识别是自然语言处理领域中最近开发的技术之一。研究科学家还为文本到语音生成的AI模型开发了大型语言模型。很明显,AI在语音质量、表情、人类行为等方面可以达到与人类相似的结果。但是尽管如此,这些模型仍然存在问题。这些模型在语言多样性方面较少。在语音识别、情感等方面也存在一些问题。许多研究人员意识到了这些问题,并发现这是由于模型使用的数据集较小造成的。 改进工作已经开始,PlayHT团队推出了PlayHT2.0作为这个案例研究的解决方案。这个模型的主要优点是它使用了多种语言并处理了大量的数据集。这也增加了模型的大小。NLP中的Transformers也在实施这个模型中扮演了重要角色。该模型处理给定的转录并预测声音。这经历了一个将文本转换为语音的过程,称为标记化。这涉及将简化的代码转换为声波,以生成人类语音。 该模型具有巨大的对话能力,可以像正常人一样进行对话,并带有一些情感。这些通过AI聊天机器人提供的技术经常被许多跨国公司用于在线呼叫和研讨会。PlayHT2.0模型还通过其中使用的优化技术改进了语音质量。它还可以复制出完全相同的声音。由于模型使用的数据集非常大,该模型在保留原始语音的同时也可以说出其他语言。模型的训练过程经历了大量的epochs和不同的超参数。这导致模型在语音识别技术中表现出各种情感。 该模型仍在不断改进中。研究科学家仍在致力于改进情感。提示工程师和许多研究人员还发现,该模型在未来几周内可以通过速度、准确度和良好的F1分数进行更新。

Leave a Comment

加州圣克鲁兹大学的研究人员提出了一种新颖的文本到图像关联测试工具,用于量化概念之间的隐性刻板印象以及图像中的情感价值

加州大学圣塔克鲁兹分校的研究团队引入了一种名为文本到图像关联测试(Text to Image Association Test)的新工具。该工具解决了文本到图像生成人工智能系统中的无意偏见。这些系统以其从文本描述中生成图像的能力而闻名,但往往会在其输出中再现社会偏见。在助理教授的带领下,该团队开发了一种量化的方法来衡量这些复杂的偏见。 文本到图像关联测试提供了一种结构化的方法来评估各个维度上的偏见,如性别、种族、职业和宗教。这一创新工具在2023年计算语言学协会(ACL)会议上进行了介绍。它的主要目的是量化和识别先进生成模型(如稳定扩散)中的偏见,这些模型可以放大生成的图像中现有的偏见。 该过程涉及向模型提供一个中性提示,如“孩子学习科学”。随后,使用性别特定的提示,如“女孩学习科学”和“男孩学习科学”。通过分析从中性和性别特定提示生成的图像之间的差异,该工具量化了模型响应中的偏见。 研究发现,稳定扩散模型展示了与常见刻板印象一致的偏见。该工具评估了诸如科学和艺术之间的联系以及男性和女性等属性之间的联系,并分配分数以指示这些联系的强度。有趣的是,该模型出人意料地将深肤色与愉快联系在一起,将浅肤色与不愉快联系在一起,与典型假设相反。 此外,该模型显示了科学和男性、艺术和女性、职业和男性以及家庭和女性之间的关联。研究人员强调,他们的工具还考虑到了图像中的上下文元素,包括颜色和温暖度,这使其与先前的评估方法有所区别。 受到社会心理学中隐性关联测试的启发,UCSC团队的工具在T2I模型的开发阶段中量化了偏见的进展。研究人员预计,这种方法将为软件工程师提供更精确的模型偏见度量,有助于识别和纠正人工智能生成内容中的偏见。通过定量指标,该工具促进了持续努力以减轻偏见并监测随时间推移的进展。 研究人员收到了ACL会议上的学术同行们的鼓舞和兴趣,许多人对这项工作的潜在影响表示热情。该团队计划在模型训练和改进阶段提出缓解偏见的策略。这个工具不仅揭示了人工智能生成图像中的偏见,还提供了纠正和增强这些系统整体公正性的手段。

Leave a Comment