Press "Enter" to skip to content

四海吧 Posts

证明就在云端:GeForce NOW宣布Ultimate KovaaK’s挑战赛结果

裁决已出:GeForce NOW 终极会员提升了游戏的标准。会员们已经全力应对终极 KovvaK 挑战,并亲眼见证了终极的力量如何以每秒 240 帧的流媒体提高他们的游戏体验。 这款受欢迎的训练游戏本周在云端全面上线,并附有 Steam 的限时折扣。KovaaK’s 还将有超过 20 款新游戏加入 GeForce NOW 游戏库。 游戏玩家在 QuakeCon 上尽显身手 终极引领潮流。 大批 PC 游戏爱好者在上周末纷纷涌向 QuakeCon 上的…

Leave a Comment

NTU和SenseTime的研究人员提出了SHERF:一种可泛化的人体NeRF模型,用于从单个输入图像恢复可动画的3D人体模型

人工智能和深度学习领域一直在快速发展。从基于自然语言处理的大型语言模型到使用计算机视觉概念的文本到图像模型,AI已经取得了长足的进步。通过使用人类神经辐射场(NeRFs),可以在不需要精确的3D几何数据的情况下从2D照片重建高质量的3D人体模型。这一发展对于增强现实(AR)和虚拟现实(VR)等多个应用具有重要影响。人类NeRFs可以加快从2D观察创建3D人体模型的过程,减少了获取真实3D数据所需的时间和资源。 目前大多数使用NeRFs重建3D人体模型的技术使用单眼电影或从不同角度使用多视角相机拍摄的多个2D照片。由于这种方法在真实世界中使用时存在缺点,即人们的照片是从随机的相机角度拍摄的,因此这给产生准确的3D人体重建带来了相当大的障碍。为了解决这些问题,研究团队提出了SHERF,这是第一个能够从单个输入图像中恢复动画3D人体模型的通用化Human NeRF模型。 SHERF在一个标准化的空间中运作,它可以从任意自由视角和姿势渲染和动画化重建的模型。这与传统技术形成对比,传统技术主要依赖固定的相机角度。编码的3D人体表示包括详细的局部纹理和全局外观信息,可以成功高质量地合成视角和位置。这是通过使用一种具有多种特征的3D感知分层特征库的概念来实现的,这些特征旨在使全面编码更加容易。 团队提到了三个层次的分层特征,即全局特征、点级特征和像素对齐特征。每个特征都有不同的功能,单个输入图像获取的信息旨在通过全局特征进行改进,全局特征试图弥补不完整的2D观察留下的空白。而像素对齐特征负责保留有助于模型整体正确性和逼真性的更小细节,点级特征提供了底层3D人体解剖的重要信号。 团队开发了一种称为特征融合变压器的设备,用于高效地组合这些3D感知分层特征,这个变压器被制作成可以组合和利用多种分层特征类型的形式,确保编码表示尽可能全面和丰富。对多个数据集(包括THuman、RenderPeople、ZJU_MoCap和HuMMan)进行了全面的测试,以展示SHERF的有效性。研究结果表明,SHERF在合并独特视角和位置方面显示出高于现有最先进水平的性能。 团队总结了主要贡献如下: 引入了SHERF,这是第一个从一张图像中恢复动画3D人体模型的通用化Human NeRF模型。 通过适应更广泛的背景,扩展了Human NeRF在现实世界场景中的适用性。 SHERF使用3D感知分层特征,捕捉了细粒度和全局属性。这使得可以恢复详细纹理并填补不完整观察中的信息空缺。 SHERF在超越以前的通用化Human NeRF方法方面表现出色,并在广泛的数据集中实现了优越的视角和姿势合成结果。 总之,这项令人惊叹的研究无疑代表了在3D人体重建领域迈出的重要一步,特别是在从随机相机角度获取照片带来特定困难的真实世界情况下。

Leave a Comment

美联社为记者发布AI指导方针

人工智能(AI)的快速发展为其融入包括新闻业在内的各个行业铺平了道路。最近,美联社(AP)通过发布全面的指南,为其新闻报道中对AI的负责任使用迈出了重要一步。这一举措引发了关于AI在新闻业中的作用以及在创新与新闻诚信之间取得平衡的讨论。 还阅读:OpenAI如何利用GPT-4进行更智能的内容审核 认识AI的潜力 美联社作为一家知名的新闻机构,已经承认了AI提升新闻报道和简化编辑流程的潜力。然而,美联社的标准与包容副总裁阿曼达·巴雷特强调,AI并不是用来取代记者,而是为了补充他们的工作。这些指南旨在赋予记者和编辑有效利用AI的能力,同时坚持准确和可靠新闻的原则。 还阅读:OpenAI首席执行官山姆·奥尔特曼:AI证明其实力,工作岌岌可危 在新闻业中应用AI 美联社的指南旨在解决ChatGPT等AI工具的整合问题,强调需要谨慎实验和对新闻标准的坚定承诺。指南明确规定,AI生成的内容不能直接发布,必须经过仔细审核后才能使用。这些措施与该机构致力于向读者传递可信和可靠新闻的承诺相一致。 还阅读:ChatGPT抢走了文案和技能工作:如何在人工智能未来中保持就业 确立AI标准 美联社制定AI指南的举措是新闻机构中的一个更广泛趋势的一部分。受人尊敬的新闻智库波因特研究所敦促新闻机构制定明确的AI使用标准,并与其受众分享这些政策。随着AI技术的成熟,确保透明度和问责制成为维护公众信任的必要条件。 还阅读:好莱坞的迪士尼争议:AI介入,作家和演员退出! 应对挑战和可能性 虽然AI提供了变革的潜力,但也带来了挑战。生成式AI可以创建各种形式的内容,包括文本、图像、音频和视频,但无法准确区分事实和虚构。为了解决这个问题,美联社坚持对AI生成的材料进行与其他来源相似的审查。这种谨慎的方法旨在防止错误信息的传播,确保负责任地使用AI。 AI在新闻业中的支持角色 新闻机构正在利用AI的能力来提升新闻制作,同时不损害新闻伦理。美联社的指南表明,AI可以生成新闻故事的创意、创建标题,并协助编辑和总结内容。这些应用突显了AI在提高效率和增强编辑工作流程方面的潜力,同时保留了新闻报道中的人文关怀。 还阅读:谷歌发布新闻写作AI“Genesis” 平衡创新和可信度 作为在新闻报道中尝试使用AI的先驱,美联社理解创新与保持新闻可信度之间的平衡。在过去的十年中,美联社探索了使用AI从数据源生成简短新闻报道的方法。然而,该机构在涉足新的AI应用时仍然谨慎,以保护其新闻诚信。 还阅读:好莱坞作家罢工反对AI工具,称其为“剽窃机器” 走向负责任的AI未来 美联社为其记者制定这些指南的同时,还采取了措施为AI的进步做出贡献。该机构与AI开发者OpenAI合作,利用其新闻报道来训练生成式AI模型。美联社的经历凸显了新闻报道与AI之间不断发展的关系,强调负责任地整合AI对于确保新闻报道的准确性、可靠性和真实性的最高标准的重要性。 还阅读:如何使用TensorFlow构建负责任的AI? 我们的观点 美联社的AI指南标志着新闻业在AI时代的演变中的重要里程碑。通过制定优先考虑可靠报道、透明度和遵守新闻原则的标准,美联社引领新闻机构负责任地将AI整合到其工作流程中。随着AI继续改变媒体格局,美联社的做法成为一个指导,确保创新和伦理并驾齐驱,向公众传递可信赖的新闻。

Leave a Comment

如何在没有GPT4数据的情况下对代码LLM进行指令调整? 遇见OctoPack:一组用于指令调整代码大语言模型的AI模型

<img src=”https://www.marktechpost.com/wp-content/uploads/2023/08/Screenshot-2023-08-17-at-2.47.58-AM-1024×671.png”/><img src=”https://www.marktechpost.com/wp-content/uploads/2023/08/Screenshot-2023-08-17-at-2.47.58-AM-150×150.png”/><p>已经证明,通过指令(指令调整)提供的各种语言任务的微调可以提高大型语言模型(LLM)的可用性和整体性能。通过视觉、听觉和多语言数据训练的模型都在指令调整范式中表现良好。 <p>研究人员通过教授研究人员如何编码来教授代码学习机器。间接指导代码LLM通过代码注释生成所需的代码是可能的,但这个过程是脆弱的,并且在期望的结果是自然语言时会失败。通过明确的指导调整可以提高代码LLM的可操控性,并拓宽其适用范围。 <p>研究人员更倾向于使用开源模型来生成合成数据,并避免使用限制性许可的数据。他们比较了四个常见的代码指令数据库: <ul> <li>xP3x,它汇编了广泛使用的代码基准的结果</li> <li>松散的代码LLM使学者能够生成独立的数据。</li> <li>OASST主要是一个具有最少编码示例的语言信息库。</li> <li>全新的4TB Git提交宝库,被称为COMMITPACK。</li> </ul><p><strong>研究人员的贡献</strong></p><ul> <li>对于预训练,您可以访问350种不同编程语言下以宽松许可证发布的4TB代码提交;调整使您可以访问包含高质量代码指令的COMMITPACK的筛选变体。</li> <li>六种编程语言(Python、JavaScript、Java、Go、C++和Rust)和三种场景(代码修复、代码解释和代码合成)的代码LLM泛化基准(HUMANEVALPACK)。</li> <li>最宽松的代码LLM是OCTOCODER和OCTOGEEX。 </li> </ul><p>研究人员使用GitHub提交的操作转储作为数据集的基础。为了确保提交消息非常具体,并避免处理许多文件带来的额外复杂性,他们使用了多个质量过滤器,过滤了商业友好的许可证,并删除了影响多个文件的所有提交。在提交之前和之后使用过滤信息提取受影响的GitHub源代码文件。 <p>对于需要自然语言(NL)响应的任务,指令调整LLM的输入是一个带有可选NL上下文的NL指令。当使用代码数据进行调整指令时,代码可以仅包含在输入中,仅包含在输出中,或同时包含在输入和输出中,与NL指令一起。尽管大多数现有基准重点关注代码合成变体,但客户可能希望在所有三种情况下使用模型。因此,六种语言的三个输入输出排列现在包含在代码合成基准HumanEval中。 <p>在所有三种评估情况下,OCTOCODER在所有其他宽松模型中表现出显著的优势。OCTOGEEX是经过基准测试的模型中参数最少的,仅有60亿个,但在与其他宽松代码LLM进行比较时仍然表现出最佳结果。与其他模型相比,GPT-4具有最高的性能。尽管它可能是较其他模型更大的模型,但GPT-4是闭源的。 <p>可以在https://github.com/bigcode-project/octopack找到所需的所有内容,包括代码、模型和数据。  <p>总之,大型语言模型(LLMs)通过在指令上进行微调,可以在各种自然语言任务上表现更好。研究人员使用编码来对人类指导进行微调,利用Git提交的固有结构将代码更改与人类指导相匹配。350种不同语言的4TB Git提交被编译到COMMITPACK中。对于具有16B参数的StarCoder模型,他们将COMMITPACK与其他自然和合成代码指令进行了比较。在HumanEval Python测试中,他们在没有训练OpenAI输出的模型中达到了最先进的性能。此外,他们还提供了HUMANEVALPACK,它为六种额外的编程语言(Python、JavaScript、Java、Go、C++和Rust)和三个新的编码任务(代码修复、代码解释和代码合成)添加了支持,以扩展HumanEval基准的功能。模型OCTOCODER和OCTOGEEX在HUMANEVALPACK中的所有可允许模型中都表现出了COMMITPACK的优势。</p>

Leave a Comment

Snapchat故障引发恐慌:我的人工智能发布神秘的故事和图片

近期,Snapchat这一备受瞩目的社交媒体平台遭遇了一个技术故障,涉及其AI聊天机器人“我的AI”。这个故障导致意外的动态内容被发布到用户的动态中,并在聊天中表现出异常行为。当用户质疑这些不寻常内容的来源时,猜测和困惑在社交媒体平台上蔓延。让我们深入探讨这个有趣事件及其后续的细节。 另请阅读:Snapchat将“我的AI”聊天机器人引入所有用户,增强功能 Snapchat的我的AI的作用 Snapchat今年早些时候推出了我的AI,这是一个由人工智能驱动的聊天机器人,旨在为用户提供有用的建议和帮助。用户可以与这个聊天机器人互动,获取有关旅行地点、使用哪些镜头甚至时尚建议的建议。然而,系统中最近的一个故障导致了一系列令人费解的事件,令用户感到好笑和困惑。 另请阅读:认识Instagram的AI聊天机器人——你的新朋友 意外的动态和不寻常的行为 一个星期二,我的AI通过将一秒钟长的动态发布到用户的动态中,让Snapchat用户感到惊讶,这是它本不具备的功能。这些动态突然出现让用户感到困惑,使他们质疑聊天机器人在这种意外行为中的作用。当我的AI在较长时间内不回应时,情况进一步升级,用户的担忧也更加加剧。 另请阅读:谷歌巴尔德自学孟加拉语:桑达尔·皮查伊 神秘的故事 更增加了神秘感的是,我的AI在其动态中发布了一张描绘普通墙壁或天花板的图片。这张神秘的图片引发了对其来源和目的的质疑,用户在社交媒体平台上进行了各种猜测。一些Snapchatters甚至担心这张图片可能是他们周围环境的照片,引发了对AI系统行为的恐慌和猜测。 解析恐慌 当用户试图理解这种情况时,各种理论和猜测在各个平台上出现。一些人声称发布的图片来自他们的家中,暗示AI可能偷偷录制了他们。然而,当清楚这张图片是与任何特定环境无关的通用描绘时,这些理论被证明是错误的。 另请阅读:律师被ChatGPT的虚假法律研究愚弄 Snapchat的回应和解决方案 Snapchat确认我的AI经历了一次故障,导致行为不稳定和意外的发布。该平台向用户保证问题已经“解决”。尽管有这样的澄清,聊天机器人发布的不寻常图片仍然没有解释,让用户对其来源和含义感到好奇。 我们的观点 Snapchat AI故障导致意外的动态和神秘的图片出现在我的AI动态中,引发了用户的恐慌、猜测和娱乐。这一事件凸显了AI系统的复杂性和可能产生意外结果的潜力。尽管Snapchat已经解决了这个问题,但这一事件提醒我们,在今天的数字时代,技术与用户体验之间的错综复杂的相互作用。随着Snapchat继续创新和完善其AI产品,这些事件强调了严格的测试和监控的必要性,以确保无缝的用户体验。

Leave a Comment

这项来自UCLA的AI研究表明,大型语言模型(如GPT-3)已经获得了一种新兴的能力,可以找到广泛范围的类比问题的零射击解决方案

类比推理是人类智能和独创性的基石。当面对一个陌生的挑战时,人们经常通过系统地将其与一个更熟悉的场景进行比较来找出可行的解决方案。这种方法在人类的思维中扮演着重要的角色,涵盖了从解决日常问题到培养创造性概念和推动科学发现边界的各种活动。 随着深度学习和大型语言模型(LLMs)的进步,人们对LLMs进行了广泛的类比推理测试和研究。先进的语言模型具有独立推理和抽象模式识别的能力,成为人类智能的基本原则。 由加州大学洛杉矶分校的研究团队进行的一项研究揭示了LLMs的真正能力。这项研究因其有影响力的发现而获得了显着的认可。这些发现被收录在最新一期的《自然人类行为》杂志中,文章标题为“高级语言模型中的类比推理的出现”。该研究表明,大型语言模型(LLMs)能够像人类一样思考,而不是基于统计数据来模仿我们的思维。 该研究对人类推理者和强大的语言模型(text-davinci-003,即GPT-3的一个版本)在各种类比任务中进行了对比评估。 研究人员通过不预先训练的方式,对语言模型GPT-3进行了各种类比任务的检验,并与人类的回答进行了直接比较。这些任务涉及了一个独特的基于文本的矩阵推理挑战,从雷文标准渐进矩阵(SPM)的规则结构中汲取灵感。此外,他们还进行了一个视觉类比任务。 模型的起点是在一个海量的基于网络的真实语言数据集上进行训练的基础版本,总共超过4000亿个标记。这个训练过程是通过下一个标记预测目标来引导的,模型学会了在给定的文本序列中预测最有可能的下一个标记。 这个评估包括四个不同的任务类别,每个任务类别都经过策略性的设计,以探索类比推理的各个方面: 基于文本的矩阵推理挑战 字母串类比 四项词语类比 故事类比 在这些领域中,他们直接比较了模型的表现与人类的表现,研究了整体效果和错误模式,类似于人类进行类比推理的方式。 GPT-3在把握抽象模式方面表现出色,往往在各种情景下与人类表现相当甚至更好。GPT-4的早期试验似乎显示出更有希望的结果。从已经观察到的情况来看,像GPT-3这样的大型语言模型似乎有一种自发地解决各种类比难题的能力。 此外,他们发现text-davinci-003在类比任务中表现出色。有趣的是,早期的模型版本在某些任务场景中也表现出色,暗示了一些因素的融合增强了text-davinci-003在类比推理方面的能力。 GPT-3在处理字母串类比、四项词语类比以及在故事中发现类比的能力方面展示了一些令人印象深刻的技能,而没有进行预先训练。这些发现有助于扩大对这些先进语言模型能力的认识,暗示着更先进的模型已经具备了通过类比进行推理的内置能力。

Leave a Comment

使用spaCy增强NLP流程

介绍 spaCy是一款用于自然语言处理(NLP)的Python库。spaCy的NLP流水线是免费且开源的。开发者可以使用它来创建信息提取和自然语言理解系统,就像Cython一样。它具有简洁且用户友好的API,适用于生产环境。 如果你经常处理大量文本,你会想要了解更多关于它的信息。例如,它是关于什么的?在什么上下文中这些术语的含义是什么?对谁进行了什么操作?提到了哪些企业和产品?哪些文本可以相互比较? spaCy专为生产环境使用,可以帮助您开发处理大量文本的应用程序,并“理解”这些文本。它可用于创建信息提取、自然语言解释和深度学习的预处理文本系统。 学习目标 了解spaCy的基础知识,如分词、词性标注和命名实体识别。 了解spaCy的文本处理架构,它高效且快速,适用于大规模的NLP任务。 在spaCy中,您可以探索NLP流水线,并为特定任务创建定制的流水线。 探索spaCy的高级功能,包括基于规则的匹配、句法分析和实体链接。 了解在spaCy中可用的许多预训练语言模型以及如何在各种NLP应用中使用它们。 使用spaCy学习命名实体识别(NER)策略,以识别和分类文本中的实体。 本文是Data Science Blogathon的一部分。 统计模型 spaCy的某些特性可以自主运行,而其他特性则需要加载统计模型。这些模型使spaCy能够预测语言注释,例如确定一个词是动词还是名词。目前,spaCy提供了多种语言的统计模型,您可以将它们作为独立的Python模块进行安装。它们通常包括以下元素: 为了在上下文中预测这些注释,为词性标注器、依赖解析器和命名实体识别器分配二进制权重。 词汇表中的词条是词和它们的上下文无关特性,例如形式或拼写。 数据文件包括词形还原规则和查找表。 词向量是单词的多维意义表示,允许您确定它们的相似程度。 在加载模型时,使用配置选项,如语言和处理流水线设置,将spaCy置于适当的状态。 要导入模型,只需运行spacy.load(‘model_name’),如下所示: !python -m spacy…

Leave a Comment

“Salesforce AI研究人员介绍了LLM增强自主代理的演进以及创新的BOLAA策略”

最近的大型语言模型(LLM)的成就鼓励了对使用LLM处理各种复杂任务的新研究,其中以LLM增强的自主代理(LAA)引起了最大的关注。通过将LLM的智能扩展到顺序动作执行,LAA在与环境的互动和处理具有挑战性的问题时显示出卓越性能,通过收集数据来解决问题。BabyAGI1提出了一个使用OpenAI LLM2生成、优先排序和执行任务的基于人工智能的任务管理系统。另一个备受欢迎的开源LAA框架是AutoGPT3。 ReAct是一种最近提出的LAA技术,它在生成后续动作之前与环境进行交互。一种用于创建LAA的当前开源框架称为Langchain4。由于原始探测的原因,LAA还没有得到深入研究。最佳代理架构尚未确定。为了使LLM通过上下文学习学会创建下一个动作,ReAct用已经预定义的示例刺激代理。此外,ReAct认为,代理在执行动作之前应该进行中间思考。ReWOO为LAA引入了额外的规划过程。 Langchain将ReAct代理与零-shot工具使用能力结合起来。最佳代理设计应与任务和相应的LLM骨干相一致,这在先前的研究中没有得到很好的解决。其次,还需要完成有关当前LLM在LAA中的有效性的知识。早期的论文只比较了少数几个LLM骨干的性能。ReAct将PaLM用作主要的LLM。ReWOO使用OpenAI text-DaVinci-003模型进行代理规划和指令定制。对于通用的网络代理,MIND2Web将Flan-T5与OpenAI GPT3.5/4进行比较。 然而,只有少数最近的研究彻底比较了使用不同预训练的LLM的LAA的效果。最近的一篇相对较新的文章刚刚发布了用于评估LLM作为代理的基准。然而,他们必须同时考虑代理架构和它们的LLM骨干。通过从效果和效率的角度选择最佳的LLM,LAA研究得以推进。第三,随着活动变得更加复杂,许多代理可能需要协调。最近,ReWOO发现将推理与观察分离可以提高LAA的效果。 在这项研究中,Salesforce Research的研究人员提出了一个观点,随着任务复杂性的增加,尤其是在开放领域的情况下,最好协调多个代理来执行单个任务。例如,在在线导航任务中,他们可以使用点击代理与可点击按钮进行交互,同时请求搜索代理查找其他资源。然而,很少有论文探讨协同和协调多个个体的效果。本报告建议对LAA性能进行广泛的比较分析,以填补这些研究空白。他们进一步深入研究了LLM骨干和LAA代理架构。 他们根据已有的设置创建代理基准,评估了基于不同LLM骨干的不同代理架构的功能。因为他们代理基准中的任务与多个任务复杂性级别相关联,所以可以根据任务复杂性来检查代理的性能。这些代理架构被创建来彻底验证当前的设计决策。为了实现多个协作LAA之间的选择和通信,他们提出了一种名为BOLAA5的独特LAA架构,该架构在众多合作代理之上具有控制器模块。 本文的贡献如下: • 开发了六种不同的LAA代理架构。为了支持LAA的设计直觉,它们融合了从提示、自我思考和规划中得出的直觉,并将它们与多个骨干LLM集成。他们还创建了BOLAA来实现多代理策略协调,提高单个代理与行动的互动能力。 • 他们对知识推理任务和决策制定在线导航的环境进行了全面研究。他们将性能作为最终稀疏奖励和中间回忆提供,从而为最佳LAA和适当的LLM选择提供了定性建议。 • 与其他LAA设计相比,BOLAA在WebShop环境中始终表现出最佳性能。他们的研究结果凸显了开发专门的代理来共同解决复杂问题的重要性,这与开发具有强大泛化能力的大型LLM一样重要。

Leave a Comment

Microsoft Azure推出面向企业AI的ChatGPT

微软Azure通过在Azure OpenAI服务中引入ChatGPT迈向企业人工智能的巨大飞跃。这一突破性进展使企业能够在其网络中运行ChatGPT,增强工作体验,提高生产力,并提供一系列强大的功能。以下是微软Azure ChatGPT如何改变企业利用人工智能的方式的详细介绍。 还可以阅读:IBM通过Watsonx平台改变企业人工智能领域 流畅集成,提升工作流程 通过将ChatGPT集成到Azure OpenAI服务中,组织机构可以访问各种先进的人工智能模型,包括GPT-3.5和Codex。这种集成使超过1000个客户能够以独特的方式利用尖端人工智能进行创新。ChatGPT能够纠正代码块并执行各种任务,增强工作流程,使团队能够更有效地协作。 还可以阅读:提升工作流程:微软的AI副驾驶员增强Office、GitHub、Bing和网络安全 微软的开源方法 微软将Azure ChatGPT作为开源解决方案上传到GitHub,并提供私人Azure托管,打破了传统。这种方法确保透明度和可访问性,使组织能够将聊天机器人无缝地集成到现有基础架构中。 还可以阅读:Meta开源其所有有前途的项目,了解其中原因 Azure用户的简便部署 对于已经使用Azure的企业来说,添加这一新功能是一个简单的过程。GitHub页面提供了安装和部署的详细说明,使组织能够快速将微软Azure ChatGPT集成到他们的工作流程中。 释放私人ChatGPT的潜力 ChatGPT在全球范围内的受欢迎程度迅速上升,商业用户越来越多地利用其作为提高生产力和创意助手的潜力。微软的Azure解决方案加速器通过将该AI模型提供为企业选项,进一步推动了这一进展。这种私人ChatGPT解决方案为用户提供了熟悉的聊天机器人体验,同时确保数据隐私和安全性。 还可以阅读:OpenAI发布6个令人兴奋的ChatGPT功能,改变用户体验 微软Azure ChatGPT的好处 微软Azure ChatGPT的开发者为组织提供了几个好处: 隐私:数据得到保护,与OpenAI的运营隔离。 控制:网络流量完全隔离,并集成了企业级安全控制。 价值:整合内部数据源和服务可以增加实质性的商业价值。…

Leave a Comment

人工智能如何帮助顾客在亚马逊更好地购物

顾客评价已成为在线购物的基石,为购买者提供宝贵的洞察力。电商先锋亚马逊始终在不断改进顾客评价体验。从1995年引入产品意见的概念,到实施先进的人工智能技术,亚马逊致力于提升购物体验的承诺不断塑造着我们进行在线选择的方式。 阅读更多: 亚马逊将通过AI搜索进行“一次性的改变” 赋能顾客的旅程 亚马逊的顾客评价之旅始于1995年,引入了一种让顾客发表对产品的诚实意见的革命性概念。虽然最初受到怀疑,但这一功能最终成为在线购物的基本支柱。它使顾客能够从彼此的经验中学习,并根据真实的反馈做出明智的决策。 阅读更多: Instacart通过AI搜索革新购物:见识Ask Instacart 评价的持续演进 多年来,亚马逊对其评价系统进行了重大改进。它引入了评价标题、照片和视频等功能,以全面了解产品。2019年还新增了星级评分系统,以吸引更广泛的评价者。目标是简化流程,使意见分享更加便捷。 评价中的人工智能的力量 最近,亚马逊利用生成式人工智能的潜力进一步提升了顾客评价体验。借助人工智能技术的进步,亚马逊开发了一种人工智能生成的评价亮点功能。该功能将顾客评价的精髓浓缩为简明的段落,反映出共同的主题和情感,使购物者能够快速掌握产品的特点。 阅读更多: 谷歌发布新闻写作人工智能“Genesis” 理解人工智能生成的评价亮点 人工智能生成的评价亮点功能为寻求详细评价之前寻找信息的顾客提供了快速洞察。该功能仅适用于美国的部分移动购物者。它提取评价中经常提到的关键属性和情感,并将它们简明呈现。例如,如果顾客对产品的易用性感到好奇,他们可以点击该特定属性以访问相关评价。 阅读更多: 谷歌Chrome现在显示基于人工智能的文章摘要,轻松阅读 保持真实性和信任 尽管创新至关重要,亚马逊始终坚守保持评价生态系统的真实性和完整性。该电商平台执行社区准则,以确保真实和相关的评价。亚马逊的机器学习模型和人工审核员密切合作,共同维护这些准则,防止虚假评价误导顾客。 展望未来 随着亚马逊的人工智能模型不断发展和学习,人工智能生成的评价亮点功能有望扩展到更多的类别和顾客群体。该公司通过技术不断致力于提升购物体验的承诺,这显然已经成为塑造零售行业格局的核心。 阅读更多: 亚马逊推出突破性的人工智能工具,革新生成式人工智能和软件开发 我们的观点…

Leave a Comment

Tabnine推出Tabnine Chat:一个针对企业级的、以代码为中心的测试版聊天应用程序,允许开发人员使用自然语言与Tabnine的AI模型进行交互

Tabnine,由人工智能驱动的代码补全工具,推出了其套件的一个新功能:Tabnine聊天,处于其测试版。它是一个企业级的、以代码为中心的代码应用,可以与开发人员的集成开发环境(IDE)无缝集成。该应用程序通过使用可解释的现有代码、搜索代码仓库并根据自然语言规范生成新代码,扩展了其功能。 Tabnine Chat的一个关键亮点是其对安全性和合规性的高度关注。 该功能适应了各种企业需求,保护私有代码库、可允许的开源代码和堆栈溢出查询。模型仅在具有许可证的开源代码上进行了训练,消除了对代码库信息的担忧。 Tabnine聊天的前端是一个嵌入在Web视图中的React应用程序,目前可在VS code和JetBrains IDE中使用,并支持所有编程语言。 它具有几个重要特点: 安全性和合规性:Tabnine环境确保了代码的完全私密性和安全性。通过使用虚拟私有云或本地设置,它们提供了隔离的部署环境,优先考虑安全性和机密性。 上下文集成:Tabnine聊天在IDE内运行,从而与开发人员的正在进行的代码集成。 仓库集成:Tabnine企业用户可以将其仓库链接到此应用程序。拥有大量内部API、库和服务的组织可以通过将内部仓库连接到Tabnine Chat来提高生产力。 随着Tabnine Chat的测试阶段的到来,开发人员正处于编码转变的边缘。在开发者与人工智能之间的不断发展的旅程中,Tabnine Chat作为一个能够实现开发者与代码之间无缝对话的先驱脱颖而出。在不久的将来,Tabnine企业版和专业版用户将迎来更广泛的扩展,对于先进的编码交互产生了兴奋。

Leave a Comment

2023年顶级AI图像到视频生成器

Genmo Genmo是一种由人工智能驱动的视频生成器,将文本超越了纸张的二维界面。它使用自然语言处理、图像识别和机器学习算法,将书面信息转化为视觉形式。它可以将文本、图片、符号和表情符号转化为动态影像。背景颜色、角色、音乐和其他元素只是视频个性化的一部分。电影将包括您提供的文本和任何附带的图片。视频可以在YouTube、Facebook、Twitter等许多在线渠道上分享。Genmo的人工智能制作的视频可用于广告、指导、解释等方面。对于需要快速、廉价制作有趣电影的公司、团体和个人来说,它是一个绝佳的资源。 D-ID D-ID是一个由人工智能驱动的视频制作平台,可以简单快速地从文本生成专业质量的视频。使用稳定扩散和GPT-3算法,该公司的创意现实TM工作室可以轻松地创建超过百种语言的视频。D-ID的Live Portrait功能可以将静态图像转化为短片,而Speaking Portrait功能可以将书面或口语文本转化为演讲。通过数以万计的视频,其API得到了改进,可以生成高质量的视觉效果。Digiday、SXSW和TechCrunch都认可D-ID帮助用户以传统方法的一小部分费用创建高质量视频的能力。 LeiaPix Converter LeiaPix Converter是一个基于Web的免费服务,可以将常规照片转换为3D Lightfield照片。它利用人工智能将您的图像转化为逼真、沉浸式的3D环境。选择所需的输出格式,并将您的图片上传到LeiaPix Converter。转换后的文件可以以多种形式导出,包括Leia图像格式、侧边3D、深度图和光场动画。LeiaPix Converter的输出质量很高,易于使用。这是赋予您的图片新感觉、制作独特视觉作品的绝佳方式。它将二维图像转化为3D Lightfield。Leia图像格式、侧边3D、深度图和光场动画只是支持的导出格式中的一部分,可以产生出色的结果。根据图像的大小,转换过程可能需要一些时间。您原始照片的质量将影响最终的转换结果。由于LeiaPix Converter目前处于测试阶段,可能会存在问题或功能限制。 InstaVerse 一个名为InstaVerse的新开源框架使构建动态3D环境变得简单。背景可以根据人工智能提示生成,然后玩家可以创建自己的角色来探索它。在InstaVerse中创建世界的第一步是选择一个预先制作的布局。森林、城市甚至宇宙飞船都是众多可用的预设选项之一。在选择了起始文档之后,一个人工智能助手将指导您完成自定义过程。一个有高耸树木和流动河流的森林只是instaVerse可以根据您的指令创造的众多景观之一。字符也可以在您的宇宙中生成。人类、动物甚至机器人都包含在instaVerse角色阵容中。创建了角色后,您可以使用键盘或鼠标来指导其行动。虽然InstaVerse仍处于早期阶段,但它显示出作为开发交互式3D内容的强大平台的巨大潜力。它易于上手和使用,可以让您创造属于自己的特殊宇宙。 Sketch Sketch是一个将草图转换为GIF动画的Web应用程序。它是一个有趣而简单的方法,可以制作独特的贴纸和插图,以在社交媒体上分享或在其他项目中使用。使用Sketch就像在线发布您的绘图一样简单。然后,您可以使用绘图工具为作品添加一些动画效果。对象可以重新定位、重新着色和添加自定义音效。满意后,您可以将完成的动画保存为GIF。Sketch对年轻人和老年人来说都是一个很棒的程序。它是展示您的想象力并同时了解动画基础知识的绝佳机会。在使用的便捷性方面,Sketch非常出色。即使您没有以前的VoAGI经验,Sketch也可以帮助您轻松创建美丽的动画。您可以在满意后将完成的动画保存为GIF。之后,您的动画就可以共享或进一步使用了。 NeROIC(神经重建器) NeROIC可以作为人工智能技术的一部分,从照片中重建三维模型。由一家信誉良好的科技公司创造的NeROIC,有潜力彻底改变我们对三维物体的认知和互动方式。NeROIC可以使用经过批准的图像创建用户想要传达的信息的三维模型。NeROIC的视频到三维的能力与其图像到三维的能力相当。这意味着用户可以从一个视频中创建一个交互式的三维环境。因此,创建三维场景变得比以往更快更容易。 DPT Depth(DPT深度) 从二维照片中创建三维模型的计算机科学学科正在快速发展。基于深度学习的技术可以用来训练点云和三维网格,以更好地描述现实场景。一种潜在的方法,DPT深度估计,采用深度卷积网络从图像中读取深度数据,并生成三维物体的点云模型。DPT深度估计使用单目照片将经过预训练的深度卷积网络输入到各种场景和物体的数据中。在数据收集之后,网络将使用这些信息创建一个点云,从而可以制作三维模型。与传统的立体匹配和光度立体技术相比,DPT的性能可以超越人类。由于其快速的推理时间,DPT是实时三维场景重建的有希望的候选者。 RODIN(罗丹)…

Leave a Comment

“最佳的一流正在上课:全新的NVIDIA Studio笔记本电脑为内容创作、游戏和教育提供强大动力”

编辑备注:本文是我们每周的NVIDIA Studio系列的一部分,该系列庆祝特色艺术家,提供创意技巧和窍门,并展示NVIDIA Studio技术如何改进创意工作流程。我们还深入研究了新的GeForce RTX 40系列GPU功能、技术和资源,以及它们如何大大加速内容创建。 新学年的开始是学生通过购买由GeForce RTX 40系列显卡提供动力的NVIDIA Studio笔记本电脑来升级他们的内容创作、游戏和教育能力的理想时机。 Marmoset Toolbag是一个完整的3D艺术制作工具,刚刚发布了4.06版本,这是Toolbag 4用户的免费更新。它扩展了对OpenUSD文件格式的支持,并添加了NVIDIA Omniverse兼容性、NVIDIA DLSS功能、AI OptiX降噪和渲染加速,以及烘焙-所有都是RTX加速的。 最后,在本周的NVIDIA Studio中,受欢迎的影响者JiffyVFX谈到了他的病毒视频系列《Doors to Realities》,该系列视频观看量超过120万次。 创作,游戏,学习 GeForce和NVIDIA Studio RTX 40系列笔记本电脑利用人工智能的力量加速内容创作、游戏和学习应用程序。 GeForce…

Leave a Comment

质量控制巡逻:初创公司构建模型以检测车辆故障模式

当涉及保持利润率时,车辆和零部件制造商的数据科学家处于驾驶座位。 Viaduct是一家为时间序列推断开发模型的公司,它正在帮助企业从当今联网汽车上捕获的数据中获取故障洞察。它通过利用传感器数据并进行相关性分析来实现这一目标。 这家成立四年的初创公司总部位于加利福尼亚州门洛帕克,提供了一个平台来检测异常模式、跟踪问题和部署故障预测。Viaduct的创始人兼首席执行官David Hallac表示,这使得汽车制造商和零部件供应商能够通过实时数据及时解决问题,从而减少保修索赔、召回和缺陷。 他说:“Viaduct已经在200多万辆车上部署,帮助避免了50万小时的停机时间,并在整个行业节省了数亿美元的保修费用。” 该公司依靠NVIDIA A100 Tensor Core GPU和NVIDIA时间序列预测平台(TSPP)框架进行训练、调优和部署时间序列模型,这些模型用于预测数据。 据该公司称,Viaduct已与五家主要的乘用车和商用卡车制造商合作。 “客户认为这是一项巨大的节省——我们所影响的事情对利润来说是很大的。这是停机时间的影响,保修的影响,以及产品开发的低效性。”Hallac说道。 Viaduct是NVIDIA Inception计划的成员,该计划为公司提供技术支持和人工智能平台指导。 起源:研究走上道路 Hallac在斯坦福大学开始了他的Viaduct之路。当他还是那里的博士生时,大众汽车公司带来了从60多名驾驶员那里收集到的传感器数据,并提供了一个研究资助金来探索用途。 研究人员探索的问题是如何理解在几个月内收集的大量车辆数据中的模式和趋势。 斯坦福的研究人员与大众电子研究实验室合作发布了一篇关于这项工作的论文,其中介绍了Drive2Vec,一种用于嵌入传感器数据的深度学习方法。 他说:“我们开发了一系列专注于从高维时间序列数据中进行结构推断的算法。我们发现了有用的见解,并能够帮助公司大规模地训练和部署预测算法。” 开发具有高达10倍推断能力的洞察知识图谱 Viaduct使用其TSI引擎处理时间序列分析,该引擎汇集了制造、遥测和服务数据。它的模型是使用利用NVIDIA TSPP的A100 GPU进行训练的。 Hallac说:“我们将其描述为一个知识图谱——我们正在构建这个知识图谱,其中包含所有不同传感器和信号以及它们之间的相关性。” 使用Drive2Vec自动编码器生成了几个关键特征,通过马尔可夫随机场推断过程学习了相关性,并利用NVIDIA…

Leave a Comment

进入Omniverse:Reallusion通过双向实时同步和OpenUSD支持提升角色动画工作流程

编辑注:本文是《进入全宇宙》系列文章的一部分,重点介绍艺术家、开发者和企业如何利用最新的OpenUSD和NVIDIA Omniverse的进展来改变他们的工作流程。 无论是为工业数字化制作单个3D角色还是生成一组角色,使用流行的Reallusion软件的创作者和开发者可以通过本月发布的iClone Omniverse Connector的最新更新来提升他们的工作流程。 此次升级实现了无缝协作,并扩展了使用NVIDIA Omniverse的创作者的创作可能性,该平台是用于连接和构建基于OpenUSD的工具和应用程序的开发平台。 新功能包括项目的实时同步,以及用于通用场景描述框架(即OpenUSD)的增强导入功能,这使得iClone和Omniverse之间的工作更快、更顺畅、更高效。此次更新还修复了错误并进行了改进。 更好地共同制作3D角色动画 全世界的创作者正在使用Reallusion iClone这款实时3D动画软件,为他们的角色赋予生命。 索罗门·贾格韦(Solomon Jagwe)是一位3D艺术家、动画师和屡获殊荣的电影导演,他使用Reallusion iClone和Omniverse进行工作,他的作品通常关注环境主题。 贾格韦在东非长大,回忆起与哥哥一起在乡间冒险时看到的生物,他总是会画下这些生物,这是他的童年美好回忆。即使在现在,他的3D作品往往从使用钢笔和纸张进行简单素描开始。 这位艺术家表示,他始终努力创造有所不同的艺术作品。 例如,贾格韦制作了《Nkoza和Nankya的冒险》这个视频系列,旨在为所有年龄段的人们普及乌干达文化知识。他在Autodesk 3ds Max和Autodesk Maya中建模,使用Reallusion iClone进行动画制作,并在Omniverse中进行合成。 贾格韦说:“通过Omniverse的iClone Connector,我可以轻松地在Omniverse中渲染我的iClone动画,并利用iClone动画工具与Omniverse Audio2Face生成AI功能相结合。” 贾格韦的整个创作流程都得益于USD,它作为3D应用程序之间的共同语言,使得完整场景可以在内容创作工具之间共享。…

Leave a Comment

AI和内容创作:数字创新的新视角

人工智能(AI)的出现已经改变了许多领域,提供了一些曾经只存在于科幻小说中的非凡能力人工智能正在取得重大进展的一个领域就是内容创作领域利用先进的算法,现在可以以前所未有的速度产生独特、引人入胜和个性化的内容让我们来探索一下… 人工智能和内容创作:数字创新的新视角 阅读更多 »

Leave a Comment

稳定AI推出StableChat:类似于ChatGPT或Claude的研究预览对话型AI助手

Stability AI推出了Stable Chat,这是一个与ChatGPT非常相似的平台。然而,在初步评估中发现,该平台还需要进一步完善和增强。 Stable Chat提供的界面允许用户进行基于文本的对话,与ChatGPT的格式非常相似。尽管如此,该平台仍存在一些限制。特别是,它需要一个聊天记录功能和建立独立聊天会话的能力。一个明显的不便之处是,在刷新界面时会丢失对话数据。 这个创新的聊天界面的核心是最近发布的Stable Beluga模型,这是Stability AI的杰作。在线评论员的初步反馈表明,该模型虽然能够理解俄语单词,但它的熟练程度更倾向于识别个别单词而不是构建连贯的语言结构。 与Beluga模型的交互揭示了几个关键观察点: 该模型遵守严格的安全协议,对生成特定类型的内容表现出谨慎的程度。例如,观察到它在最初拒绝生成色情内容。 该模型的内容生成显示出多样性,在面对相同的提示时提供各种各样的回应。这种差异有时会扩展到根据其自身判断改变内容格式的程度。这包括将信息构建为列表、创建带有解释内容的段落,或者制作包含词汇列表的部分。 关于语言风格,该模型有时需要更加一致。有人注意到生成内容的语气和结构似乎会发生变化,这表明有待改进的地方。 该模型的回应独特之处在于偶尔会包含引入不可预测因素的短语。例如,在与棋盘游戏相关的查询中,该模型产生了独特的表达,如“薄荷饮料者”、“Medusonki”和“羊小崽子”。 有趣的是,该模型有时会将用户引导到外部资源。例如,它建议使用Google翻译来扩展特定主题的词汇选择。 一个显著的问题是该模型的稳定性和一致性。用户报告了偶尔的断开连接和在聊天窗口中不活动时的短暂超时情况。 与成熟的ChatGPT相比,可以看出Stable Chat仍有待进一步完善的地方。虽然Stability AI的研究预览展示了希望并提供了独特的内容生成,但偶尔存在不一致性。

Leave a Comment