Press "Enter" to skip to content

Tag: Generative AI

使用 QLoRA 对 Llama 2 进行微调,并在 Amazon SageMaker 上部署,配备 AWS Inferentia2

在这篇文章中,我们展示了使用参数高效微调 (PEFT) 方法对 Llama 2 模型进行微调,并将微调后的模型部署在 AWS Inferentia2 上我们使用 AWS Neuron 软件开发工具包 (SDK) 来访问 AWS Inferentia2 设备,并从其高性能中受益然后,我们使用一个由 […] 提供支持的大型模型推断容器

Leave a Comment

这篇AI论文揭示了生成型AI模型的网络安全意义-风险、机遇和伦理挑战

生成型人工智能(GenAI)模型,如ChatGPT、Google Bard和Microsoft的GPT,已经革新了人工智能互动。它们通过创建多样化的文本、图像和音乐等内容来改变多个领域,影响着沟通和问题解决。ChatGPT被数百万人迅速接受,反映了GenAI融入日常数字生活,改变了人们对人工智能的认知和互动方式。它能够理解和生成类似人类对话的能力,使得更广泛的受众更容易接触和理解人工智能,显著改变了人们的感知。 GenAI模型的发展状况迅速演进,从GPT-1到最新的迭代版本如GPT-4,每一次迭代都展示了在语言理解、内容生成和多模态能力方面的重大进展。然而,这种进化也带来了一些挑战。这些模型日益复杂的特性带来了伦理问题、隐私风险和恶意实体可能利用的漏洞。 在这方面,最近有一篇论文对GenAI,尤其是ChatGPT的网络安全和隐私影响进行了全面的探讨。它揭示了ChatGPT中存在的可能践踏伦理边界和侵犯隐私的漏洞,这些漏洞可能被恶意用户利用。该论文指出了类似GenAI工具的潜在威胁,如越狱、反向心理和提示注入攻击,展示了这些工具可能带来的潜在威胁。它还探讨了网络罪犯如何滥用GenAI进行社会工程攻击、自动化攻击和恶意软件创建的问题。此外,它还讨论了利用GenAI的防御技术,强调了网络防御自动化、威胁情报、安全代码生成和伦理准则等来加强系统防御,抵御潜在攻击。 作者广泛探讨了操作ChatGPT的方法,讨论了像DAN、SWITCH和CHARACTER Play这样的破解技术,旨在覆盖限制并绕过伦理约束。他们强调了如果这些方法被恶意用户利用,可能导致有害内容的生成或安全漏洞。此外,他们详细介绍了一些令人担忧的情景,如果不受限制地使用ChatGPT-4的能力,可能会突破互联网的限制。他们深入探讨了提示注入攻击,展示了像ChatGPT这样的语言模型中的漏洞,并提供了使用ChatGPT生成攻击载荷、勒索软件/恶意软件代码和影响CPU的病毒的示例。这些探索突显了重大的网络安全问题,说明了类似ChatGPT这样的AI模型在社会工程、网络钓鱼攻击、自动化攻击和多态恶意软件生成方面的潜在滥用。 研究团队探索了ChatGPT在网络安全方面的几种应用: – 自动化:ChatGPT通过分析事件、生成报告和提供防御策略来协助SOC分析师。 – 报告:根据网络安全数据生成易于理解的报告,帮助识别威胁和评估风险。 – 威胁情报:处理大量数据以识别威胁、评估风险并推荐缓解策略。 – 安全编码:帮助在代码审查中检测安全漏洞并建议安全编码实践。 – 攻击识别:通过分析数据描述攻击模式,有助于理解和防止攻击。 – 伦理准则:生成AI系统伦理框架的摘要。 – 增强技术:与入侵检测系统集成,提高威胁检测能力。 – 事件响应:提供及时指导并创建事件响应手册。 – 恶意软件检测:通过分析代码模式来检测潜在恶意软件。…

Leave a Comment

简洁与准确相遇:使用AWS Trainium进行高性价比的GPT NeoX和Pythia模型训练

大型语言模型(或LLM)已成为日常对话的话题它们被迅速采用的证据是从“Facebook的4.5年”到“ChatGPT的短短2个月”的时间内就达到了1亿用户的数量生成式预训练变压器(GPT)使用因果自回归更新[…]

Leave a Comment

利用实体提取、SQL查询和具有Amazon Bedrock的代理来提升基于RAG的智能文档助手的能力

近年来,由于生成式人工智能(Generative AI)的快速发展,尤其是通过指导微调和强化学习等训练技术引入的大语言模型(LLMs)的性能改善,会话型人工智能(Conversational AI)取得了长足的进步在正确提示的情况下,这些模型可以进行连贯的对话,而无需任何特定任务的训练数据[…]

Leave a Comment

「前40+个创造性AI工具(2023年12月)」

ChatGPT – GPT-4 GPT-4是OpenAI最新的LLM,比之前的版本更有创意、准确和安全。它还具有多模态能力,即能够处理图像、PDF、CSV等格式文件。通过引入代码解释器,GPT-4现在可以运行自己的代码,避免产生幻觉并提供准确的答案。 Bing AI Bing AI由OpenAI的GPT-4模型推动,可以遍历网络提供准确答案。它还具有根据用户提示生成图像的功能。 GitHub Copilot GitHub Copilot是一款分析代码并提供即时反馈和相关代码建议的AI代码补全工具。 DALL-E 2 DALL-E 2是由OpenAI开发的文本到图像生成工具,根据用户的提示创建原创图像。它被设计用于拒绝不恰当的用户请求。 Cohere Generate Cohere Generate利用人工智能的潜力提升业务运营。它为电子邮件、落地页、产品描述和其他各种需求提供个性化内容。 AlphaCode AlphaCode由DeepMind开发,能以竞争水平编写计算机程序。 Adobe Firefly Firefly是一款图像生成和编辑工具,以其基于提示生成准确性而闻名。它包括广泛的图像修改功能,包括内容类型、颜色、音调、光照和构图工具。…

Leave a Comment

这篇AI论文提出了“伟大的倡议”道德框架:以军事启发的方法来确保医疗中负责任的人工智能

一组来自匹兹堡大学、威尔·康奈尔医学院、远程医疗与先进技术研究中心、统一服务大学、布鲁克陆军医学中心和匹兹堡医疗中心的研究人员,对健康领域中生成性人工智能的伦理原则进行了研究,特别关注透明度、偏见建模和伦理决策问题。 他们提出了一个名为GREAT PLEA原则的框架,代表着治理性、可靠性、公平性、问责制、可追溯性、隐私性、合法性、移情和自律性。 该框架倡导积极采纳和扩大这些原则在健康领域中,以应对从生成性人工智能整合中可能出现的伦理困境。 该研究将军事和医疗服务进行了对比,强调了迅速决策的共同需求。它探讨了生成性人工智能在健康领域的变革潜力,承认了透明度和偏见等伦理关切。它引入了军事伦理所启发的实践框架,旨在积极应对生成性人工智能与健康领域整合中的伦理挑战,强调治理、公平和移情在决策过程中的重要性。 人工智能在军事和医疗等各个领域的不断发展,凸显了伦理考虑的必要性。它提及了美国国防部和北约对军事人工智能伦理的披露。探索人工智能对医疗的影响,包括潜在的临床部门替代品,它重点关注生成性人工智能的变革潜力。它强调了健康领域中生成性人工智能缺乏特定伦理原则的现状,强调了军事和医疗部门在人工智能优先事项上的汇聚。 该研究提出了源于军事的生成性人工智能伦理原则。通过对比军事和医疗领域中的伦理关切,形成了GREAT PLEA原则,解决了治理性、可靠性、公平性、问责制、可追溯性、隐私性、合法性、移情和自律性等问题。研究人员强调透明度和文档记录的重要性,强调对健康领域中生成性人工智能系统的最终用户进行教育,确保对能力和限制的了解,以优化信任和伦理使用。研究团队还强调了提升医疗中人类创造力、生产力和问题解决能力的道德意义,同时改善患者护理。 总之,该研究建议以军事为灵感,提出了一个名为GREAT PLEA的伦理原则框架,将生成性人工智能融入到健康领域中。该框架强调了透明度、文档记录和可追溯性在增强信任和维护健康实践中的伦理标准的重要性。教育最终用户并积极应对生成性人工智能中的伦理挑战,以改善患者护理至关重要。 本文来自这篇人工智能论文提出了“GREAT PLEA”伦理框架:用于负责任的医疗人工智能的军事灵感方法,最早发表于MarkTechPost。

Leave a Comment

为何GPU在人工智能领域表现出色

GPU被称为人工智能的稀土金属,甚至是黄金,因为它们是当今生成式人工智能时代的基石。 三个技术原因以及许多故事解释了为什么会这样。每个原因都有多个值得探索的方面,但总体上有: GPU采用并行处理。 GPU系统可扩展到超级计算高度。 用于人工智能的GPU软件堆栈既广泛又深入。 总的结果是,GPU比CPU以更高的能效计算技术,并且更快地执行计算。这意味着它们在人工智能训练和推理方面提供领先的性能,并且在使用加速计算的各种应用中都能获得收益。 在斯坦福大学的人工智能人本中心发布的最新报告中提供了一些背景信息。报告中指出,GPU性能“自2003年以来增加了约7000倍”,每单位性能的价格“增加了5600倍”。 2023年的报告展示了GPU性能和价格/性能的急剧上升。 报告还引用了独立研究团体Epoch的分析和预测人工智能进展的数据。 Epoch在其网站上表示:“GPU是加速机器学习工作负载的主要计算平台,在过去五年中,几乎所有最大的模型都是在GPU上训练的… 从而对AI的最新进展做出了重要贡献。” 一份为美国政府评估人工智能技术的2020年研究得出了类似的结论。 “当计算生产和运营成本计算在内时,我们预计[前沿]人工智能芯片的成本效益比领先节点的CPU高出一个到三个量级,”研究报告中说。 在Hot Chips,一年一度的半导体和系统工程师聚会上,NVIDIA公司的首席科学家比尔·达利在一个主题演讲中表示,NVIDIA GPU在过去十年中在AI推理方面的性能提升了1000倍。 ChatGPT传播新闻 ChatGPT为GPU在人工智能方面的优势提供了一个强有力的例子。这个大型语言模型(LLM)是在数千个NVIDIA GPU上训练和运行的,用于服务超过1亿人使用的生成式AI。 自2018年推出以来,作为人工智能的行业标准基准,MLPerf详细记录了NVIDIA GPU在人工智能训练和推理中的领先性能。 例如,NVIDIA Grace Hopper超级芯片在最新一轮推理测试中表现优异。自那次测试以来,推出的推理软件NVIDIA TensorRT-LLM性能提升了8倍以上,能源使用和总拥有成本降低了5倍以上。事实上,自2019年基准测试发布以来,NVIDIA…

Leave a Comment

小型语言模型在本地CPU上的逐步指南

介绍 在自然语言处理中,语言模型经历了一段变革性的旅程。虽然人们通常关注像GPT-3这样的庞大模型,但小型语言模型的实用性和可访问性不容小觑。本文是一个全面的指南,旨在理解小型语言模型的重要性,并详细介绍如何在本地CPU上运行它们的步骤。点击这里。 图片来源:Scribble Data 理解语言模型 语言模型的定义 语言模型本质上是一个设计用于理解和生成类似人类语言的系统。在数据科学领域,这些模型在聊天机器人、内容生成、情感分析和问答等任务中发挥关键作用。 不同类型的语言模型 尽管小型语言模型体积较小,但具有独特的优势。它们高效、快捷、可定制用于特定领域任务,并通过在本地CPU上运行保护数据隐私。 在数据科学中使用语言模型的案例 它们的多功能应用体现在各种数据科学应用中。应用范围涵盖具有高日常流量的实时任务,并满足特定领域需求的复杂性。 通过实践学习提升生成式人工智能能力。通过我们的GenAI Pinnacle计划,发现向量数据库在高级数据处理中的奇迹! 在本地CPU上运行小型语言模型的步骤 步骤1:设置环境 成功在本地CPU上运行语言模型的基础在于建立正确的环境。这包括安装必要的库和依赖项。比较流行的基于Python的库有TensorFlow和PyTorch,它们提供了用于机器学习和深度学习的预建工具。 所需工具和软件 Python TensorFlow PyTorch 我们可以使用Python的虚拟环境来实现这个目的: pip install virtualenvvirtualenv myenvsource…

Leave a Comment

每个人工智能(GenAI)爱好者应该阅读的5本书

介绍 随着技术不断前进,人工智能(AI)领域不仅在扩大,而且正在多样化发展,生成式人工智能(GenAI)在其中引领潮流。 GenAI,即创造力和AI的融合,注定将改变全球各行各业。根据业界预测,到2032年,GenAI部门的规模预计将达到惊人的1.3万亿美元。对于那些希望开辟自己领域的专业人士来说,排他性书籍中有大量的知识等待着他们。在这里,我们为每个GenAI爱好者提供了一个经过筛选的五本必读书目。 《人工智能和生成式AI圣经:[5合1]最新最全指南》 – Alger Fraley 评分:4.4 《人工智能和生成式AI圣经》是一本包罗万象的书,简化了GenAI的复杂领域。分为五个基本部分,涵盖了AI基础知识,深度学习,NLP,伦理学和未来应用。该书通过解释复杂的概念,并提供不同行业的实际见解和实际案例,不仅仅是解释理论;它还探讨了伦理考虑因素,并展示了AI的潜在影响。以未来为导向的方法引发了读者的好奇心,使他们有能力利用AI的力量提供创新解决方案。易于理解且全面,它是初学者和专家了解和利用AI变革能力的指南。 《生成式AI的涟漪:生成式AI如何影响、告知和改变我们的生活》 – Jacob Emerson 评分:4.8 Jacob Emerson的这本书是GenAI中的一本经典读物。拥有惊人的4.8评分,Emerson的书探索了生成式AI的演变、影响和意义。它揭示了这项技术的历史,从其起源到突破性的进展,展示了它在艺术、医疗保健等领域的广泛应用。通过可理解的示例和真实世界的案例研究,Emerson生动地说明了生成式AI如何重塑世界。特别是,该书深入探讨了伦理和监管问题,清楚地阐述了这个不断发展的领域。词汇表部分有助于理解基本的AI概念。凭借这些知识,读者可以洞察到以AI为驱动的未来,并在个人、专业和社会领域赋予他们权力。 《生成式深度学习:教会机器绘画、写作、作曲和演奏》 – David Foster 评分:4.5 这本由David Foster撰写的书是初学机器学习工程师和数据科学家的实用指南。Foster使用TensorFlow和Keras探索生成式AI,涵盖了VAEs、GANs、Transformers等各种模型。他分享了提高模型效率和创造力的技巧,展示了在照片中修改面部表情和生成个性化图像等应用。该书还探讨了文本生成、最先进的架构、使用AI进行音乐创作以及生成式AI对企业的未来影响。作为创意AI的简明路线图,它是那些渴望掌握生成式AI及其实际应用的人的宝贵资源。 《企业领导者的人工智能基础知识:与生成式AI最新进展》 –…

Leave a Comment

韩国大学的研究人员推出了HierSpeech++:一种具有突破性的人工智能方法,用于高保真度、高效率的文本转语音和语音转换

韩国大学的研究人员开发了一种新的语音合成器,名为HierSpeech++。 这项研究旨在创造出稳健、富有表现力、自然且类似人类的合成语音。 团队的目标是在不依赖文本-语音配对数据集的情况下实现这一目标,并改善现有模型的缺点。 HierSpeech++旨在填补语音合成中的语义和声学表征差距,从而最终改善风格适应性。 到目前为止,基于LLM的零样本语音合成存在一定的局限性。 但是,HierSpeech++已经针对这些限制进行了解决,并改进了鲁棒性和表现力,同时解决了与慢推断速度有关的问题。 通过利用基于文本和韵律提示的自监督语音和F0表示的文本到向量框架,已经证明了HierSpeech++优于基于LLM和扩散的模型的性能。 这些速度、鲁棒性和质量的提升确立了HierSpeech++作为一种功能强大的零样本语音合成器。 HierSpeech++使用分层框架生成语音而无需预先训练。 它采用文本到向量框架来开发基于文本和韵律提示的自监督地址和F0表示。 使用分层变分自编码器和生成的向量、F0和语音提示来产生语音。 该方法还包括高效的语音超分辨率框架。 全面评估使用各种预先训练的模型和实现,采用log-scale Mel错误距离、感知语音质量评估、音高、周期性、有声/无声F1分数、自然度、平均意见分和语音相似性MOS等客观和主观指标。 HierSpeech++在零样本情况下实现了合成语音的优越自然度,提高了鲁棒性、表现力和说话者相似性。 使用自然度平均意见分和语音相似性MOS等主观指标评估了语音的纯真性,并且结果显示HierSpeech++优于真实语音。 进一步将语音超分辨率框架从16 kHz提高到48 kHz,进一步提高了地址的自然度。 实验结果还证明,HierSpeech++中的分层变分自编码器优于基于LLM和扩散的模型,使其成为一种强大的零样本语音合成器。 研究还发现,使用噪声提示的零样本文本到语音合成验证了HierSpeech++在生成未知说话者的语音方面的有效性。 分层合成框架还可以实现多样化的韵律和语音风格转换,使合成语音更加灵活。 总而言之,HierSpeech提供了一种实现零样本语音合成人级质量的高效而强大的框架。 它在语义建模、语音合成、超分辨率和韵律和语音风格转换方面的解耦,提升了合成语音的灵活性。 即使在小规模数据集的情况下,该系统也表现出鲁棒性、表现力、自然度和说话者相似性的改进,并且具有显著更快的推断速度。…

Leave a Comment

NVIDIA为一些最大的亚马逊Titan基础模型提供训练能力

关于大型语言模型的一切都是巨大的——巨大的模型在数千个NVIDIA GPU上的大规模数据集上进行训练。 这对于追求生成式人工智能的公司来说会带来很多大的挑战。 NVIDIA NeMo是一个构建、定制和运行LLM的框架,有助于克服这些挑战。 亚马逊网络服务的一支由经验丰富的科学家和开发人员组成的团队正在创建Amazon Titan为Amazon Bedrock提供基础模型,后者是一项基于基础模型的生成式人工智能服务,并在过去的几个月中一直使用NVIDIA NeMo。 “与NeMo合作的一个重要原因是它的可扩展性,它具有优化功能,可以在高GPU利用率下运行,并使我们能够扩展到更大的集群,以便我们能够更快地训练和交付模型给我们的客户,”亚马逊网络服务的高级应用科学家Leonard Lausen说。 融入大规模环境 NeMo中的并行技术使得大规模LLM的训练更加高效。与AWS的弹性适配器相结合,可以将LLM分散到多个GPU上加速训练。 EFA提供了一个UltraCluster网络基础设施,可以直接连接超过10,000个GPU,并通过NVIDIA GPUDirect绕过操作系统和CPU。 这种组合使得AWS的科学家们能够提供优秀的模型质量,这是仅依赖数据并行化方法无法实现的。 适用于各种规模的框架 “NeMo的灵活性,”Lausen说,“使得AWS能够根据新的Titan模型、数据集和基础设施的特点来定制训练软件。” AWS的创新包括从Amazon Simple Storage Service(Amazon S3)到GPU集群的高效流处理。“由于NeMo基于像PyTorch Lightning这样的流行库构建,这些改进很容易融入其中,这些库标准化了LLM训练流程组件,”Lausen说。 AWS和NVIDIA的目标是吸取他们的合作所学,为顾客带来像NVIDIA…

Leave a Comment

使用亚马逊个性化和生成式人工智能实现超个性化客户体验

今天我们很高兴地宣布推出三个新产品,通过使用Amazon Personalize和生成式人工智能技术,帮助你提升个性化客户体验无论你是寻找托管解决方案还是自主创建,你都可以利用这些新功能来推动你的发展Amazon Personalize是一项完全托管的机器学习(ML)服务,它可以使…

Leave a Comment

亚马逊转录宣布推出一款新的基于语音模型的ASR系统,支持扩展至100多种语言

亚马逊转录是一项完全托管的自动语音识别(ASR)服务,可帮助您将语音转换为文本,并轻松地将其添加到您的应用程序中今天,我们很高兴地宣布推出了一种下一代多十亿参数语音基础模型驱动的系统,将自动语音识别扩展到超过100种语言在本文中,我们将讨论一些相关内容…

Leave a Comment

AWS reInvent 2023生成AI和ML指南

是的,AWS reInvent季节已经到来,一如既往,这个时候应该去的地方是拉斯维加斯!你已经在日历上做了标记,预订了酒店,甚至购买了机票现在你只需要一些有关生成AI和机器学习(ML)的指导,以便在第十二届reInvent大会上参加相关的会议虽然生成AI在之前的活动中出现过,但今年我们将把它提升到一个新的水平除了在主题演讲中发布多个令人兴奋的新闻之外,我们的讲座中的大部分都将以某种形式涉及到生成AI,所以我们可以真正称之为“生成AI和机器学习”专题在这篇文章中,我们将为您介绍该专题的组织方式,并突出几个我们认为您会喜欢的会议虽然我们的专题侧重于生成AI,但许多其他专题也有相关的会议在浏览会议目录时,请使用“生成AI”标签来查找它们

Leave a Comment

使用Amazon SageMaker Studio与Llama 2、LangChain和Pinecone来构建一个RAG问答解决方案,以便进行快速实验

检索增强生成(RAG)允许您为大型语言模型(LLM)提供对外部知识源(如资料库、数据库和API)的访问权限,而无需对模型进行精细调节在使用生成型人工智能进行问答时,RAG使得LLM能够以最相关、最新的信息来回答问题,并可选择引用[…].

Leave a Comment

三种方式生成化智能可加强网络安全

人工分析师已经无法有效地抵御网络安全攻击的日益速度和复杂性。数据量太大了,无法通过手工筛查。 生成型人工智能,是我们这个时代最具变革性的工具,可以实现一种数字柔道的效果。它让公司能够将对抗压倒他们的数据的力量转化为使其防御更强大的力量。 企业领导人似乎已经准备好抓住眼前的机会。在一项最新调查中,首席执行官表示网络安全是他们三大最关注的问题之一,并认为生成型人工智能是一项主导技术,能够带来竞争优势。 生成型人工智能既带来风险,也带来好处。一篇早期的博客介绍了开始保护企业人工智能的六个步骤。 以下是生成型人工智能增强网络安全的三种方式。 从开发人员开始 首先,给开发人员一个安全的副驾驶。 每个人在安全领域都起着一定的作用,但并非每个人都是安全专家。因此,这是最具战略性的开始之一。 增强安全的最佳位置是在开发人员编写软件的前端。一个以安全专家为训练对象的人工智能助手可以帮助开发人员确保其代码符合安全最佳实践。 这种人工智能软件助手可以通过提供先前审查过的代码进行每天学习。它可以从以前的工作中汲取经验,帮助开发人员遵循最佳实践。 NVIDIA正在创建一个用于构建这样的副驾驶或聊天机器人的工作流程,用到了NVIDIA NeMo的组件,它是一个用于构建和自定义大型语言模型的框架。 无论用户是自定义他们自己的模型还是使用商业服务,一个安全助手只是将生成型人工智能应用于网络安全的第一步。 分析漏洞的代理 其次,让生成型人工智能帮助导航已知软件漏洞的茫茫大海。 每时每刻,公司都必须在成千上万个补丁中选择以减轻已知的攻击行为。这是因为每一行代码都可能有几十个甚至几千个不同的软件分支和开源项目的根源。 进一步分析漏洞的LLM可以帮助确定公司应该首先实施哪些补丁。它是一种特别强大的安全助手,因为它可以阅读公司使用的所有软件库,以及其支持的功能和API的策略。 为了测试这个概念,NVIDIA构建了一个用于分析软件容器的流水线,以查找漏洞。这个代理以高精确度确定需要修补的区域,将人工分析师的工作速度加快了4倍。 结论明确,现在是将生成型人工智能作为漏洞分析的第一响应者的时候了。 填补数据空白 最后,利用LLM来帮助填补网络安全领域不断扩大的数据空白。 由于敏感性太高,用户很少分享有关数据泄露的信息。这使得预测攻击变得困难。 这就是LLM的用武之地。生成型人工智能模型可以创建合成数据,模拟以前未曾出现的攻击模式。这样的合成数据还可以填补训练数据的空白,以便机器学习系统学习如何在攻击发生之前防御。 进行安全模拟 不要等待攻击者展示可能性。创建安全模拟来了解他们可能如何尝试渗透企业防御。…

Leave a Comment

Microsoft的Azure AI模型目录以突破性的人工智能模型扩展

“`html Microsoft已经发布了Azure AI模型目录的重大扩展,其中包括一系列基础和生成型AI模型。这一举措标志着人工智能领域的重大进步,将不同的创新技术汇集在一起。 AI目录的多样增加 Azure AI模型目录现在包括40个新模型,引入了4种新模式,包括文本到图像和图像嵌入功能。主要增加的模型有: 稳定扩散模型:由Stability AI和CompVis开发,这些模型在文本到图像和图像修复任务中表现出色,为创意内容生成提供了稳健且一致的输出。 TII的Falcon模型:Falcon模型具有70亿和400亿参数,针对推断进行了优化,在性能上超过了许多开源模型。 Meta的Code Llama:一系列用于辅助编码任务的生成型文本模型,参数从70亿到340亿不等。 NVIDIA Nemotron:这款来自NVIDIA的80亿参数模型提供了各种功能,包括聊天和问答,与NVIDIA NeMo框架兼容。 Meta的SAM(Segment Anything Model):一种能够从简单的输入提示中创建高质量对象掩码的图像分割工具。 模型即服务(MaaS) 在战略上,微软还引入了模型即服务(MaaS)的概念。该服务将使专业开发人员能够将来自Meta的Llama 2、Cohere的Command、G42的Jais以及Mistral的高级模型作为API端点集成到其应用程序中。这种集成过程简化了开发人员资源供应和托管管理的复杂性。 创新型模型亮点 Jais:G42开发的具有130亿参数的模型,经过了包含1160亿阿拉伯语标记的数据集的训练。Jais是阿拉伯世界在人工智能方面的重要进步。 Mistral:拥有73亿参数的大型语言模型,由于具有分组查询注意力和滑动窗口注意力特征,因此其推断速度更快且响应序列更长。 Phi模型:包括Phi-1-5和Phi-2,这些变压器展示了改进的推理能力和安全措施,适用于从写作到逻辑推理的各个领域的应用。 面向未来的创新…

Leave a Comment

在亚马逊SageMaker JumpStart中使用Llama 2 Chat LLM的最佳提示实践

Llama 2位于人工智能创新的前沿,具备先进的自回归语言模型,基于复杂的变换器架构开发而成它专为商业和研究领域中的各种应用量身定制,主要的语言集中在英语上其模型参数从令人印象深刻的70亿增加到了引人注目的[…]

Leave a Comment

“NVIDIA 加速为企业定制生成型人工智能模型的开发”

如今,免费的开源大型语言模型(LLMs)的景象就像是一家任君选择的自助餐厅,满足企业的需求。对于开发者来说,这种丰富多样可能会让他们在构建定制的生成型人工智能应用程序时感到不知所措,因为他们需要满足独特的项目和业务需求,包括兼容性、安全性以及用于训练模型的数据。 NVIDIA AI Foundation Models 是一系列精心策划的企业级预训练模型,为开发者在企业应用中引入定制的生成型人工智能提供了快速的起步。 NVIDIA 优化的基础模型加速创新 NVIDIA AI Foundation Models 可以通过简单的用户界面或 API 直接从浏览器进行体验。此外,这些模型可以通过 NVIDIA AI Foundation Endpoints 进行访问,以便在企业应用中测试模型的性能。 可用的模型包括领先的社区模型,如 Llama 2、Stable Diffusion XL…

Leave a Comment

“新一代加速、高效的人工智能系统标志着超级计算的下一个时代”

英伟达今天在SC23上展示了下一波技术,将使全球科学和工业研究中心的性能和能效水平提升到新的高度。 “英伟达的硬件和软件创新正在创造一类新的AI超级计算机,”该公司高性能计算和超大规模数据中心业务副总裁Ian Buck在会议上的特别演讲中表示。 其中一些系统将搭载内存增强型NVIDIA Hopper加速器,其他系统将采用新的NVIDIA Grace Hopper系统架构。所有系统都将利用扩展的并行能力运行全套加速软件,包括生成AI、HPC和混合量子计算。 Buck将新推出的NVIDIA HGX H200描述为“世界领先的AI计算平台。” NVIDIA H200 Tensor Core GPU配备HBM3e内存,可运行不断增长的生成AI模型。 它最多可搭载141GB的HBM3e内存,是首个使用超快技术的AI加速器。与上一代加速器相比,NVIDIA H200 Tensor Core GPU在运行GPT-3等模型时性能提升了18倍。 在其他生成AI基准测试中,它们在Llama2-13B大型语言模型(LLM)上每秒能处理12,000个令牌。 Buck还透露了一种服务器平台,该平台在NVIDIA NVLink互连的基础上将四个NVIDIA GH200 Grace…

Leave a Comment

调和生成型人工智能的悖论:在生成和理解上,人类和机器智能的不同路径

从ChatGPT到GPT4再到DALL-E 2/3再到Midjourney,最新一波的生成式人工智能引起了全球范围内前所未有的关注。这种迷恋背后伴随着对“智能”所带来的风险的严重担忧,因为这种“智能”似乎超越了人类的能力。当前的生成模型可能会产生具有挑战性的结果,这些结果可以对在语言和视觉领域具有多年经验和专业知识的专家构成威胁,并且这为机器已经超越人类智慧的说法提供了有力的支持。与此同时,进一步审查模型的输出揭示出一些根本性的理解错误,即使对于非专家人员也令人惊讶。 这引发了一个看似矛盾的问题:它们如何解释这些模型明显超人的能力,同时又保持一套核心的错误,大多数人可以修复?他们认为,这种冲突来源于人类智慧的配置方式与当今生成模型的能力配置方式之间的差异。特别是,来自华盛顿大学和艾伦人工智能研究所的研究人员在这项工作中提出并调查了生成式AI悖论假设,该假设认为生成模型之所以可以比专家级的输出解释者更有创造力,是因为它们经过训练直接产生专家级的输出。 相比之下,人们几乎总是需要在提供专家级结果之前获得一个基础的理解。他们在受控研究中检查跨语言和视觉模态的生成模型的生成和理解能力来评估这个想法。在与生成任务相关的评估中,使用两个观点来构建“理解”:1)在给定生成任务的情况下,模型在相同任务的判别版本中能多好地选择适当的答案?和2)如若答案正确,模型对于关于生成响应的性质和适合性的查询能有多大程度的回应?因此,存在两个不同的实验设置:询问和选定。 尽管他们的发现在任务和模态之间有所不同,但仍然出现了某些明显的模式。在选择性评估方面,模型在生成任务环境中往往表现与人类相当甚至更好。但是,在判别性情境中,他们不如人类。后续的调查揭示了人类辨别能力对敌对输入的更强韧性以及它与生成能力的关系比它与GPT4的关系更密切。随着任务复杂性的增加,模型与人类之间的辨别力差距也越来越大。类似地,对于询问式评估,模型能够为多种任务提供高质量的输出,但是在回答有关同一生成内容的问题时,它们经常出错,并且它们的理解性能需要在人类理解中得到改进。 作者对生成模型和人类之间的能力配置的差异提出了许多可能的解释,例如模型训练的目标以及种类和数量的输入。他们的结论还具有一些进一步的影响。首先,它表明了当前对智能的理解是基于人类经验的,可能无法转化到人工智能上。虽然AI的能力在许多方面类似或超过人类智能,但它们的实际特性可能与人类思维过程中的预期模式大相径庭。相反,他们的结果警告我们不要从生成模型中得出关于人类智能和认知的结论,因为它们的专家级人类化输出可能掩盖了非人类化的机制。总的来说,生成式AI难题建议我们将模型视为与人类智能相比较的有趣对照。

Leave a Comment

结识FreeNoise:一种新的人工智能方法,可以使用多个文本提示生成长达512帧的视频

FreeNoise被研究人员引入作为一种在多个文本条件下生成更长视频的方法,克服了现有视频生成模型的局限性。它增强了预训练的视频扩散模型,同时保持内容一致性。FreeNoise通过重新安排噪声序列来实现长距离相关性和基于窗口的时间关注。一种运动注入方法支持基于多个文本提示生成视频。该方法显著扩展了视频扩散模型的生成能力,与现有方法相比,额外的时间成本很小。 FreeNoise通过重新安排噪声序列来实现长距离相关性,并采用基于窗口的融合实现时间关注。它通过最小的额外时间成本生成在多个文本条件下的更长视频。该研究还提出了一种运动注入方法,确保文本提示上的一致布局和物体外观。大量实验和用户研究验证了这种方法的有效性,超越了基准方法在内容一致性、视频质量和视频文本对齐方面的表现。 当前的视频扩散模型必须在训练过程中维护视频质量,因为它们仅被训练在有限数量的帧上。FreeNoise是一种无需调整的范式,通过增强预训练的视频扩散模型,使其能够生成在多个文本条件下的更长视频。它采用噪声重新安排和时间关注技术来提高内容一致性和计算效率。该方法还提出了一种运动注入方法,用于多提示视频生成,有助于理解视频扩散模型中的时间建模和高效视频生成。 FreeNoise范式通过增强预训练的视频扩散模型,用于更长的、多文本条件的视频生成。它采用噪声重新安排和时间关注来提高内容一致性和计算效率。一种运动注入方法确保在多提示视频生成中保持视觉一致性。实验结果证实了这种方法在扩展视频扩散模型方面的优越性,而该方法在内容一致性、视频质量和视频文本对齐方面表现出色。 FreeNoise范式通过增强预训练的视频扩散模型,用于更长的、多文本条件的视频生成,与先前的方法相比,额外时间成本约为17%。用户研究支持这一点,显示用户更喜欢FreeNoise生成的视频,因为它们在内容一致性、视频质量和视频文本对齐方面更好。该方法的定量结果和比较突显了FreeNoise在这些方面的卓越性。 总之,FreeNoise范式改进了预训练的视频扩散模型,用于更长的、多文本条件的视频生成。它采用噪声重新安排和时间关注来提高内容一致性和效率。一种运动注入方法支持多文本视频生成。大量实验证实了其优越性和较小的时间成本。它在FVD、KVD和CLIP-SIM等方面胜过其他方法,确保视频质量和内容一致性。 未来的研究可以改进FreeNoise中的噪声重新安排技术,以改进预训练的视频扩散模型,用于更长的、多文本条件的视频生成。还可以提升运动注入方法,以更好地支持多文本视频生成。为视频质量和内容一致性开发先进的评估指标对于更全面的模型评估至关重要。FreeNoise的适用性可以扩展到视频生成之外的领域,可能探索诸如图像生成或文本到图像合成等领域。在长视频和复杂文本条件下扩展FreeNoise为一个有趣的研究方向,以推动文本驱动视频生成的研究。

Leave a Comment

50+ 2023年11月最新的尖端人工智能AI工具

AI工具的开发正在迅速增加,每天都有新的工具问世。以下是一些可以增强您日常例行事务的AI工具。 AdCreative.ai 提升您的广告和社交媒体能力,使用AdCreative.ai——终极人工智能解决方案。 Hostinger AI网站构建器 Hostinger AI网站构建器提供直观的界面和先进的AI功能,用于构建任何用途的网站。 Motion Motion是一个巧妙的工具,利用人工智能创建适应您的会议、任务和项目的日程安排。 Otter AI Otter.AI利用人工智能实时生成会议记录的转录,这些转录可共享、搜索、访问和保护。 Sanebox Sanebox是一款由人工智能驱动的电子邮件优化工具。SaneBox的人工智能识别重要电子邮件,并自动组织其他邮件,帮助您保持专注。 Notion AI Notion AI是一个写作助手,可以帮助用户在Notion工作区内进行写作、头脑风暴、编辑和总结。 Pecan AI Pecan AI通过自动化预测分析解决当今的业务挑战:预算缩减、成本上升以及有限的数据科学和人工智能资源。Pecan的低代码预测建模平台提供基于人工智能的预测分析,指导数据驱动的决策,并帮助业务团队实现目标。 Aragon 使用Aragon轻松获得令人惊艳的专业头像照片。利用最新的人工智能技术,即可快速创建高质量的头像照片,无需预订摄影工作室或打扮一番。 Taskade…

Leave a Comment

通过深度生成模型的全面指标提升工程设计评估

在工程设计中,对深度生成模型(DGM)的依赖在近年来激增。然而,评估这些模型主要围绕统计相似性展开,通常忽视了设计约束、多样性和新颖性等关键方面。因此,对于开发和提出更全面、更细致的评估框架的需求变得日益显现。为了解决这个问题,一支研究团队致力于开发和提出一套完整的面向设计的度量标准,旨在更全面地了解DGM在工程设计任务中的能力和限制。 在工程设计中评估深度生成模型主要依赖统计相似性作为主要指标。然而,这种方法忽视了关键的设计约束,限制了探索多样化和新颖化设计解决方案的潜力。为了克服这些局限性,研究团队提出了一套精心挑选的针对工程设计任务的替代评估指标。这些指标涵盖了关键方面,包括约束满足性、多样性、新颖性和目标达成情况,提供了对DGM在工程设计中能力的更全面和深入的评估。 新引入的评估指标涉及工程设计任务的各个关键方面。这些指标包括约束满足性、性能、条件约束遵从性、设计探索和目标达成情况。每个指标都经过精心设计,以捕捉工程设计的复杂性和细微之处,从而更深入地理解DGM的优点和局限。通过将这些指标整合到评估过程中,研究人员和实践者可以更深入地了解设计空间,促进发现新颖和多样化的设计解决方案,并确保符合关键约束。 这些提出的度量标准经过严谨的过程开发,考虑到工程设计任务的多方面性质。它们为评估DGM的性能和能力提供了一个全面的框架,使研究人员和实践者能够做出明智的决策和工程设计的进展。整合这些指标可以促进更健全和深入的评估过程,促进发现符合严格约束并提供新颖和多样化视角的卓越设计解决方案。 该研究强调了在深度生成模型在工程设计领域中的综合评估指标的重要性。通过提供更细致和全面的方式评估DGM的能力,这些提出的度量标准为工程设计的重大进展铺平了道路。综合评估框架使研究人员和实践者能够更全面地探索设计空间,促进发现创新和多样化的解决方案,同时确保符合严格的设计约束。通过整合这些指标,工程设计领域将迎来重大的变革,鼓励探索新颖的设计可能性,打造更加创新和动态的景观。

Leave a Comment

揭秘生成人工智能:深入探究扩散模型和视觉计算演进

通过结合计算机生成的视觉图像或从图片中推断场景的物理特征,计算机图形学和3D计算机视觉团体已经致力于创建几十年来的物理真实模型。这个方法包括渲染、模拟、几何处理和摄影测量等,涉及到包括视觉效果、游戏、图像和视频处理、计算机辅助设计、虚拟和增强现实、数据可视化、机器人、自动驾驶车辆和遥感等几个行业。伴随着生成式人工智能(AI)的兴起,视觉计算的全新思维方式已经出现。仅凭书面提示或高水平人类指令作为输入,生成式AI系统可以创建和操纵逼真而有风格的照片、电影或3D物体。 这些技术自动化了以前只有专业领域知识专家才能完成的许多耗时任务。稳定扩散、ImaGen、Midjourney或DALL-E 2和DALL-E 3等视觉计算的基础模型为生成式AI带来了无与伦比的力量。这些模型在数亿到数十亿个文本-图像对中进行训练,它们非常庞大,只有几十亿个可学习的参数。这些模型是上述生成式AI工具的基础,并在强大的图形处理单元(GPU)云中进行了训练。 基于卷积神经网络(CNN)的扩散模型经常用于生成图像、视频和3D对象,它们以多模态的方式集成了使用transformer架构(如CLIP)计算的文本。尽管有资金支持的行业参与者在为二维图像生成开发和训练基础模型时使用了大量资源,但学术界仍有机会为图形和视觉工具的发展做出重要贡献。例如,如何调整目前的图像基础模型以在其他更高维度领域中使用,如视频和3D场景创建,仍需明确。 这主要是由于需要更具体类型的训练数据。例如,网络上有许多低质量和通用的二维照片示例,而高质量和多样化的三维对象或场景却相对较少。此外,将二维图像生成系统扩展到更高维度,以适应视频、三维场景或四维多视角一致场景合成的需求,不是立即明显的。目前的限制之一是计算问题:尽管庞大的(未标记的)视频数据在网络上可用,但当前网络架构往往过于低效,无法在合理的时间或计算资源上进行训练。这导致扩散模型在推理时间上相对较慢。这是由于它们网络的庞大尺寸和迭代性质造成的。 图1:该前沿论文介绍了视觉计算的扩散模型的理论和应用。最近,这些模型已成为在3D和4D中创建和修改图像、视频和对象的公认标准。 尽管存在一些未解决的问题,但过去一年中视觉计算的扩散模型数量大幅增加(详见图1中的示例)。该报告由多所大学的研究人员开发,其目标是对最近关注于扩散模型在视觉计算中应用的众多最新出版物进行整理评述,介绍扩散模型的原理,并识别出突出的问题。

Leave a Comment

“将生成式人工智能和强化学习融合实现自我改进”

介绍 在人工智能不断发展的领域中,两个关键角色联手合作,打开了新的局面:生成式人工智能和强化学习。这些尖端技术有潜力创造自我改进的人工智能系统,使我们离实现机器自主学习和适应的梦想更近了一步。这些工具为能够改进自己的人工智能系统铺平了道路,使得机器能够自主学习和自适应的想法更加接近。 近年来,人工智能在理解人类语言、帮助计算机观察和解释周围世界方面取得了巨大成就。像GPT-3这样的生成式人工智能模型和Deep Q-Networks这样的强化学习算法站在这一进展的前沿。尽管这些技术在单独使用时已经具有了革命性的影响力,但它们的融合打开了人工智能能力的新维度,并将世界的边界推向了更舒适的境地。 学习目标 获取关于强化学习及其算法、奖励结构、强化学习的一般框架和状态-动作策略的必要和深入的知识,以了解代理机构如何做出决策。 探索这两个领域如何共生地结合在一起,以在决策情景中创建更具适应性和智能性的系统。 研究和分析各种案例研究,展示将生成式人工智能与强化学习在医疗保健、自主车辆和内容创作等领域进行整合的有效性和适应性。 熟悉Python库,如TensorFlow、PyTorch、OpenAI’s Gym和Google’s TF-Agents,以在实施这些技术时获得实际的编程经验。 本文作为数据科学博文马拉松的一部分发表。 生成式人工智能:赋予机器创造力 生成式人工智能模型,如OpenAI的GPT-3,旨在生成内容,无论是自然语言、图像还是音乐。这些模型的工作原理是预测在给定上下文中接下来会发生什么。它们已经被用于自动化内容生成和能够模仿人类对话的聊天机器人等方面。生成式人工智能的特点是能够从学习到的模式中创造出新的东西。 强化学习:教会人工智能做出决策 来源–Analytics Vidhya 强化学习(RL)是另一个开创性的领域。它是让人工智能像人类一样通过试错学习的技术。它已经被用于教授人工智能玩复杂的游戏,如Dota 2和围棋。强化学习代理通过接收行为的奖励或惩罚来学习,并利用这些反馈来不断改进。从某种意义上讲,强化学习使人工智能获得了一种自治形式,使其能够在动态环境中做出决策。 强化学习的框架 在本节中,我们将揭示强化学习的关键框架: 行为实体:代理机构 在人工智能和机器学习领域,术语“代理机构”指的是任务是与指定的外部环境进行交互的计算模型。它的主要角色是做出决策和采取行动,以实现既定目标或在一系列步骤中累积最大奖励。 周围的世界:环境 “环境”指的是代理人操作的外部背景或系统。实质上,它构成了超出代理人控制范围但可以观察到的每一个因素。这可以是虚拟游戏界面,也可以是机器人在迷宫中导航的现实世界环境。环境是评估代理人表现的“真实基准”。…

Leave a Comment