Press "Enter" to skip to content

四海吧 Posts

KAIST研究人员引入FaceCLIPNeRF:使用可变形NeRF的文本驱动的3D人脸操作流程

3D数字人类内容改进的关键组成部分是能够轻松操纵3D面部表达。虽然神经辐射场(NeRF)在重建3D场景方面取得了重大进展,但其许多操纵技术都集中在刚性几何或颜色操纵上,这需要改进以满足对面部表情具有细粒度控制的工作的需求。尽管最近的一项研究提出了一种区域控制的面部编辑方法,但它需要从选定的训练帧中收集用户注释的面部不同部分的蒙版,然后进行人工属性控制以实现所需的改变。 面部特定的隐式表示技术使用可变形面部模型的参数作为先验,以高保真度地编码观察到的面部表情。然而,它们的手动操作需要涵盖一系列面部表情并且大约包含6000帧的大型训练集。这使得数据收集和操作过程都变得艰巨。与此不同,KAIST和Scatter Lab的研究人员开发了一种方法,该方法通过包含几种不同类型的面部变形实例的动态肖像视频进行训练,从而允许基于文本的修改,如图1所示。 图1 他们的方法在控制面部变形之前使用HyperNeRF从一个规范空间学习并隔离观察到的变形。特别地,通过训练帧间共享的常见潜在代码条件隐式场网络和逐帧变形潜在代码进行教学。他们的基本发现是使用多个空间可变的潜在代码来表示操纵任务的场景变形。这个顿悟是从朴素地将HyperNeRF公式应用于操纵问题的缺点中产生的,即寻找一个编码所需面部扭曲的单个潜在代码。 例如,单个潜在代码无法传达需要许多情况下所见的局部变形混合的面部表情。在他们的研究中,他们将这个问题称为“链接的局部属性问题”,并通过提供具有空间可变潜在代码的修改场景来解决它。为了做到这一点,他们首先将所有观察到的变形编译成一组锚定代码,然后教导多层感知机(MLP)将它们组合起来生成多个位置条件潜在代码。然后,通过将潜在代码的生成图像与CLIP嵌入空间中的目标文本接近,实现了潜在代码对目标文本的视觉特征的反映。总之,他们的工作对以下方面做出了贡献: • 设计一种学习使用具有空间可变潜在代码表示场景的操纵网络 • 提出了基于文本驱动的使用NeRF重建的面部的操纵流程 • 据他们所知,第一个能够操纵使用NeRF重建的面部的文本。

Leave a Comment

机器人领域的新曙光:基于触摸的物体旋转

在一项具有突破性的研究中,加利福尼亚大学圣地亚哥分校(UCSD)的工程师团队设计出一只机器手,可以仅通过触觉旋转物体,而无需视觉输入这种创新的方法灵感来自于人类不一定需要看到物体就能轻松处理它们的方式一种触感敏感的方法[…]

Leave a Comment

Excel中的金融函数综合指南

专业人士已经开始依赖Excel的多功能能力在各个行业中使用,金融行业也不例外。Excel提供了许多强大的功能和多样化的操作,为金融研究、建模和计算提供了一个出色的平台。本综合指南旨在探索Excel强大的金融功能,阐明其重要性,并传授有效的方法来利用它们来优化金融流程。让我们一起深入Excel的金融能力的世界,释放其在增强金融分析和决策方面的潜力。 什么是Excel金融? Excel金融使用微软Excel强大的能力进行金融计算、数据分析和金融建模。它为金融专业人士提供了一个多功能的工具集,以便高效、有效地处理金融任务。 Excel中的金融函数是什么? Excel中的金融函数是预定义的专门执行金融计算的公式。它们使金融专业人员能够分析财务数据、做出投资决策、计算利率、确定付款计划以及评估风险和回报概况。Excel提供了一个全面的金融函数套件,可以处理各种不同的金融场景。 Excel中的前十个金融函数 PV(现值) FV(未来值) NPV(净现值) IRR(内部收益率) PMT(付款) RATE NPER(期数) PPMT(本金支付) IPMT(利息支付) MAX和MIN PV(现值) PV函数计算投资或现金流的现值,考虑折现率和期间。 公式 PV(rate,nper,pmt,[fv],[type]) Rate:投资的每期利率。 Nper:支付期数或现金流的总期数。它表示投资的持续时间或现金流发生的期数。 Pmt:每期发生的付款或现金流量金额。它可以是一个固定值或一种年金(一系列相等的付款)。 [Fv]:可选。期望在最后期间结束时达到的未来价值或现金余额。如果省略,Excel将假定为零。 [Type]:可选。它指定付款在每个期间的开始(type…

Leave a Comment

在虚拟现实中推进人体动作识别:这篇人工智能论文介绍了具有骨骼大内核注意力的LKA-GCN,以实现无与伦比的性能

基于骨架的人体动作识别是一种计算机视觉领域,通过分析视频数据中的骨骼关节位置来识别人体动作。它使用机器学习模型来理解时间动态和空间配置,从而在监控、医疗、体育分析等领域应用。 自从这个研究领域出现以来,科学家们遵循了两种主要策略。第一种策略是手工制作的方法:这些早期技术应用3D几何操作来创建输入经典分类器的动作表示。然而,它们需要人工辅助来学习高级动作线索,导致性能过时。第二种策略是深度学习方法:深度学习的最新进展已经改变了动作识别的方式。最先进的方法专注于设计能够捕捉空间拓扑和时间运动相关性的特征表示。更准确地说,图卷积网络(GCNs)已经成为基于骨架的动作识别的强大解决方案,在各种研究中取得了令人印象深刻的结果。 在这个背景下,最近发表了一篇新文章,提出了一种名为“骨架大核关注图卷积网络”(LKA-GCN)的新方法。它解决了基于骨架的动作识别中的两个主要挑战: 长程依赖性:LKA-GCN引入了骨架大核关注(SLKA)算子,以有效捕捉关节之间的长程相关性,克服了现有方法中的过度平滑问题。 有价值的时间信息:LKA-GCN采用手工制作的关节运动建模(JMM)策略,专注于具有显著关节运动的帧,增强了时间特征,提高了识别准确性。 该方法将骨架数据作为图形进行时空图建模,其中空间图形捕捉人体关节的自然拓扑,而时间图形编码相邻帧中相同关节之间的相关性。图形表示是从骨架数据生成的,它是表示随时间变化的人体关节的一系列三维坐标。作者引入了SLKA算子,将自注意机制与大核卷积相结合,以高效地捕捉人体关节之间的长程依赖关系。它通过更大的感受野聚合间接依赖关系,同时最小化计算开销。此外,LKA-GCN还包括JMM策略,通过计算反映局部范围内平均关节运动的基准帧,专注于信息丰富的时间特征。LKA-GCN由时空SLKA模块和识别头组成,利用多流融合策略来提高识别性能。最后,该方法采用多流方法,将骨架数据分为三个流:关节流、骨流和运动流。 为了评估LKA-GCN,作者使用了各种实验对三个基于骨架的动作识别数据集(NTU-RGBD 60、NTU-RGBD 120和Kinetics-Skeleton 400)进行了实验研究。将该方法与基准进行了比较,并分析了SLKA算子和关节运动建模(JMM)策略等不同组件的影响。还探讨了两流融合策略。实验结果表明,LKA-GCN优于最先进的方法,证明了其在捕捉长程依赖关系和提高识别准确性方面的有效性。视觉分析进一步验证了该方法捕捉动作语义和关节依赖性的能力。 总之,LKA-GCN解决了基于骨架的动作识别中的关键挑战,捕捉了长程依赖关系和有价值的时间信息。通过SLKA算子和JMM策略,LKA-GCN在实验评估中优于最先进的方法。其创新方法在各种应用中有望实现更准确、更稳健的动作识别。然而,研究团队也意识到一些限制。他们计划扩展他们的方法,包括深度图和点云等数据模态,以获得更好的识别性能。此外,他们还计划使用知识蒸馏策略来优化模型的效率,以满足工业需求。

Leave a Comment

稳定AI的稳定扩散XL 1.0:AI图像生成的突破

稳定AI是一家领先的人工智能初创公司,通过推出稳定扩散XL 1.0,再次推动了生成式AI模型的边界。这款最新的文本到图像模型以其鲜艳的色彩、惊人的对比度和令人印象深刻的照明将图像生成领域带入了一种革命性的状态。但在兴奋之际,伦理问题开始引起关注,因为该模型的开源性质引发了关于潜在误用的问题。让我们深入了解稳定扩散XL 1.0的世界,探索其特点、能力以及稳定AI为防止生成有害内容所采取的措施。 还阅读:稳定AI的StableLM与ChatGPT竞争的文本和代码生成 认识稳定扩散XL 1.0:一个重大进步 稳定AI再次推出稳定扩散XL 1.0,在人工智能领域掀起了波澜。这款先进的文本到图像模型被誉为稳定AI迄今为止最复杂的产品。该模型配备了35亿个参数,能够在几秒钟内生成完整的100万像素分辨率的图像,支持多种宽高比。 还阅读:用Adobe Illustrator的“生成重彩”人工智能转变您的图片 图像生成的强大和多样性 稳定扩散XL 1.0在色彩准确性、对比度、阴影和照明方面相比前作有着显著的改进。该模型的增强功能使其能够生成更具生动视觉吸引力的图像。此外,稳定AI还简化了针对特定概念和风格微调模型的过程,发挥了自然语言处理提示的潜力。 还阅读:如何使用生成式人工智能免费创建美丽图片? 文本生成和可读性的艺术 稳定扩散XL 1.0在文本到图像模型领域脱颖而出,因其先进的文本生成和可读性而备受瞩目。许多人工智能模型在生成包含易读的标志、书法或字体的图像方面存在困难,而稳定扩散XL 1.0通过提供令人印象深刻的文本渲染和可读性证明了其实力。这为创造性表达和设计可能性打开了新的大门。 还阅读:Meta推出“人类化”设计师人工智能用于图像 伦理挑战:潜在误用和有害内容 作为开源模型,稳定扩散XL 1.0具有巨大的创新和创造潜力。然而,这种开放性也带来了伦理问题,因为恶意行为者可以利用它生成有毒或有害内容,包括非自愿的深度伪造图像。稳定AI意识到滥用的可能性以及模型中存在的某些偏见。 还阅读:由AI生成的五角大楼爆炸虚假图像导致美国股市下跌 防止生成有害内容 稳定AI积极采取措施,使用稳定扩散XL…

Leave a Comment

2023年最佳基于人工智能的艺术生成器

梦幻帮助 Wombo 梦幻帮助是一种与其他AI图片生成器相比,可以进行连续图像合成而无需额外费用的AI生成器。如果您的预算有限或刚开始使用,这款AI生成器是一个很好的选择。梦幻帮助也非常用户友好。您必须注册、撰写一些内容并选择图像风格,然后才能开始使用。如果您不喜欢为您生成的视觉类型,您可以随时重新开始。 DALL-E 2 OpenAI于2021年发布了DALL-E 2。OpenAI开发了一个名为DALL-E 2的图像生成AI模型的新版本。DALL-E 2与其前身一样,旨在根据文字输入生成专业标准的图像。DALL-E 2在多个方面改进了其前身,包括生成更高质量、更细腻的图像的能力。DALL-E 2可以处理更细腻的文本信号并响应各种视觉表达。此外,它可以根据特定用途或领域进行调整,例如在拍摄特定主题或地点的图像时。 Midjourney 由于其广泛的功能和极快的合成速度,Midjourney可以说是最好的人工智能(AI)图片生成器。向Midjourney发送短信命令,它将处理剩下的事情。许多创意专业人士使用Midjourney生成作为他们工作灵感的图像。使用Midjourney制作的人工智能作品“Théâtre d’Opéra Spatial”在科罗拉多州博览会的美术类别中击败了其他20位画家,获得了第一名。但是,目前,Midjourney可以在Discord服务器上找到。您必须加入MidJourney Discord服务器并使用机器人的命令来制作图像。不过,这很简单,您可以立即开始工作。 梦幻工作室(稳定扩散) 梦幻工作室,也被称为稳定扩散,是一款流行的文本到图像的AI生成器。它是一个免费和公共模型,可以即时可视化文本建议。照片、插图、3D模型甚至标志都在梦幻工作室可能创作的范围之内。通过将用户上传的图像与书面描述相结合,可以制作逼真的艺术品。 Craiyon Craiyon是一款有趣的人工智能图片生成器,网站和应用程序可在Google Play商店上提供给Android设备。DALL-E的免费版本(前身为DALL-E Mini)具有与商业版本相同的功能。您可以根据文本说明制作出不错的图片。不幸的是,Craiyon的服务器不稳定经常导致创建过程中的长时间延迟和不幸的设计缺陷。这些图片可以用于个人和商业用途,前提是给予Craiyon适当的信用并遵守使用条款。 FotorAI图像生成器 该公司提供FotorAI图像生成器,使用AI技术生成原始照片。用户可以输入示例图像,然后生成全新的图像。这个新功能使用生成对抗网络(GAN)来创建据称具有高分辨率、逼真的图像。它具有许多应用,包括为数字媒体创建原创艺术品。您只能在Fotor的付费版本中获得它。 Nightcafe…

Leave a Comment

见到GOAT-7B-社区模型:一种在GoatChat应用收集的数据集上对AI模型Fine-Tuned LLaMA-2 7B模型进行微调的模型

最近,AI研究实验室的科学家们发布了GOAT-7B-Community模型,该模型通过使用GoatChat应用的数据对LLaMA-2 7B模型进行了改进。Meta的LLaMA v2 7B经过微调,成为了最先进的GOAT-7B-Community模型,利用了从GoatChat应用获得的新颖、细粒度的数据集。 “对齐”在创建大型语言模型(LLM)中至关重要。这是一种模型可以拒绝回答其认为不道德或非法的问题的思想,基于其教育和经验。对齐对于道德AI实施至关重要,但也给模型优化带来了新的障碍。 研究人员注意到,通过对齐生成的回答很少提供客户所需的精确细节。这些反应通常更为温和,表明不愿意详细阐述。解决这个问题是至关重要的,如果要构建一个可靠的模型,为问题提供深入和完整的回答。他们发现,对齐过滤器并不能消除所有不当建议。因此,对齐通常会导致丢弃大量的数据集。这相当于案例中总信息的三分之一左右。 鉴于这个问题,研究人员开发了一种新的清理数据集的技术。此外,他们进行了一项受管制的实验,以全面了解对齐回复对模型性能的影响。 科学家们是如何受教的 配备八个A100 NVIDIA GPU的高性能节点为深度学习计算提供了支持。研究人员选择了bfloat16浮点格式和DeepSpeed ZeRO-3优化作为训练过程的基础。他们对模型进行了三次迭代,每隔一个时期保存一次进展。然而,经验证据显示,执行一个时期后,质量开始下降。这促使他们重新思考他们的策略,并选择进行一次训练时期并进行一次中途检查。常用的评估语言模型的标准,如MMLU和BigBench Hard,用于评估GOAT-7B-Community模型。团队目前正在分析所有模型,并将很快发布他们的研究结果。 用途 大语言模型和聊天机器人的研究是GOAT-7B-Community的主要关注点。自然语言处理、机器学习和人工智能的学者和爱好者将发现它特别有用。 限制 尽管具有令人印象深刻的推理能力,该模型仍然存在与其相对较小的规模(7B模型被认为是“小型”LLM)相关的问题。其中最明显的问题是“幻觉”。这些“幻觉”是一个不断阻碍解决的障碍,随着LLM的改进和扩展。 “幻觉”是人工智能研究中非常强调的一个持久性问题。最终目标是开发出能够产生逻辑上正确、符合语法的答案,并忠实于所提供事实的模型。 风险和偏见 由于GOAT-7B-Community模型使用了公共和专有数据进行训练,因此该模型的可靠性不高,可能会返回与现实相悖的结果。因此,GOAT-7B-Community模型可能产生不准确、有偏见甚至令人反感的结果。 主要观察 没有比这更好的免费7B模型。 良好的MMLU结果的关键是多样化和高质量的数据集。 与当前的13B模型相比,7B的表现令人钦佩。 然而,尺寸限制仍然存在。…

Leave a Comment

FraudGPT AI 动力的网络犯罪工具的惊人崛起

在互联网的一个黑暗而不祥的角落,网络犯罪分子再次利用人工智能的力量推进其恶意议程。继臭名昭著的WormGPT之后,又有一个新角色出现了,它的名字是FraudGPT。这个邪恶的AI工具专门设计用于攻击目的,使威胁行为者能够策划复杂的网络犯罪,从钓鱼邮件到创建不可检测的恶意软件。随着网络安全界迎接又一个挑战,让我们深入探讨FraudGPT的世界以及对在线安全的潜在影响。 也可阅读:犯罪分子使用人工智能冒充亲人 担心FraudGPT的崛起:黑暗网络的轰动 就在网络安全界正在从WormGPT的影响中恢复过来之际,FraudGPT作为最新一款网络犯罪生成的AI工具出现了。这一存在被Netenrich安全研究员Rakesh Krishnan揭露,他对这个新的AI威胁发出了警报。FraudGPT在暗网市场和秘密的Telegram频道上提供了一系列邪恶的攻击能力。 也可阅读:网络犯罪分子使用WormGPT侵犯电子邮件安全 FraudGPT背后的行为者 在匿名的可怕幕布后面,一个名为“CanadianKingpin”的神秘行为者声称负责制作FraudGPT。这个AI机器人专门为网络犯罪分子提供各种工具和功能,以适应他们的恶意意图。从钓鱼邮件到破解工具和卡片欺诈,FraudGPT是一个落入错误手中的强大武器。 订阅和费用 网络犯罪的地下世界并不靠善意运作,而是由利润驱动。FraudGPT也不例外,每月订阅费用为200美元,六个月和一年的订阅费用分别为1000美元和1700美元,享有折扣。这种付费模式使得那些愿意利用其能力的人更易接触到它。 揭示威胁 负责开发FraudGPT的确切大型语言模型(LLM)仍然是一个谜。然而,它的影响远非隐形。通过3000多个确认的销售和评论,网络犯罪分子正在找到使用其能力进行恶意目的的创造性方式。从编写不可检测的恶意代码到识别泄漏和漏洞,FraudGPT对网络安全构成严重威胁。 也可阅读:PoisonGPT:Hugging Face的LLM散播假新闻 利用AI进行网络犯罪活动 网络犯罪分子正在利用OpenAI ChatGPT等AI工具的可用性,创建没有道德保障的对抗性变体。FraudGPT就是这种趋势的典型,使新手行为者能够扩大规模发动复杂的钓鱼和商业电子邮件妥协攻击。 也可阅读:在AI时代如何检测和处理Deepfake? 升级的钓鱼即服务(PhaaS)模式 钓鱼长期以来一直是网络犯罪分子钟爱的技术,但FraudGPT将其提升到一个全新的水平。其强大的AI驱动能力成为新手行为者发动令人信服的钓鱼和商业电子邮件妥协(BEC)攻击的跳板。潜在的后果包括窃取敏感信息和未经授权的电汇。 也可阅读:在使用生成AI工具时保护您的隐私的6个步骤 伦理困境 像ChatGPT这样的AI工具可以与伦理保障一起开发,但FraudGPT证明了这些保障可以轻易被规避。正如Rakesh Krishnan所指出的那样,实施深层防御策略对于应对这些快速移动的威胁至关重要。组织必须利用所有可用的安全遥测进行快速分析,以在网络威胁演变为勒索软件攻击或数据外泄之前识别和挫败网络威胁。 也可阅读:Airtel开发AI工具识别欺诈钓鱼信息…

Leave a Comment

人工智能渴望在乌克兰的战场上留下一席之地!

最近,乌克兰意外地成为了人工智能公司的金矿。全球科技巨头纷纷涌向乌克兰,寻求获取无价的战场数据,这些数据有望彻底改变人工智能和机器学习的发展。乌克兰以其饱受战争摧残的地貌而闻名,已经成为寻求利用这些难以获取的数据开发未来国防技术的尖端公司的热点地区。随着争夺人工智能在战争中的至高无上地位的竞争加剧,让我们深入探讨像Draganfly和Palantir这样的公司如何利用乌克兰独特的资源,并对现代战争的未来产生了什么影响。 另请阅读:前谷歌CEO将为美国军方提供人工智能和虚拟现实技术支持 乌克兰在人工智能和数据方面的日益重要性 乌克兰最初对科技公司持开放态度,现在认识到了其战场数据的重要性。由于人工智能系统严重依赖高质量的训练数据,乌克兰战争产生的信息变得极其珍贵。为了从这些宝贵的数据中获益,本地和全球公司都在关注其提升人工智能技术的潜力。 Draganfly进军乌克兰数据金矿 领先的无人机公司Draganfly一直在人工智能驱动创新的前沿。它进军乌克兰是为了利用该地持续冲突所产生的数据。通过为该国提供用于军事任务的改装无人机,Draganfly获得了无价的数据洞察,这对于开发先进的人工智能系统至关重要。 另请阅读:人工智能在无人机中的力量 Palantir在乌克兰的战略存在 Palantir是一家知名的数据分析公司,它加入了乌克兰的科技巨头行列。在基辅设立办事处,Palantir旨在利用乌克兰的战场数据潜力来增强其服务。这种独特数据的吸引力为Palantir提供了提升其人工智能能力并巩固其在国防领域地位的机会。 另请阅读:Palantir推出军事决策人工智能平台 人工智能在未来战争中的关键作用 从美国国防部为人工智能项目分配大量资金可以看出,全球对人工智能在未来战争中关键作用的认识日益增强。人工智能将赋予决策支持系统以力量,并创建一个跨各个领域无缝信息流的网络化军队。为了实现这一目标,高质量的数据是必不可少的,而乌克兰的冲突则成为了一个理想的测试场地。 另请阅读:改变战场:人工智能驱动军事战术 利用现实场景进行人工智能训练 使用乌克兰的战场数据的一个关键优势是它提供了真实的场景。公司可以在有争议的环境中测试和训练他们的人工智能系统,从而获得对其局限性和能力的宝贵洞察。这些数据比受控环境中的数据更有价值,因为它有助于改进下一代人工智能技术。 另请阅读:由人工智能控制的美国军用无人机的惊人决策:“杀死”操作员 乌克兰:全球科技巨头的试验场 乌克兰已成为各种科技公司的试验场,吸引了Clearview、AeroDrone等公司的兴趣。这个战区为分析部队管理和开发智能自动解决方案提供了独特的机会。在任务中收集的大量数据为将无人机用于各个行业和冲突提供了关键的信息。 另请阅读:Red Cat和Athena AI利用夜视技术制造智能军用无人机 美国与中国:人工智能至高无上之战 随着美国和中国在人工智能至高无上之战中的竞争,五角大楼缓慢的采购流程对于保持技术优势构成了挑战。中国在人工智能和数据方面的大量投资使美国处于不利地位。五角大楼在人工智能采用和数据管理方面的努力对于在人工智能竞赛中保持领先地位至关重要。 另请阅读:人工智能军备竞赛:美国与中国之间的致命竞争 我们的观点…

Leave a Comment

在Mac上稳定使用高级Core ML量化的Diffusion XL

昨天发布了稳定扩散 XL,它非常棒。它可以生成大尺寸(1024×1024)的高质量图像;通过一些新的技巧改进了对提示的遵循性;由于最新的噪声调度器研究,它可以轻松产生非常暗或非常明亮的图像;而且它是开源的! 不足之处是,该模型更大,因此在消费者硬件上运行速度更慢,更困难。使用最新版本的 Hugging Face 扩散器库,您可以在 16 GB 的 GPU 内存上的 CUDA 硬件上运行稳定扩散 XL,从而可以在 Colab 的免费版本上使用它。 过去几个月表明,人们对于出于各种原因在本地运行 ML 模型非常感兴趣,包括隐私、便利性、更容易的实验或不受计量的使用。我们在 Apple 和 Hugging Face 都在努力探索这个领域。我们已经展示了如何在 Apple…

Leave a Comment

揭示文本分析的未来:使用BERT进行时尚主题建模

介绍 在机器学习和自然语言处理中,一种高效的方法是主题建模。文本语料库是一组文档的示例。该技术涉及发现出现在文本中的抽象主题。这种方法突显了文本体系的潜在结构,揭示了可能不会立即显现的主题和模式。 为了分析大规模文档集合(例如数千条推文)的内容,主题建模算法依赖于统计技术来发现文本中的模式。这些算法通过检查文档中的词频和词共现来将文档分类为少数几个主题。因此,内容看起来更有组织和可理解,更容易识别数据中的潜在主题和模式。 潜在狄利克雷分配(LDA)、潜在语义分析和非负矩阵分解是一些常规的主题建模技术。然而,本博文使用BERT进行主题建模。 了解更多:使用潜在狄利克雷分配(LDA)进行主题建模 学习目标 以下是使用BERT进行主题建模的学习目标,以项目符号形式给出: 了解主题建模的基础知识以及在自然语言处理中的应用。 了解BERT的基础知识以及它如何创建文档嵌入。 对文本数据进行预处理,以便为BERT模型准备数据。 利用[CLS]标记从BERT的输出中提取文档嵌入。 使用聚类方法(如K均值)对相关材料进行分组并找到潜在主题。 利用合适的度量标准评估生成的主题的质量。 通过这个学习目标的帮助,参与者将获得使用BERT进行主题建模的实践经验。利用这些知识,他们将能够分析和提取大规模文本数据中隐藏的主题。 本文是数据科学博文马拉松的一部分。 加载数据 这是澳大利亚广播公司八年来在Kaggle上提供的可访问内容。它包含两个重要的列:publish_date:文章的发布日期,格式为yyyyMMdd。headline_text是标题文本的英文翻译。这是主题模型将使用的知识。 import pandas as pd # 读取数据集 data =…

Leave a Comment

INDIAai和Meta联手:为人工智能创新和合作铺平道路

在一个有望的发展中,INDIAai和Meta已经联手在人工智能(AI)和新兴技术领域建立起了强大的合作关系。通过签署谅解备忘录(MoU),这两个组织将共享自己的专业知识和资源,使Meta的开源AI模型得以使用。这种合作伙伴关系标志着在印度数字领域中促进AI创新、推动社会包容和推动经济增长迈出了重要的一步。让我们来探讨一下这个令人兴奋的合作以及它对AI研究和开发的潜在影响。 此外还有:印度将在G20提议基于AI的门户网站:对中小企业来说是一场改变游戏规则的机遇 INDIAai和Meta:AI进步的联盟 INDIAai是一个知识门户和研究组织,与AI技术领域的领先者Meta合作。该谅解备忘录旨在建立合作框架,促进Meta的开源AI模型在印度的使用。通过利用尖端AI技术,两个实体都打算应对大规模的挑战,改变该国的AI生态系统。 INDIAai的愿景 作为一个知识共享平台和生态系统建设举措,INDIAai在统一印度AI领域内的各个实体方面起着关键作用。通过合作和伙伴关系,INDIAai旨在促进人工智能领域的研究、开发和创新。 此外还有:Sam Altman与印度总理纳伦德拉·莫迪的重要会晤:绘制印度的AI未来 利用Meta的AI研究模型 INDIAai和Meta之间的合作不仅限于开源AI模型。这两个组织正在探索建立一个卓越中心,培养AI和新兴技术领域的创业公司。通过利用Meta的AI研究模型,如Llama、Massively Multilingual Speech和No Language Left Behind,重点是构建印度语言的数据集,以增强翻译和大型语言模型,特别关注资源匮乏的语言。 此外还有:Meta的Llama 2:开放商业使用 促进社会包容和政府服务交付 INDIAai和Meta的共同努力预计将促进印度的社会包容和改善政府服务交付。通过使用大型语言模型、生成式AI、认知系统和翻译模型,合作旨在提高各个部门和社区对AI技术的可访问性。 此外还有:政府对芯片设计的干预:对印度半导体雄心的福音还是祸根? Meta对AI创新的开放态度 Meta全球事务主席Nick Clegg强调了该公司对AI创新的开放态度。通过向企业、初创公司和研究人员提供他们尖端技术的访问权限,Meta旨在创造社会和经济机会。与“印度AI”的合作为加强印度的数字领导地位和开发适应该国独特需求的AI工具提供了一个令人兴奋的前景。 此外还有:Meta开源了他们所有有前途的项目|找出原因 推广负责任的AI实践…

Leave a Comment

人工智能如何推动清洁能源的未来

AI正在通过利用太阳、风能和尖端技术来改善世界的能源供应方式。 《I AM AI》视频系列的最新一集展示了人工智能如何帮助优化太阳能和风能发电厂、模拟气候和天气、增强电网的可靠性和弹性、推动碳捕获和能源融合的突破。 所有这些都得益于NVIDIA及其关注能源问题的合作伙伴,他们利用和开发技术突破,为更清洁、更安全、更可持续的未来做出贡献。 家庭和企业需要可靠、经济的燃料和电力来满足日常活动的能源需求。 可再生能源,如阳光、风能和水力,正在不断扩大部署和可用容量。但它们也给传统的单向电力流动的旧电网带来了负担:从发电厂通过输电线路和配电线路到最终用户。 人工智能和加速计算的最新进展使能源公司和公用事业公司能够实时平衡供应和需求,并管理分布式能源资源,同时降低消费者的月度费用。 在新的I AM AI视频中,以及以下介绍的企业和初创公司都在使用这些创新技术来解决各种清洁能源的应用案例。 电力站点优化 公司正在借助人工智能改善可再生能源发电站点的维护。 例如,现实捕捉平台DroneDeploy正在使用人工智能评估太阳能发电厂的布局,最大化每个站点产生的能量,并自动监测现场太阳能电池板和其他设备的健康状况。 可再生能源公司西门子Gamesa正在与NVIDIA合作,应用人工智能代理模型来优化其离岸风电场,以最低成本输出最大功率。两家公司正在探索由NVIDIA Omniverse和NVIDIA Modulus平台驱动的神经超分辨率技术,将高分辨率的尾流模拟速度提高了4000倍,与传统方法相比,从40天缩短到仅15分钟。 意大利的THE EDGE COMPANY是NVIDIA Metropolis视觉AI合作伙伴生态系统的成员,他们正在跟踪离岸风电场附近的濒危鸟类,为运营商提供实时建议,帮助预防碰撞并保护濒危物种。 电网基础设施维护 人工智能也有助于保持能源电网的安全和高效。 NVIDIA Metropolis合作伙伴Noteworthy…

Leave a Comment

生成式人工智能将如何革新现场服务运营的四种方式:探索潜在的应用

生成式人工智能(GAI)一直是科技和商业媒体今年关注的焦点这在很大程度上是由Open AI发布ChatGPT和GPT-4所推动的这两个强大的多模态语言模型都具备深度学习能力这种新技术的受欢迎程度和随后的采用并不令人意外与其他病毒式技术不同,例如[…]

Leave a Comment

OpenAI、微软和谷歌联合成立机构,以协助监管人工智能发展

前沿模型论坛是由OpenAI、微软、Anthropic和谷歌创建的一个新组织,专注于“安全和负责任”的前沿AI模型的开发这个新的行业机构汇集了四家最具影响力的科技巨头,它们正在开发人工智能根据该组织的说法,他们的重点将是…

Leave a Comment

2023年最佳人工智能游戏生成器

AI游戏生成器可以使用AI算法创建完整的视频游戏。这些游戏可以是简单的纸牌游戏,也可以是复杂的策略竞赛。由于AI游戏生成器允许设计师为玩家制作有趣且具有挑战性的游戏,而无需编写任何代码,因此它们变得越来越受欢迎。 使用AI游戏生成器的主要好处包括更快的迭代时间,更严格的质量保证,更沉浸式的游戏体验和更好的平台可移植性。此外,AI游戏生成器还可以用于创建完全新颖的体验,这在使用传统的创作方式是不可能的。 场景 场景是一个由人工智能驱动的程序,提供各种选项,用于为视频游戏制作视觉效果。它的目的是帮助游戏设计师创建符合游戏整体美学的原创高质量游戏艺术。场景的可调整性是它最令人印象深刻的特点之一。通过这个功能,您可以教导AI模型模仿您的美学。上传您的训练数据,AI将分析并学习重复出现的主题、颜色或设计。一旦AI经过训练,它就可以创建反映您美学偏好的新图像。 Promethean AI Promethean AI是制作视频游戏虚拟世界的早期采用者。该程序利用人工智能简化了3D场景的创建,使游戏设计师能够更轻松地创建广阔、沉浸式的世界。Promethean AI以最小的输入构建新颖的场景的能力是其最显著的特点之一。借助Promethean AI,您可以快速轻松地创建您梦想中的世界,无论是茂密的森林还是未来主义的都市。 Ludo.ai 在制作有趣而有趣的游戏方面,Ludo.ai彻底改变了规则。人工智能监控玩家的行为,并根据每个人的喜好调整游戏。Ludo.ai之所以与众不同,是因为它可以根据玩家的能力、口味和游戏风格制作不同的游戏。此外,它还提供有关玩家行为的有用信息,因此您可以更多了解您的竞争对手并提高游戏水平。 Rosebud.ai Rosebud通过重新定义角色的创建方式来改变游戏行业。这款基于人工智能的应用程序根据您的参数开发出逼真的角色,从而使为游戏创建独特且高质量的角色变得比以往更加容易。Rosebud在设计角色时给予了您最大的创作自由,甚至可以控制最细微的细节,如头发和眼睛的颜色。 Layer.ai Layer可以使用人工智能构建复杂的3D图层,用于视频游戏世界。它旨在使游戏设计师更轻松地创建沉浸式的世界。根据您的需求,Layer可以构建各种各样的3D图层,包括地形和植被。它是一个灵活的程序,可用于从设置更复杂的关卡到提高游戏组件效率的各种用途。 Hotpot.ai Hotpot.ai是一个灵活的程序,具有多个由人工智能驱动的功能,可帮助进行创意工作。这个平台旨在帮助您产生各种视觉和文本内容,而不仅仅是游戏资产。游戏设计师、市场营销人员和艺术家都可以从这个工具中受益。该平台的AI艺术生成器非常有用。除了AI头像生成器、AI文案撰写和AI图像产品外,它还提供各种各样的由AI驱动的产品。这些选项可以节省很多在视频游戏制作中的时间,因为制作原创的高质量资产是非常繁琐的。 Leonardo AI 使用Leonardo AI制作游戏资产是一项革命性的技术。使用这个基于人工智能的工具,您可以轻松创建独特、高质量的游戏支持。Leonardo AI的资产生成的灵活性使其脱颖而出,无论您需要角色还是环境。借助AI优化资产的能力,您可以确保您的游戏在各种设备上运行流畅。 InWorld InWorld是一个通过人工智能驱动的工具,用于制作逼真的视频游戏角色。它利用人工智能根据您的参数生成角色,使您更轻松地创建原创、高质量的角色,并在过程中使其看起来逼真。在InWorld中,您完全控制角色的创建,包括最微小的细节,如他们的面部特征和服装。…

Leave a Comment

认识 REPLUG 一种检索增强的语言建模框架,它将一个冻结的语言模型与一个冻结/可调节的检索器结合,将GPT-3 (175B) 在语言建模方面的性能提高了6.3%

近年来,语言模型已成为人工智能领域增长最快的领域之一。这些模型被开发用于处理和生成自然语言文本,正在推动一些最创新和突破性的人工智能应用,并处于人工智能扩展的新时代的前沿。特别是一种语言模型,名为GPT-3,因其非凡的能力和性能而引起了全球轰动。GPT-3使用了变压器架构来处理文本,从而产生了一个能够像人类一样回答问题的模型。不仅如此,该模型甚至可以对长段落进行总结,完成代码,以及以无与伦比的速度和准确性完成任务。 像GPT-3这样的语言模型在生成准确和适当的响应时仍然存在一些局限性。这就是REPLUG发挥作用的地方。一种名为REPLUG的新方法已经被引入:一种检索增强的语言模型框架。这是一种通过将它们与检索式结构合并来改善黑盒语言模型性能的方法。检索系统从大量文本语料库中找到与给定提示匹配的最合适的段落,然后在检索到的段落上对语言模型进行微调。这使得语言模型能够产生更准确的答案,特别是当提示在其训练数据中看不见时。 REPLUG方法包括两个主要步骤-文档检索和输入重构。首先,使用检索器从外部语料库中识别相关文档。然后,将每个检索到的文档明确添加到原始输入上下文中,并从多个传递中组合输出概率。该方法使用了一种能够支持注意机制的深度神经网络来学习不同模态之间的网络。 REPLUG在包括大型图像字幕数据集在内的各种基准数据集上进行了测试,并且在准确性和可扩展性方面显示出比现有系统更好的结果。REPLUG的一个关键优势是它不需要对基础语言模型架构进行任何修改。可以通过添加检索系统来增强像GPT-3这样的当前模型。这使得REPLUG易于访问和实施。通过调整的检索器,REPLUG将GPT-3(175B)在语言建模方面的性能提高了6.3%,并将Codex在五个样本MMLU上的性能提高了5.1%。 因此,REPLUG的引入似乎是自然语言处理领域的一个游戏规则改变者。它结合了黑盒语言模型和检索系统的优势,生成了一个优于传统语言模型的混合模型。REPLUG使用的深度神经网络架构具有可扩展性,适用于需要处理大量多模态数据的真实世界应用。REPLUG的潜在应用范围绝对是巨大的,并在不久的将来似乎很有前景。

Leave a Comment