Press "Enter" to skip to content

四海吧 Posts

使用Amazon SageMaker Data Wrangler与Snowflake的直接连接,加速商业洞见的产生

Amazon SageMaker数据整理器是一个单一的可视界面,可以将数据准备和特征工程所需的时间从数周缩短到几分钟,并能够选择和清理数据、创建特征以及自动化机器学习(ML)工作流中的数据准备,而无需编写任何代码SageMaker数据整理器支持Snowflake,这是一个流行的[…]

Leave a Comment

毕业后应该做什么?

在完成Btech学位之后该做什么?这个普遍的问题困扰着所有的大四学生和刚毕业的学生。虽然许多人选择传统的职业道路,但有些人决定研究和探索新领域的职业。通过探索更多的选择,关注技能发展,不断学习并跟上不断发展的技术,个人可以在快节奏的Btech毕业后的旅程中蓬勃发展。在本文中,我们涵盖了Btech毕业后最佳的职业选择。 Btech毕业生的传统职业道路 工程师职位 软件工程师/开发人员:计算机科学Btech毕业的软件工程师参与在线和移动应用程序的开发,数据库管理和软件架构。 硬件工程师:硬件工程师创建、开发和测试计算机硬件组件,确保其最佳运行。 机械工程师:他们在各种行业中开发、分析和构建机械系统,如产品设计、机器人、工业机械等。 电气工程师:他们规划、开发和维护发电、电子、通信和可再生能源系统。 土木工程师:他们规划、设计、建造和维护基础设施项目,保持结构完整性、安全性和环境可持续性。 航空航天工程师:他们负责设计、开发和测试飞行器、航天器和相关技术。 化学工程师:他们在广泛的行业中创建和管理过程,包括石油化工、制药、环境工程和材料科学。 环境工程师:他们为环境保护、可持续性和废物管理提供解决方案,同时保证符合法规。 高等研究和研究 MTech或ME: Btech毕业生可以追求MTech或ME等研究生学位,其中包括研究机会、高级课程和工程专业。 MS: Btech毕业生可以获得工程硕士学位,专注于研究、课程、合作和论文完成。 博士: 对研究感兴趣的Btech毕业生可以申请博士项目,他们将专注于工程领域,撰写博士论文,并与导师和研究人员合作。 研究奖学金:研究机构和大学为Btech毕业生提供奖学金和教学机会,提供财务支持和教学机会。 与工业合作:为了获得实践经验和行业曝光,Btech毕业生可以参加面向行业的研究项目,与公司或研发中心合作。 技术政府工作 印度工程服务(IES):印度工程服务考试由印度铁路和UPSC管理,吸引Btech毕业生在政府部门如中央工程服务、水利工程服务和电力工程服务等工程职位。 PSUs: PSUs(公共部门企业)在工程、项目管理、研究和发展等技术职位上聘用Btech毕业生,其中包括BHEL、ONGC、NTPC、IOCL和HAL等组织。 国防领域:…

Leave a Comment

DeepMind RoboCat 一个自学习的机器人人工智能模型

DeepMind,著名的AI研究实验室,推出了名为RoboCat的AI模型,能够使用各种机械臂模型执行各种复杂任务。与之前的模型不同,RoboCat以其能够解决多个任务并无缝适应不同实际机器人的能力而脱颖而出。让我们深入探讨这一非凡成就并探索RoboCat如何改变机器人领域。 还阅读:亚马逊的秘密家用AI机器人可以做任何事情甚至更多 多才多艺的RoboCat:机器人智能的跨越 DeepMind的突破性AI模型RoboCat在机器人领域展示了前所未有的多样性。正如DeepMind的研究科学家Alex Lee所说,RoboCat是一个单一的大型模型,能够处理多个真实机器人实体的多样任务。这意味着该模型能够快速适应新任务和不同的机器人配置。这标志着机器人领域的重要里程碑。 还阅读:机械臂加持的人类蜘蛛侠——Jizai Arms 从文本到机器人:Gato的启示 RoboCat受到GATO的启发,后者是DeepMind开发的另一个AI模型。GATO具有分析和响应文本、图像和事件的非凡能力。通过利用这一概念,DeepMind的研究人员对大量数据集进行了RoboCat的培训。这包括从模拟和现实机器人环境中收集的图像和动作数据。 训练强大的RoboCat 为了训练RoboCat,DeepMind团队收集了100-1,000个人控制机械臂执行各种任务的演示。这些演示为在特定任务上对模型进行微调、创建专门的“分支”模型奠定了基础。每个分支模型都经过了严格的实践,平均进行了10,000次迭代。 还阅读:世界首台AI动力机械臂:你需要了解的一切 突破极限:释放RoboCat的潜力 RoboCat的最终版本在模拟和真实世界情况下,已经接受了令人印象深刻的253项任务的训练,并对这些任务的141个变体进行了基准测试。DeepMind报告称,该模型成功地学会了观察1,000个人控制演示后如何操作不同的机械臂,持续数小时。然而,不同任务的成功率差别很大,从13%到99%不等,演示数量是一个决定性因素。 还阅读:Alphabet推出Flowstate:面向所有人的机器人应用开发平台 开启新局面:重新定义机器人技术 尽管成功率各不相同,DeepMind认为RoboCat有潜力降低解决机器人新任务的障碍。Alex Lee解释说,即使对于新任务的演示数量有限,RoboCat也可以进行微调并生成额外的数据以进一步提高其性能。最终目标是将教RoboCat学习新任务所需的演示数量减少到不到10个,这可能会彻底改变机器人领域。 也阅读:Sanctuary AI的Phoenix机器人和特斯拉的最新推出:Optimus! 我们的看法 DeepMind的RoboCat在机器人领域取得了重大突破。它展示了单一AI模型在多个任务和不同机器人实体上适应和表现的能力。通过利用其对大量数据集的培训并利用微调的力量,RoboCat为未来的发展奠定了基础。RoboCat有可能简化教授机器人新任务的过程,这可能会开创一个新的创新时代。随着RoboCat为未来铺平道路,令人兴奋的时代即将到来,机器人可以在最小的人为干预下无缝适应和学习。

Leave a Comment

认识BITE:一种新的方法,可以从一张图像中重建3D狗的形状和姿势,即使是像坐着和躺着这样具有挑战性的姿势

许多领域,包括生物学和保护,以及娱乐和虚拟内容的开发,都可以从捕捉和建模三维动物形态和态度中受益。因为它们不需要动物保持静止,保持特定的姿势,与观察者进行身体接触或执行任何其他协作任务,相机是观察动物的自然传感器。利用照片研究动物已经有很长的历史,例如著名的“马在奔跑”动态摄影。然而,与早期的人体三维形状和姿态研究不同,最近开发了能够根据动物的独特形状和姿势进行改变的表现性三维模型。在这里,他们专注于从单张照片中重建三维狗的挑战。 他们将狗作为模型物种的原因是因为它们具有强烈的四足样的关节变形和品种之间广泛的形状变化。狗经常被相机捕捉到。因此,各种姿势,形状和设置都很容易获取。建模人和狗可能在外观上具有相似的困难,但它们呈现出非常不同的技术难题。人们已经可以获得大量的三维扫描和动作捕捉数据。由于数据涵盖了正确的姿势和形态变量,因此学习像SMPL或GHUM这样的鲁棒,关节模型已经成为可能。 相反,收集动物的三维观察数据是具有挑战性的,目前需要更多此类数据来训练同样具有表现力的三维统计模型,以考虑所有可能的形态和位置。现在,由于SMAL(从玩具模型中学习的参数化四足动物模型),已经可以从照片中重建动物的三维模型,包括狗。然而,SMAL是许多物种的通用模型,从猫到河马。虽然它可以描绘不同动物的许多体型,但它却不能描绘狗品种的独特和微小细节,例如巨大的耳朵范围。为了解决这个问题,ETH苏黎世联邦理工学院,德国智能系统Max Planck研究所和IMATI-CNR研究所的研究人员提供了第一个D-SMAL参数化模型,可以正确地表示狗。 另一个问题是,与人类相比,狗的动作捕捉数据相对较少,并且存在的数据中,坐姿和躺姿很少被捕捉到。因此,当前的算法很难推断狗的某些姿势。例如,从历史数据中学习三维姿势的先验知识将会偏向于站立和行走姿势。通过利用通用约束,可以减弱这个先验知识,但是姿势估计会变得严重不确定。为了解决这个问题,他们使用了物理接触的信息,这是建模动物(土地)时被忽视的信息,例如它们受重力影响,因此会站立,坐下或躺在地上。 在存在广泛自遮挡的情况下,他们展示了如何使用地面接触信息来估计复杂的狗的姿势。虽然地面平面限制已经用于人体姿势估计,但对于四足动物来说,潜在的优势更大。四条腿意味着更多的接触点,坐或躺下时更多的身体部位被遮挡,以及更大的非刚性变形。早期研究的另一个缺点是重建管道通常是在2D图片上进行训练的,因为收集配对的3D数据(带有匹配的2D图像)具有挑战性。因此,他们经常预测位置和形状,当重新投影时,与视觉证据非常相似,但沿着观察方向被扭曲。 由于缺乏配对数据,所以在从不同角度观察时,三维重建可能是错误的,因为没有足够的信息来确定在深度方向上放置更远或甚至被遮挡的身体部位的位置。再次,他们发现模拟地面接触是有益的。他们不再手动重建(或合成)配对的2D和3D数据,而是转向更宽松的三维监督方法,并获取地面接触标签。他们要求注释者指示狗下面的地表是否平坦,并在三维动物上注释地面接触点。他们通过向注释者呈现真实的照片来实现这一点。 图1 显示了BITE如何能够从单个输入图像中估计狗的三维形态和态度。该模型能够处理各种品种和类型,以及超出训练姿势范围的困难姿势,包括坐在地上或躺在地上。 他们发现,网络可以从单个图像中准确地学习分类表面和检测接触点,以便它们也可以在测试时使用。这些标签不仅用于训练。基于最新的前沿模型BARC,他们的重建系统称为BITE。他们使用新颖的D-SMAL狗模型作为初始粗配步骤重新训练BARC。随后,他们将结果预测发送到他们最近创建的精细化网络,使用接地损失进行训练,以改善相机的设置和狗的姿态。他们还可以在测试时使用接地损失,以完全自主地优化对测试图片的适配。 这大大提高了重建的质量。即使BARC姿势先验的训练集不包含这样的姿势,他们也可以使用BITE得到正确站在(局部平面)地面上或以坐姿和躺姿逼真重建的狗(见图1)。以往的3D狗重建工作要么是通过主观视觉评估,要么是通过反投影到图片并评估2D残差来评估,因此投影掉了与深度相关的不准确性。他们通过从不同的视角生成实际犬只的3D扫描,制作了一个独特的半合成数据集,以弥补客观3D评估的缺失。他们使用这个新数据集评估BITE及其主要竞争对手,证明BITE为该领域建立了新的标准。 他们的贡献总结如下: 1.他们提供了D-SMAL,这是一个从SMAL发展出来的全新的、针对犬只的3D姿势和形状模型。 2.他们创建了BITE,这是一个神经模型,旨在提高3D狗姿势的同时评估局部地面平面。BITE鼓励具有说服力的接地。 3.他们证明了在使用该模型之前,可以恢复与之编码非常不同的狗的位置(必须很小的先验)。 4.使用复杂的StanfordExtra数据集,他们改进了单目3D姿势估计的最新技术水平。 5.为了促进向真正的3D评估的过渡,他们提供了一个基于实际犬只扫描的新的半合成3D测试集合。

Leave a Comment

Excel vs Power BI – 哪个更适合决策制定?

在今天快节奏的商业环境中,做出明智的决策对于组织的成功至关重要。了解流行的商业智能工具及其独特的功能对于发挥它们的真正潜力至关重要。MS Excel和Power BI都在数据分析和决策方面具有出色的能力。然而,确定最佳选择取决于具体要求。本文将深入探讨MS Excel和Power BI的优势和特定用例,帮助您决定哪种工具适合您的业务需求。 MS Excel是什么? Microsoft Excel是一种强大且用户友好的工具,可以实现数据组织、操作、分析和可视化。它提供了数据处理、清理和转换的必要功能。具有数据分析工具、数据透视表和图表等内置功能,Excel在数据分析和可视化方面非常有价值。通过Goal Seek、Solver、Decision Trees和Sensitivity analysis等功能,它还提供决策能力,使用户能够根据汇总数据做出明智的决策。Power pivot和query通过促进数据建模和转换在决策中发挥着重要作用。Excel是一种多功能工具,赋予用户分析数据和做出有效决策的能力。 Power BI是什么? Power BI是微软提供的另一种决策制表工具,可以与Excel媲美。它提供与Excel类似的功能,如数据转换、决策制定、连接到不同的数据源、集成、可视化和呈现。Power BI具有其独特的特点,如创建动态和交互式报告以及实时仪表板。它还涉及数据建模,形成不同数据之间的关系,并在数据中搜索依赖关系。 此外,通过Power Query进行数据查询是一项有趣的功能,允许使用直观的图形界面进行数据处理操作,如清理、塑形和转换数据。作为微软产品,它还提供核心功能和服务作为一个全面、用户友好的商业智能工具。 Excel的最佳功能 1. 用于组织数据的电子表格 排序和筛选:使用排序和筛选功能轻松组织数据。 分组和概述:分组行或列,并折叠/展开它们以提高可读性。…

Leave a Comment

AutoML – 无代码解决方案,用于构建机器学习模型

介绍 AutoML(自动机器学习)也被称为自动化机器学习。在2018年,谷歌推出了云端 AutoML,引起了很大的关注,是机器学习和人工智能领域最重要的工具之一。在本文中,您将学习使用谷歌云端 AutoML 构建机器学习模型的“无代码”解决方案。 AutoML 是 Google 云平台 Vertex AI 的一部分。Vertex AI 是云端构建和创建机器学习管道的端到端解决方案。但是,我们将在未来的文章中讨论 Vertex AI 的细节。AutoML 主要依赖于迁移学习和神经搜索架构。您只需要提供数据,之后 AutoML 将为您的用例构建一个最佳的自定义模型。 在本文中,我们将讨论使用 Python 代码在 Google 云平台上实现…

Leave a Comment

ChatGPT的大惊喜:OpenAI创建了一个人工智能市场

OpenAI推出人工智能市场 OpenAI是ChatGPT聊天机器人背后的聪明头脑,该公司再次成为头条新闻。根据The Information的独家报道,该公司计划通过推出创新的市场来彻底改变人工智能行业。这个新平台将赋予开发者展示并销售他们基于OpenAI先进技术构建的人工智能模型的能力。 还可阅读:OpenAI的突破性解决方案:确保AI模型的逻辑并消除幻觉 量身定制适用于现实世界的人工智能 使用ChatGPT的企业一直在对其转化业务的潜力感到惊叹。由于能够针对特定用例定制技术,企业一直在利用其力量来打击金融欺诈、提供市场洞察力等等。OpenAI认识到了这种需求,并计划通过创建一个平台,让开发者向其他企业提供他们定制的人工智能模型。 还可阅读:OpenAI为所有Plus用户推出ChatGPT插件|学习如何启用它们 OpenAI CEO公开雄心勃勃的计划 在最近在伦敦举行的开发者聚会上,OpenAI首席执行官Sam Altman公开了公司潜在市场概念,令与会者大为震惊。The Information的报告揭示了Altman的披露,引起了在场所有人的兴趣和兴奋。OpenAI有望通过这个大胆的冒险对人工智能领域产生重大影响。 还可阅读:Sam Altman与印度总理纳伦德拉·莫迪的关键会谈:规划印度的人工智能未来 挑战科技巨头应用商店的竞争者 如果OpenAI的计划得以实现,它可能对已经建立起来的科技巨头应用商店构成重大威胁。像Salesforce和Microsoft这样的行业领导者运行着自己的应用商店,为各种软件解决方案提供服务。然而,通过OpenAI的市场,开发者将有机会直接向客户展示他们的人工智能模型,从而可能扩展OpenAI革命性技术的影响范围。 还可阅读:Microsoft和OpenAI就AI集成发生冲突 知名企业关注OpenAI的市场 The Information还透露,一些有影响力的公司有兴趣参与OpenAI的市场。据报道,著名的制造商软件提供商Aquant正在考虑在平台上提供其ChatGPT驱动的人工智能模型。此外,流行的教育应用程序制造商Khan Academy正在探索利用市场来展示其尖端的人工智能模型。 ChatGPT的惊人崛起和对行业的影响 自去年发布以来,ChatGPT在各个行业的企业中见证了非凡的采用率。该软件迅速成为自动化任务和增强运营效率的首选解决方案。随着公司竞相利用人工智能的潜力,ChatGPT的先进大型语言模型(LLMs)已成为一个备受追捧的工具,使组织能够向客户提供卓越的新能力。 我们的看法 OpenAI计划推出人工智能市场,将重新定义行业,并彻底改变开发者展示和销售他们的人工智能模型的方式。这个新的冒险可能会挑战来自科技巨头现有应用商店的竞争者。此外,这对寻求创新人工智能解决方案的开发者和企业都有巨大的承诺。请继续关注OpenAI改变我们所知道的人工智能领域的旅程的更多更新。

Leave a Comment

认识 Paella:一种新的 AI 模型,类似于扩散,可以比使用稳定扩散更快地生成高质量图像

过去2-3年,使用人工智能(AI)从文本生成图像的研究质量和数量出现了惊人的增长。在这个领域里最具突破性和革命性的工作之一是指最先进的生成模型——扩散模型。这些模型通过利用深度学习算法的能力,完全改变了如何使用文本描述生成高质量图像的方法。此外,除了扩散模型,还存在一系列功能强大的其他技术,提供了一条生成接近照片般逼真的视觉内容的令人兴奋的路径。然而,这些最先进技术取得的杰出成果也有一定的局限性。许多新兴的生成AI技术依赖于扩散模型,这需要复杂的架构和大量的计算资源进行训练和图像生成。这些先进的方法还降低了推理速度,使它们在实时实现方面不切实际。此外,这些技术的复杂性直接与它们所实现的进步相关,这对公众掌握这些模型的内部工作方式构成了挑战,从而导致它们被视为黑匣子模型。 为了解决前面提到的问题,德国Technische Hochschule Ingolstadt和Wand Technologies的研究人员提出了一种新颖的文本条件图像生成技术。这种创新技术与扩散类似,但生成高质量图像的速度更快。这个基于卷积的模型的图像采样阶段可以仅使用12个步骤完成,同时仍能产生出色的图像质量。这种方法因其显著的简单性和降低的图像生成速度而脱颖而出,从而允许用户对模型进行条件设置,并享受现有最先进技术中缺乏的优势。所提出的技术的固有简单性已经显著提高了其可访问性,使来自不同背景的个人能够轻松掌握和实施这种文本到图像技术。为了通过实验评估验证他们的方法,研究人员还训练了一个名为“Paella”的文本条件模型,该模型具有惊人的10亿个参数。该团队还在MIT许可证下开源了其代码和模型权重,以鼓励围绕他们的工作进行研究。 扩散模型经历了一个学习过程,逐步从每个训练实例中消除不同程度的噪声。在推理过程中,当呈现出纯噪声时,模型通过逐步减少几百个步骤的噪声来生成图像。德国研究人员设计的技术在很大程度上借鉴了这些扩散模型的原理。像扩散模型一样,Paella从代表图像的标记中去除不同程度的噪声,并利用它们生成新图像。该模型在LAION-5B美学数据集的900 million个图像-文本对上进行了训练。Paella使用基于卷积神经网络的预训练编码器-解码器体系结构,能够使用来自预训练期间学习的8192个标记集的256个标记来表示256 x 256的图像。为了在训练阶段为其示例添加噪声,研究人员还在此列表中包括了一些随机选择的标记。 为了基于图像的文本描述生成文本嵌入,研究人员利用了CLIP(对比语言-图像预训练)模型,该模型建立了图像和文本描述之间的联系。然后,采用U-Net CNN体系结构来训练模型生成完整的原始标记,利用先前迭代中生成的文本嵌入和标记。这个迭代过程重复了12次,每次逐渐替换以前生成的标记的一小部分。在剩余生成的标记的指导下,U-Net逐步减少每个步骤的噪声。在推理过程中,CLIP基于给定的文本提示产生一个嵌入,U-Net为随机选择的256个标记的完整集合重构了所有标记12次。最后,解码器利用生成的标记生成图像。 为了评估他们的方法的有效性,研究人员采用了Fréchet inception距离(FID)指标来比较Paella模型和稳定扩散模型得到的结果。虽然结果略微偏向稳定扩散,但Paella在速度方面具有显著优势。这项研究突出了先前的努力,因为它专注于完全重新配置架构,这在以前并未考虑过。总之,与现有的模型相比,Paella可以使用更小的模型大小和更少的采样步骤生成高质量的图像,仍然可以实现可观的结果。研究团队强调了他们方法的易用性,该方法提供了一个简单的设置,可以被从不同背景中的个人轻松采用,包括非技术领域,因为随着时间的推移,生成AI领域越来越受到关注。

Leave a Comment

使用Pandas进行Netflix股票的时间序列分析

介绍 数据的时间序列分析不仅仅是一堆数字,比如Netflix的股票。它是一张迷人的织锦,用Pandas编织着我们的世界的错综复杂的故事。就像一根神秘的线,它捕捉了事件的涨落、趋势的兴衰以及模式的出现。它揭示了隐藏的联系和相关性,塑造了我们过去的形象,并提供了对未来的一瞥。 时间序列分析不仅仅是一种工具。它是通往知识和远见的门户。您将有能力解锁隐藏在数据时间织物中的秘密,将原始信息转化为有价值的见解。此外,它还能帮助您做出明智的决策,减轻风险并利用新兴机会。 让我们一起踏上这个激动人心的冒险之旅,发现时间真正是理解我们的世界的关键。您准备好了吗?让我们一起潜入时间序列分析的迷人领域吧! 学习目标 我们的目标是介绍时间序列分析的概念,强调其在各个领域的重要性,并展示展示实际应用时间序列分析的真实世界示例。 我们将通过展示如何使用Python和yfinance库导入Netflix股票数据来提供实际演示。这样读者将学习获取时间序列数据并为分析做准备的必要步骤。 最后,我们将重点介绍时间序列分析中使用的重要Pandas函数,例如移位、滚动和重新采样,这些函数能够有效地操作和分析时间序列数据。 本文是数据科学博客马拉松的一部分。 什么是时间序列分析? 时间序列是在连续、等间隔的时间间隔内收集或记录的数据点序列。 时间序列分析是一种用于分析随时间收集的数据点的统计技术。 它涉及研究顺序数据中的模式、趋势和依赖关系,以提取见解并进行预测。 它涉及数据可视化、统计建模和预测方法等技术,以有效地分析和解释时间序列数据。 时间序列数据的例子 股票市场数据:分析历史股价以识别趋势和预测未来价格。 天气数据:研究温度、降水和其他变量随时间的变化,以了解气候模式。 经济指标:分析GDP、通货膨胀率和失业率等,以评估经济表现。 销售数据:检查销售数据随时间的变化,以确定模式并预测未来销售额。 网站流量:分析网站流量指标,以了解用户行为并优化网站性能。 时间序列的组成部分 时间序列有4个组成部分。它们是: 趋势组成部分:趋势代表数据中的长期模式,以相对可预测的方式向上或向下移动。 季节性组成部分:季节性是一种定期重复的模式,例如每日、每周、每月或每季度。 周期性组成部分:周期性组成部分对应于遵循商业或经济周期的模式,其特点是增长和衰退的交替时期。…

Leave a Comment

ChatGPT的哲学课程:这项AI研究探讨LLMs在对话代理中的行为

2023年是LLMs的年份。ChatGPT,GPT-4,LLaMA等新的LLM模型正在接连抢占聚光灯。这些模型已经彻底改变了自然语言处理领域,并越来越广泛地应用于各个领域。 LLMs具有展现广泛行为的显著能力,包括进行对话,这可以导致与类似人类的谈话者进行交谈的引人注目的幻觉。然而,重要的是要认识到,基于LLM的对话代理在几个方面与人类存在显着差异。 我们的语言技能是通过与世界的具体互动发展起来的。我们作为个体,通过社交化和沉浸在语言用户社区中获得认知能力和语言能力。这一过程在婴儿身上发生得更快,随着我们长大,我们的学习过程变慢,但基础仍然相同。 相比之下,LLMs是在大量人类生成的文本上进行训练的无体神经网络,其主要目标是基于给定的上下文预测下一个单词或标记。它们的训练围绕着从语言数据中学习统计模式,而不是通过直接体验物理世界。 尽管存在这些差异,但我们倾向于用LLMs来模仿人类。我们在聊天机器人、助手等方面使用这种方法。然而,这种方法带来了一个具有挑战性的困境。我们如何描述和理解LLMs的行为? 使用熟悉的民间心理学语言是很自然的,像使用“知道”、“理解”和“思考”这样的术语来描述对话代理,就像我们对待人类一样。然而,当这些语言被过分字面地理解时,这种语言会促进拟人化,夸大了AI系统和人类之间的相似之处,同时掩盖了它们的深刻差异。 那么我们如何应对这个困境?我们如何为AI模型描述“理解”和“知道”这些术语?让我们来看看“角色扮演”论文。 在这篇论文中,作者提出采用替代概念框架和隐喻来有效地思考和谈论基于LLM的对话代理。他们主张使用两个主要隐喻:将对话代理视为扮演单一角色或作为可能角色的多元超定位的模拟集合。这些隐喻提供了不同的角度来理解对话代理的行为,并具有其独特的优势。 自回归采样的示例。来源:https://arxiv.org/pdf/2305.16367.pdf 第一个隐喻将对话代理描述为扮演具体角色。当给定提示时,代理尝试以与分配的角色或人物相匹配的方式继续对话。它旨在根据与该角色相关联的期望进行回应。 第二个隐喻将对话代理视为来自各种来源的不同角色的集合。这些代理已经接受了广泛的材料培训,如书籍、脚本、采访和文章,这使它们对不同类型的角色和情节有很多了解。随着对话的进行,代理根据其训练数据调整其角色和人物,使其能够适应并以角色回应。 对话代理中的轮流发言的示例。来源:https://arxiv.org/pdf/2305.16367.pdf 通过采用这个框架,研究人员和用户可以探索对话代理人的重要方面,如欺骗和自我意识,而不会错误地将这些概念归因于人类。相反,重点转向理解对话代理人在角色扮演场景中的行为以及它们可以模仿的各种角色。 总之,基于LLM的对话代理人具有模拟人类对话的能力,但它们与实际人类语言用户有很大的不同。通过使用替代隐喻,比如将对话代理人视为角色扮演者或模拟的组合,我们可以更好地理解和讨论它们的行为。这些隐喻为基于LLM的对话系统的复杂动态提供了洞见,使我们能够欣赏它们的创造潜力,同时认识到它们与人类的根本区别。

Leave a Comment

如何利用AWS构建Light & Wonder游戏机预测性维护解决方案

本文是由Light and Wonder(L&W)的Aruna Abeyakoon和Denisse Colin共同撰写的总部位于拉斯维加斯的Light&Wonder,Inc.是一家领先的跨平台全球游戏公司,提供赌博产品和服务与AWS合作,Light&Wonder最近开发了业界首个安全解决方案Light&Wonder Connect(LnW Connect)[…]

Leave a Comment

一个黄金时代:《帝国时代 III》加入GeForce NOW

尽情征服 Microsoft 获奖作品《帝国时代 III:终极版》的土地。今天,它领衔 GeForce NOW 支持的 10 款新游戏。 听从您的指挥 通过云端流式传输所有战斗。 《帝国时代 III:终极版》是最受喜爱的即时战略游戏系列之一的重制版,具有改进的视觉效果、增强的游戏玩法、跨平台多人游戏等功能。指挥来自欧洲和美洲的强大文明或跳转到亚洲的战场。会员可以体验两种新游戏模式:历史战役和《战争艺术》挑战任务。两个新国家也加入了这个版本——瑞典和印加——每个国家都有征服新世界的优势。 今天就建立一个帝国,在终极会员资格下在设备上流式传输辉煌的 4K 分辨率。 征服您的游戏列表 本周在“征服者之刃”中掌握攻城战术的艺术。 GeForce NOW 图书馆不断扩展。看看本周新增支持的 10 款游戏。 异形:黑暗下降(Steam 上的新发布,6…

Leave a Comment

John Isaza律师,FAI:关于AI和ChatGPT的法律环境导航

我们感谢 Rimon Law 的合伙人、FAI 律师 John Isaza 分享他的故事和有价值的见解,包括不断变化的法律环境、隐私保护与创新之间微妙的平衡以及在整合 AI 工具时产生的独特法律影响John 在 AI 相关的挑战和考虑方面提供了有价值的观点……John Isaza, Esq., FAI 谈论 AI 和 ChatGPT 的法律环境阅读更多»

Leave a Comment

Google Research 的负责任人工智能:面向社会公益的人工智能

由谷歌研究,AI 助力社会公益团队的软件工程师 Jimmy Tobin 和 Katrin Tomanek 发布 谷歌的 AI 助力社会公益团队由研究人员、工程师、志愿者和其他拥有共同社会影响关注点的人员组成。我们的使命是通过实现真实世界的价值,展示人工智能的社会效益,项目涵盖公共卫生、可访问性、危机应对、气候和能源以及自然和社会等领域。我们相信,驱动服务于未受服务的社区的积极变革的最佳方式是与变革者及其服务的组织合作。 在本博客文章中,我们讨论了 AI 助力社会公益团队内的 Project Euphonia 所做的工作,该团队旨在改善对于患有语言障碍的人群的自动语音识别(ASR)。对于那些典型的语音,ASR模型的错误率(WER)可以低于10%。但对于那些语音障碍的人群,例如口吃、言语障碍和构音障碍等,WER可能会达到50%,甚至90%,具体取决于病因和严重程度。为了解决这个问题,我们与1000多名参与者合作,收集了超过1000小时的语音障碍样本,并使用这些数据来表明,ASR 个性化是弥合使用者语言障碍性能差距的可行途径。我们已经证明了,使用冻结层技术进行3-4分钟的训练语音,就可以成功实现个性化。 这项工作导致了 Project Relate 的开发,该项目适用于那些可能从个性化语音模型中受益的任何非典型语音的使用者。与谷歌的语音团队合作建立的 Project Relate,使得那些难以被其他人和技术理解的人们能够训练自己的模型。人们可以使用这些个性化模型来更有效地沟通并获得更多的独立性。为了使 ASR…

Leave a Comment