Press "Enter" to skip to content

四海吧 Posts

月船3号着陆:人工智能和传感器如何助力ISRO的史诗级月球探险

在令人着迷的太空探索广袤中,每个任务都是对未知领域的一次骰子赌博。印度国家航天局印度空间研究组织(ISRO)准备再次展示自己的实力,进行月船3号任务。经过多年的精心规划和艰苦准备,真相的时刻已经到来。这项大胆的冒险成功着陆在月球表面,为印度的太空史增添了新的篇章。本文讨论了人工智能(AI)在月船3号安全着陆中的作用。 还阅读:IBM和NASA联手创建地球科学GPT:解码我们星球的奥秘 人工智能:月船3号的无声导航员 在星星之间,科技和智慧交响演奏。月船3号与其前辈的不同之处在于其与人工智能(AI)的复杂融合。当飞船进入月球下降阶段时,人工智能占据主导地位,执行一场复杂的传感器、摄像头和算法的交响乐。 还阅读:zPod,印度第一辆人工智能驱动的自动驾驶汽车 幕后花絮:参与者及其角色 在幕后,ISRO的遥测、跟踪和命令网络(ISTRAC)充满了控制的激动。在任务总监P. Veeramuthuvel和他的专业科学家团队的领导下,这个神经中心已经准备好进行终极月球芭蕾舞。然而,在紧张的15分钟下降阶段,由于人工智能的存在,他们的参与是有限的。飞船依靠预先编程的计算机逻辑来完成这项高风险行动。 关键下降:印度太空的一大飞跃 当时钟指向8月23日17时47分,我们都看到了故事的展开。任务控制中心从积极干预转变为警惕观察。在人工智能的超级激励下,自主系统接管了飞船的命运。人工智能驱动的传感器协同工作,它们的任务非常明确-确保安全着陆。月船3号的成功取决于AI和技术的这种同步芭蕾舞。 月船3号的传感器和人工智能的导航仪器 ISRO主席S. Somnath揭示了引导这次太空冒险的传感器组合。速度计和高度计提供了重要的速度和高度数据,构成了人工智能导航能力的基础。从避险摄像头到惯性导航摄像头的各种摄像头形成了月球地形的视觉画布。这些多样的输入通过复杂的算法无缝融合,形成了着陆器位置的整体图像。 还阅读:AI登上太空!NASA将推出类似ChatGPT的航天器通信聊天机器人 心智与金属融合:人工智能和导航系统 月船3号成功的核心在于智能导航、引导和控制系统。这个复杂的算法网络指导着飞船的运动,将其轨迹引导到安全着陆点。人工智能在周密的规划中考虑了每种情况-高度调整、推进器点火和障碍物的表面扫描都是由人工智能的思维精心编排的。 还阅读:灵感来自外星人的航天器设计:NASA对太空未来的大胆飞跃 适应性智能:月船3号下降的英雄 人工智能在飞行中的适应和响应能力得到了充分展示。严格的模拟、改进的指导设计和艰苦的算法保证了每个下降阶段的精确度。即使面临逆境,飞船仍然坚定不移。令人惊讶的是,Somnath揭示,即使传感器故障,这个飞船也没有被阻挠,多亏了备用推进系统。 着陆器危险检测和避免摄像头(LHDAC)成为了主角。在人工智能的支持下,它扫描了月球着陆区的轮廓,寻找可能破坏着陆的障碍物。传感器和摄像头的交响乐,都由人工智能操作,进一步确保了着陆器的安全通过。 解码下降:传感器的芭蕾舞 太空船从月球高处到表面的轻柔拥抱的旅程是一场细致入微的芭蕾舞,历时15分钟。机载传感器是舞者,不断重新计算轨迹。关键节点作为传感器准确性的检查点,而壮丽的结局是仅在距离表面150米的地方进行的危险验证。 月球的仆人:AI驱动的智能车Pragyan 这次任务的AI驱动壮丽并不止于着陆器。月球车Pragyan延续了这一传统。AI的手指导Pragyan在一天的冒险中进行导航,并进行实验和采集样品。由AI支持的摄像头和天线确保了Pragyan在月球探险中的成功。 还可阅读:自主导航简介-激光雷达、传感器融合、卡尔曼滤波器…

Leave a Comment

使用AutoGPTQ和transformers来使LLMs更轻量

大型语言模型展示了在理解和生成类似人类文本方面的出色能力,彻底改变了各个领域的应用。然而,它们对于训练和部署的消费者硬件的需求变得越来越具有挑战性。 🤗 Hugging Face的核心使命是普及良好的机器学习,这包括尽可能使大型模型对所有人都可访问。在与bitsandbytes合作的同样精神下,我们刚刚在Transformers中集成了AutoGPTQ库,使用户能够使用GPTQ算法(Frantar等人,2023年)将模型量化为8、4、3甚至2位精度并运行。4位量化的准确度几乎没有下降,并且在小批量大小的推理速度上与fp16基准相当。请注意,GPTQ方法与bitsandbytes提出的事后训练量化方法略有不同,因为它需要通过校准数据集。 这个集成适用于Nvidia GPU和RoCm-powered AMD GPU。 目录 资源 GPTQ论文的简要摘要 AutoGPTQ库 – 用于高效利用GPTQ的一站式库 🤗 Transformers中对GPTQ模型的本机支持 使用Optimum库对模型进行量化 通过文本生成推理运行GPTQ模型 使用PEFT对量化模型进行微调 改进的空间 支持的模型 结论和最后的话 致谢 资源 这篇博文和发布附带了一些资源,帮助您开始使用GPTQ量化:…

Leave a Comment

AI Time Journal呈现电子书《AI在教育趋势2023》:学习未来的专家见解

美国旧金山,8月23日——AI Time Journal,一家致力于促进人工智能(AI)领域知识交流和思想领导的领先出版物,非常高兴地宣布推出最新的电子书《2023年教育领域的人工智能趋势》这本开创性的汇编代表了探索人工智能如何在教育领域发展的里程碑…… AI Time Journal呈现电子书《2023年教育领域的人工智能趋势》:关于学习未来的专家见解详细阅读»

Leave a Comment

AI2发布Dolma:一个3万亿令牌语料库,开创语言模型研究的透明度

透明度和开放性在语言模型研究中一直是有争议的问题。封闭数据集的存在、秘密的方法论和有限的监督成为推动该领域发展的障碍。为了应对这些挑战,Allen人工智能研究所(AI2)推出了一项开创性的解决方案——Dolma数据集,该数据集包含了惊人的3万亿个标记。目的是在语言模型研究中引领一个新的合作、透明和共享进步的时代。 在不断发展的语言模型开发领域中,OpenAI和Meta等行业巨头使用的数据集和方法论的模糊性给进展蒙上了阴影。这种不透明性不仅阻碍了外部研究人员对现有模型进行批判性分析、复制和增强的能力,也抑制了该领域的整体增长。AI2的Dolma作为一种开放的象征,出现在一个笼罩在秘密中的领域中。Dolma拥有囊括网络内容、学术文献、代码等的全面数据集,旨在通过赋予研究社区构建、解析和优化其语言模型的工具,赋予他们独立进行研究的能力。 Dolma的创造的核心是一组基础原则。其中最重要的原则是开放性,AI2倡导这一原则以消除与预训练语料库的受限访问相关的障碍。这一理念鼓励开发数据集的改进版本,并促进对数据与其支撑的模型之间复杂关系的深入研究。此外,Dolma的设计强调代表性,模拟已建立的语言模型数据集,以确保可比较的能力和行为。规模也是一个突出的考虑因素,AI2深入研究模型和数据集尺寸之间的动态相互作用。为了进一步加强方法论的透明度和降低风险,AI2采用了可复现性和风险缓解的原则,以及透明的方法论和对个体伤害的最小化承诺。 Dolma的创造是一个数据处理的细致过程。该流程包括特定来源和无源操作,将原始数据转化为干净、朴素的文本文档。这些复杂的步骤包括语言识别、从Common Crawl中筛选网络数据、质量过滤、去重和风险缓解策略等任务。包括代码子集和多样化的来源(包括科学手稿、维基百科和Project Gutenberg等)将Dolma的全面性提升到了新的高度。 描绘数据集透明度变化程度的插图 总的来说,Dolma的引入标志着语言模型研究中透明度和合作协同的重大进展。AI2决心解决隐藏数据集的问题,通过开放获取和细致的文档记录确立了一个变革性的先例。所提出的方法论Dolma是一个宝贵的精选内容库,将成为全球研究人员的基石资源。它打破了主要行业参与者周围的秘密范式,取而代之的是一个倡导集体进步和对该领域的深入理解的新框架。随着自然语言处理学科开辟新的视野,Dolma的影响将产生涟漪效应,远远超越这个数据集,促进共享知识的文化,催生创新,并培育负责任的人工智能的发展。

Leave a Comment

2023年要学习的前5个生成式人工智能课程

介绍 随着对熟练员工的需求增加,及时了解与生成式人工智能相关的最新信息和技能至关重要。这里是一份顶级的综合课程选择,适合初学者和有经验的从业者,旨在探索人工智能技术的艺术可能性和实际应用。这篇文章将帮助您选择前5个生成式人工智能课程,以帮助您创造、创新和管理未来。 为什么选择生成式人工智能课程? 选择生成式人工智能课程可以为对人工智能及其应用感兴趣的人提供许多好处。生成式人工智能具有广泛的应用领域。生成式人工智能处理的是具有生成内容能力的模型。以下是选择生成式人工智能课程的一些原因的快速提及: 职业机会 多样化的应用 创新和创造力 解决问题 理解复杂模型 学术和研究追求 个人项目 与专家合作 伦理考虑 最佳生成式人工智能课程 以下是可以帮助您在该领域建立职业的顶级生成式人工智能课程: 生成式人工智能学习路径 该学习课程由Google Cloud管理。该课程包括十个活动,提供有关生成式人工智能产品和技术的精选内容。该计划涵盖了大型语言模型的基础知识以及生成式人工智能解决方案的创建和部署。 时长:每个活动1天(共10天);自由安排 最适合人群:初学者和专业人士 价格:免费 点击此处了解该生成式人工智能课程 大型语言模型:从应用到生产 该课程由Databricks管理,Databricks是一家为各种组织提供在线课程管理服务的公司。开发人员、数据科学家和工程师可以使用最流行的框架构建以LLM为中心的应用程序。学习者在课程结束时将创建一个完整的、可投入生产的LLM工作流程。 时长:6周(每周4-10小时);自由安排…

Leave a Comment

Windows 11 和 Microsoft Copilot 宣布最新的人工智能更新

技术景观正在变化,人工智能(AI)正在引领潮流。作为AI领域的先驱者,微软正在其最新的创作Windows 11中释放AI的力量。随着备受期待的Copilot功能开始迈出第一步,这只是冰山一角。随着一系列由AI驱动的增强功能即将出现在Windows 11和12中,用户将享受到科技化的盛宴。 还阅读:微软将ChatGPT集成到Windows操作系统中,提供增强的AI体验 Copilot的释放:未来的一瞥 随着微软拥抱AI浪潮,Copilot功能已经在测试用户中引起了轰动。这个AI注入的未来之瞥为Windows 11带来了什么即将到来的东西。Copilot的魔力将在23H2版本中展现出来,承诺简化任务并重新定义用户体验。 还阅读:提升您的工作流程:微软的AI Copilot增强了Office、GitHub、Bing和网络安全 经典画笔:唤醒艺术家的AI启示 准备好迎接艺术革命,因为即使是备受喜爱的经典画笔也将在Windows 11上品尝到AI的魔力。微软的内部测试暗示了一次AI升级,允许用户根据描述生成图像。这种类似于Bing Image Creator的生成式AI的整合为快速编辑和注释打开了大门,将您的艺术愿景变为现实。 还阅读:AI将无聊的QR码变成绘画作品;现在就来看看吧! 相机和截图工具中的OCR:将图像转换为文本 光学字符识别(OCR)将成为相机和截图工具应用程序的一项改变游戏规则的功能。Windows Central的Zac Bowden透露,这个功能使相机应用程序能够识别图像中的文本。想象一下拍摄一个标志或文件的照片,然后轻松将其转换为可编辑的文本。OCR功能类似于Google Lens和iOS上的Live Text,为您的日常任务增添了便利性和效率。 揭示对象:照片应用程序的AI侦探 Windows 11上的照片应用程序将具备一个迷人的能力,即识别和选择图片中的对象。借鉴了iOS和Android等平台的做法,这个功能将对象置于前台。捕捉、复制并在应用程序之间粘贴这些元素,无缝地构建您的视觉杰作。 还阅读:DragGAN:AI魔法工具用于编辑图像…

Leave a Comment

新的AI研究使用少量数据评估电池健康状况和充电水平

锂离子电池已经在全球范围内得到广泛应用,为移动设备、汽油动力汽车和各种应用提供能量。这些电池成为为我们珍贵设备提供动力的首选之一。随着电动汽车的普及趋势逐渐增强,锂离子电池将扮演重要角色。 鉴于这些电池的广泛应用,评估电池健康状况对于解决新兴电池材料的安全问题至关重要。这一点尤为重要,因为对其长期耐久性和韧性的研究有限。考虑到它们在支持越来越多的车辆方面的预期角色,确保有效的健康评估方法变得更加重要。 但是,即使一个电池失效,也会导致整个电池组的故障,从而扰乱电池系统,可能引发烟雾、火灾和爆炸等安全问题。因此,监测电池状态变得很重要,包括参数如电荷状态(SOC)和剩余能量,以及它们的状态,例如整体健康状况。 为了解决这个问题,卡内基梅隆大学和德克萨斯大学奥斯汀分校的研究人员开发了一种电池管理系统,以促进对电池健康的诊断,以便驾驶员能够做出明智的决策。他们研究了充电曲线,并将其用于电池健康评估和预测。这些曲线给出了可用于计算SOC和其他与能量相关状态的SOH可用电池容量的最大容量。研究人员强调,虽然大多数电动汽车已经存在电池管理系统,但这个新模型具有一些与众不同的特点。 为了开展这项研究,研究人员研究了10066个LiNiO2基电池在恒定充放电倍率下的充电曲线。机械工程学副教授Jayan强调,他们拥有约11,000个实验收集的特定电池阴极化学的充电曲线数据库。他们使用这些曲线来训练机器学习模型,以使用稀疏数据输入预测完整的充电曲线。 这个模型仅分析电池充电过程的初始5%。通过这种方法,他们可以以仅有2%的极高精度预测电池的充电情况。令人印象深刻的是,这种精度水平仅利用初始充电曲线的10%作为输入数据就能达到。 研究人员表示,收集和使用真实数据作为机器学习模型的输入将是改进模型的重要下一步。此外,研究人员愿意将环境变量纳入电池充电和随后的放电曲线的计算中。他们还愿意获取在道路上行驶的电动汽车电池的数据并进行探索。通过使用真实世界的实际数据和先进的神经网络,电池管理系统可以更好地预测何时对电池进行充电和放电。

Leave a Comment

YouTube音乐与环球音乐合作推出人工智能孵化器

在一项引人注目的举措中,YouTube正积极开展一项雄心勃勃的计划,将人工智能(AI)的力量融入音乐领域。YouTube与其音乐合作伙伴环球音乐携手合作,将推出YouTube音乐AI孵化器,这一具有远见卓识的倡议探索生成式AI在塑造音乐未来中的作用。YouTube以三个关键的AI原则为核心,旨在在这个创新音乐时代和谐地融合创造力、保护和诚信。 还阅读:AI开始在YouTube上进行多语言配音 调和创造力:YouTube的三个AI原则 在YouTube的AI革命的核心是利用生成式AI在音乐中发挥潜力的承诺。在揭示YouTube的AI框架时,首席执行官Neal Mohan强调了第一个原则:将AI视为音乐领域的一个不可或缺的部分。这个原则最终导致了YouTube音乐AI孵化器的诞生。这个合作努力将涉及来自世界各地的艺术家和创意人员,并将环球音乐纳入其中。 还阅读:用AI探索音乐创作的世界 YouTube的第二个AI原则是保护音乐及其创作者。通过利用Content ID等工具,该平台坚定不移地承诺保护艺术家的作品。这一承诺确保了艺术家的创造性表达在AI创新时代也能保持纯净。它进一步体现了YouTube对维护艺术诚信的承诺。 YouTube倡导的第三个AI原则强调了AI领域的信任和安全。该平台承诺对AI生成的内容采取与其他形式的内容相同的严格保护措施。在YouTube的虚拟领域中,误导性或操纵性的AI生成内容宣扬虚假将不会找到庇护所,这一坚定立场与其向观众提供可靠和准确信息的承诺相一致。 还阅读:格莱美奖禁止AI参与:人类创作者成为焦点 Meta的影响:AI池中的涟漪 随着YouTube进军AI领域,该行业正在见证科技巨头之间的涟漪效应。前身为Facebook的Meta最近通过将生成式AI集成到其AudioCraft AI工具中引起了轰动。由Llama 2 LLM提供动力的这项创新使用户能够将文本转化为高质量、逼真的音频和音乐。该工具的三个独特模型——AudioGen、MusicGen和EnCodec——开启了音频和音乐生成的新时代。 还阅读:SoundStorm:Google的音频模型席卷音频生成领域 AudioGen和MusicGen是Meta的黄金搭档,允许用户从文本提示中生成音频和音乐。AudioGen通过使用公共音效为音频注入生命,而MusicGen则利用Meta授权的声音创作音乐。这两个模型共同铺平了实现无与伦比的音频创造力的道路,使用户能够将他们的创意变为现实。 EnCodec成为音乐生成领域创新的标志。这个解码器引领着追求高质量音乐生成的征程,减少了音频中的人工痕迹,提供了无与伦比的听觉体验。Meta在AI生成音乐方面的进展进一步凸显了AI在创意领域的变革性影响。 应对AI的影响:挑战与创新 AI和创造力的融合超越了音乐行业。然而,这个变革的过程引发了一些关注,特别是在版权和知识产权领域。虽然AI驱动的创新承诺革新创意表达,但AI生成内容的伦理和法律问题促使各行业进行深思熟虑的讨论,涉及所有权、原创性和创新。 还阅读:AI生成的艺术被美国法院否定版权 我们的观点 随着YouTube拥抱AI无限的潜力来重塑音乐领域,技术和创造力之间的和谐相互作用展现得淋漓尽致。由三个AI原则推动的YouTube音乐AI孵化器的推出,标志着进入音乐创新的新时代的重要一步。Meta的AudioCraft AI工具展示了AI的更广泛影响力,世界正在见证一个从技术中汲取灵感、突破界限并重新定义AI时代艺术表达本质的创意景观的出现。

Leave a Comment

“认识 CoDeF:一种人工智能(AI)模型,可以实现逼真的视频风格编辑,基于分割的跟踪和视频超分辨率”

基于大型数据集训练的生成模型具有出色的质量和精度,使得图像处理领域取得了重大进展。然而,视频素材处理仍然没有取得重大进展。由于神经网络的固有不可预测性,保持高时态一致性可能会很困难。视频文件的特性也带来了另一个困难,因为它们通常比其图片等价物包含更低质量的纹理,并且需要更多的处理能力。因此,基于视频的算法远远不及基于照片的算法。这种差异引发了一个问题,即是否可能在保持高时态一致性的同时,轻松地应用成熟的图像算法到视频素材中。 在深度学习之前的时代,研究人员提出了从动态电影中创建视频镶嵌图,并在隐式神经表示的建议之后,使用神经层次图片图集来实现这一目标。然而,这些方法存在两个主要问题。首先,这些表示能力有限,特别是在准确重现视频中的微小元素时。重新构建的素材经常会错过微小的动作特征,如眨眼或紧绷的笑容。第二个缺点是计算出的图集通常存在失真,导致语义信息贫乏。 因此,当前的图像处理技术未能发挥出最佳效果,因为估计出的图集需要更多的自然性。他们提出了一种新的方法,将3D时间变形场与基于哈希的2D图片场结合起来表示视频。使用多分辨率哈希编码来表达时间变形,大大改善了常规电影的调节。这种方法使得监测水和烟雾等复杂对象的变形更加容易。然而,由于变形场的增强能力,计算一个自然的规范图片是困难的。一个忠实的重建也可以预测一个人工规范图片的相关变形场。他们建议在训练过程中使用退火哈希来克服这个障碍。 首先使用平滑变形网格寻找所有刚性运动的粗略解。然后逐渐引入高频特征。通过这种从粗到细的训练,使得表示在规范的真实性和重建的准确性之间达到了妥协。与早期的隐式层次表示相比,他们在重建质量方面取得了显著的改进。这种改进通过规范图片的真实性明显增加和PSNR约4.4的提高来衡量。他们的优化方法在大约300秒内估计出了带有变形场的规范图片,而早期的隐式层次表示需要超过10小时。 他们通过在他们提出的内容变形场上建立起来,将移动图像处理任务(如提示引导图像翻译、超分辨率和分割)转移到更动态的视频内容中。他们在参考图片上使用ControlNet进行提示引导的视频到视频翻译,通过观察到的变形将翻译材料传播开来。这种翻译过程通过在单个规范图片上操作,消除了对所有帧进行耗时的推断模型(如扩散模型)的要求。与使用生成模型进行最新的零样本视频翻译相比,他们展示了在时态一致性和纹理质量方面显著的提高。 与使用神经层次图集的Text2Live相比,他们的方法在处理更复杂的运动、创建更逼真的规范图片和提供更高的翻译结果方面更加出色。他们还将超分辨率、语义分割和关键点识别等图像技术扩展到规范图片中,使它们在视频环境中有了实际应用。这包括视频关键点跟踪、视频对象分割和视频超分辨率等。他们提出的表示方法始终产生具有高时态一致性的高保真合成帧,突显了其作为视频处理的一种具有改变游戏规则的工具的潜力。 基于大型数据集训练的生成模型具有出色的质量和精度,使得图像处理领域取得了重大进展。然而,视频素材处理仍然没有取得重大进展。由于神经网络的固有不可预测性,保持高时态一致性可能会很困难。视频文件的特性也带来了另一个困难,因为它们通常比其图片等价物包含更低质量的纹理,并且需要更多的处理能力。因此,基于视频的算法远远不及基于照片的算法。这种差异引发了一个问题,即是否可能在保持高时态一致性的同时,轻松地应用成熟的图像算法到视频素材中。 在深度学习之前的时代,研究人员提出了从动态电影中创建视频镶嵌图,并在隐式神经表示的建议之后,使用神经层次图片图集来实现这一目标。然而,这些方法存在两个主要问题。首先,这些表示能力有限,特别是在准确重现视频中的微小元素时。重新构建的素材经常会错过微小的动作特征,如眨眼或紧绷的笑容。第二个缺点是计算出的图集通常存在失真,导致语义信息贫乏。 香港科技大学、蚂蚁集团、CAD&CG和浙江大学的研究人员提出了一种将3D时间变形场与基于2D哈希的图像场结合表示视频的新方法。使用多分辨率哈希编码来表示时间变形可以显著改善通用电影的调控。这种方法使得监测水和烟雾等复杂物体的变形变得更容易。然而,由于变形场的增强能力,计算自然规范图像是困难的。忠实的重建也可以预测与人工规范图像相关的变形场。他们建议在训练过程中使用退火哈希来克服这个障碍。 首先使用平滑变形网格找到所有刚性运动的粗略解,然后逐渐引入高频特征。根据这种从粗到细的训练,该表示在规范的真实性和重建的准确性之间取得了折衷。与早期技术相比,他们观察到重建质量有了显著提高。这种改善表现为规范图像的自然性明显增加和约4.4的峰值信噪比提高。他们的优化方法可以在大约300秒内估计带有变形场的规范图像,而早期的隐式分层表示需要超过10小时。 他们通过基于他们建议的内容变形场来将运动图像处理任务(如提示引导的图像翻译、超分辨率和分割)扩展到更动态的视频内容领域。他们在参考图像上使用ControlNet进行提示引导的视频到视频翻译,在观察到的变形中传播翻译材料。该翻译过程通过在单个规范图像上操作,消除了需要在所有帧上进行耗时推理模型(如扩散模型)的要求。将他们的翻译输出与最新的使用生成模型进行零样本视频翻译的结果进行比较,他们展示了显著的时间一致性和纹理质量的提高。 与使用神经分层图的Text2Live相比,他们的方法在处理更复杂的运动、创建更逼真的规范图像以及在翻译结果方面更出色。他们还将超分辨率、语义分割和关键点识别等图像技术扩展到规范图像,使其在视频场景中得以有效使用。这包括视频关键点跟踪、视频物体分割和视频超分辨率等。他们建议的表示方法始终产生具有更高时间一致性的高保真度合成帧,凸显了其作为视频处理的改变游戏规则的工具的潜力。

Leave a Comment

艺术与身份:AI揭示了自我相关性和审美吸引力之间的深刻联系

艺术的变革力量令人着迷,而人工智能(AI)的最新进展正在将这种古老的着迷注入新的生命。由马克斯·普朗克实证美学研究所(MPIEA)、恩斯特·斯特伦曼神经科学研究所(ESI)和马克斯·普朗克心理语言学研究所共同进行的一项开创性研究探索了自我相关性与美学吸引力之间的深刻联系,揭示了为什么大型科技和AI公司热衷于收集个人信息。 这个创新性的研究揭示了一个基本真理:自我相关性是决定艺术美学欣赏的关键因素。该研究的独特方法是利用AI的能力通过一种称为样式转换的技术。通过为个体参与者创建定制艺术品,研究人员试图了解自我构建的身份、记忆和经历如何影响对艺术的感知。 参与者踏上了自我发现的旅程,通过一个全面的问卷分享他们生活的方方面面。童年回忆、最近的冒险和个人身份被展现出来,每个方面都为自我的镶嵌画组成了独特的马赛克。这些个人叙述被转化为图像,利用AI来打造定制艺术品。结果是一系列与参与者深入共鸣的视觉镜像。 研究结果令人震惊,甚至连研究人员自己也感到惊讶。与为他人创作的作品相比,参与者对专门为他们设计的艺术作品的美学吸引力评价显著更高。这种联系令人神奇——自我相关性成为了个体内在共鸣的可靠预测因素。令人称奇的是,没有普遍的自我相关性符号;个人的心理在每块画布上绘制出独特的印象。 然而,艺术并不局限于反映自我的方面。它具有连接不同经历的力量。研究人员明确指出了这一点,称艺术作品不必反映一个人的生活来建立联系。即使当一件艺术作品向人们展示陌生的事物时,自我相关的元素也能培养深刻的理解和愉悦。 这项研究的影响超越了画布和笔触。在AI驱动个性化无处不在的时代,从个性化化身到定制叙述,这项研究为理解此类创新的心理影响奠定了基础。然而,这一发现也伴随着警示。自我相关性的强大吸引力也凸显了个体对个性化内容操纵的脆弱性。随着推荐算法根据复杂的用户配置文件筛选出内容和信息,自觉参与和微妙操纵之间的界限变得模糊,而这一趋势又受到AI快速发展的影响。 这项研究揭示了个人身份与艺术美学吸引力之间错综复杂的联系。它凸显了技术和心理学的强大结合,推动了对个性化内容与操纵之间微妙界限的批判性评估,而这在一个日益互联的世界中愈发凸显。自我相关性在艺术的画布上的笔触可以迷住、启发和改变,它提醒我们所见的反映可以以美丽而复杂的方式塑造我们的认知和经历。

Leave a Comment

Google在Interspeech 2023

由Google项目经理Catherine Armato发布 本周,第24届国际语音通信协会年会(INTERSPEECH 2023)在爱尔兰都柏林举行,代表着全球范围内关于口语理解和处理研究与技术的最重要会议之一。语音相关研究领域的专家们齐聚一堂,参加口头报告和海报展示,并在全球范围内建立合作。 我们很高兴成为INTERSPEECH 2023的白金赞助商,届时我们将展示超过20篇研究论文,并支持多个研讨会和特别会议。我们欢迎参会人员光临Google研究展位,与我们的研究人员见面,并参与问答和最新语音技术的演示,这些技术有助于改善数十亿用户的可访问性和便捷性。此外,我们鼓励线上参会人员访问我们在Topia上的虚拟展位,获取有关Google的研究和机会的最新信息。请访问@GoogleAI Twitter账户以了解Google展位的活动(例如演示和问答会议)。您还可以在下方了解更多关于Google在INTERSPEECH 2023上的研究(Google的关联单位以粗体显示)。 组织委员会 ISCA理事会,技术委员会主席:Bhuvana Ramabhadran 领域主席包括:语音和音频信号分析:Richard Rose;语音合成和口语生成:Rob Clark;特别领域:Tara Sainath 附属活动 VoxCeleb说话者识别挑战2023(VoxSRC-23)组织者包括:Arsha Nagrani ISCA语音合成研讨会(SSW12)演讲者包括:Rob Clark 主题演讲 – ISCA奖获得者 桥接语音科学与技术 –…

Leave a Comment

介绍SafeCoder

今天我们很高兴地宣布 SafeCoder – 一款为企业打造的代码助手解决方案。 SafeCoder 的目标是通过一个完全符合规范且自托管的双人编程工具,为企业解锁软件开发生产力。用市场术语来说:“你自己的本地 GitHub Copilot”。 在我们深入探讨之前,这是你需要了解的内容: SafeCoder 不是一个模型,而是一个完整的商业解决方案 SafeCoder 以安全和隐私为核心原则构建 – 代码在训练或推断过程中永远不会离开 VPC SafeCoder 设计为客户在自己的基础设施上进行自托管 SafeCoder 设计为客户拥有自己的 Code Large Language Model 为什么选择…

Leave a Comment