Press "Enter" to skip to content

7458 search results for "t"

介绍SafeCoder

今天我们很高兴地宣布 SafeCoder – 一款为企业打造的代码助手解决方案。 SafeCoder 的目标是通过一个完全符合规范且自托管的双人编程工具,为企业解锁软件开发生产力。用市场术语来说:“你自己的本地 GitHub Copilot”。 在我们深入探讨之前,这是你需要了解的内容: SafeCoder 不是一个模型,而是一个完整的商业解决方案 SafeCoder 以安全和隐私为核心原则构建 – 代码在训练或推断过程中永远不会离开 VPC SafeCoder 设计为客户在自己的基础设施上进行自托管 SafeCoder 设计为客户拥有自己的 Code Large Language Model 为什么选择…

Leave a Comment

介绍 IDEFICS:一个开放的最先进的视觉语言模型的再现

我们很高兴发布 IDEFICS(Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS),这是一个开放获取的视觉语言模型。IDEFICS基于Flamingo开发的最新视觉语言模型,Flamingo最初由DeepMind开发,尚未公开发布。与GPT-4类似,该模型接受任意的图像和文本输入序列,并输出文本结果。IDEFICS仅基于公开可用的数据和模型(LLaMA v1和OpenCLIP)构建,并提供两个变种——基础版本和指导版本。每个变种在90亿和800亿参数规模上都可用。 开发先进的AI模型应该更加透明。我们的目标是通过IDEFICS的复现和提供AI社区与Flamingo等大型专有模型相匹配的系统来推动透明度。因此,我们采取了重要的步骤,为这些AI系统带来透明度:我们仅使用公开可用的数据,我们提供了探索训练数据集的工具,我们分享了构建此类工件的技术教训和错误,并在发布之前通过对抗性提示评估了模型的有害性。我们希望IDEFICS能够为多模态AI系统的更加开放的研究提供坚实的基础,与OpenFlamingo等模型一起,后者是Flamingo在90亿参数规模下的另一个开放复现。 在Hub上尝试演示和模型! 什么是IDEFICS? IDEFICS是一个拥有800亿参数的多模态模型,它接受图像和文本序列作为输入,并生成连贯的文本作为输出。它可以回答关于图像的问题,描述视觉内容,创建基于多个图像的故事等。 IDEFICS是Flamingo的开放复现版本,在各种图像-文本理解基准测试中与原始闭源模型在性能上可比。它有两个变种——800亿参数和90亿参数。 我们还提供了针对对话使用案例进行调优的版本idefics-80B-instruct和idefics-9B-instruct。 训练数据 IDEFICS是在一系列公开可用的数据集上进行训练的:维基百科、公共多模态数据集和LAION,以及我们创建的一个新的包含1150亿标记的数据集,称为OBELICS。OBELICS包含从网络上抓取的1.41亿个交错的图像-文本文档,并包含3.53亿张图像。 我们提供了OBELICS的交互可视化,可以使用Nomic AI来探索数据集的内容。 IDEFICS的架构、训练方法和评估细节,以及关于数据集的信息,都可以在模型卡和我们的研究论文中找到。此外,我们还记录了模型训练中的技术见解和经验教训,提供了对IDEFICS开发的有价值的视角。 道德评估 在项目开始时,我们通过一系列讨论制定了一个道德宪章,该宪章将帮助指导项目期间的决策。该宪章阐明了价值观,包括自我批评、透明度和公平性,我们一直努力追求在项目和模型发布中贯彻这些价值观。 作为发布过程的一部分,我们通过对模型进行对抗性提示,使用可能引发我们不希望模型产生的响应的图像和文本来进行内部评估,以评估其潜在的偏见(这个过程称为红队测试)。…

Leave a Comment

NVIDIA通过新的DLSS 3.5推出了增强人工智能的实时光线追踪,用于游戏和应用程序

在全球最大的游戏会议Gamescom上,AI在游戏领域的最新进展成为焦点,NVIDIA推出了一系列技术,首先是DLSS 3.5,这是其突破性AI神经渲染技术的下一个步骤。 DLSS 3.5是NVIDIA最新的基于AI的图形技术创新,是秋季热门光线追踪游戏的图像质量升级版,包括《赛博朋克2077:幻影自由》、《艾伦·韦克2》和《带有RTX的传送门》等作品。 但NVIDIA并未止步于此。DLSS将进一步应用于更多AAA大作;AI技术将为非玩家角色(NPC)增添情感;Xbox Game Pass游戏将登陆GeForce NOW云游戏服务;GeForce NOW服务器也将进行升级。 DLSS 3.5引入光线重建技术 最重要的消息是DLSS 3.5引入了光线重建技术,这是一项开创性的功能,提升了所有GeForce RTX GPU的光线追踪图像质量,超越了传统手动调优的去噪器,采用了NVIDIA超级计算机训练的AI网络。 结果可以改善反射、全局光照和阴影等光照效果,创造出更具沉浸感和逼真度的游戏体验。 在光线追踪计算机图形中,去噪用于填补缺失的像素,以更高效地合成最终图像。NVIDIA DLSS 3.5的训练数据比DLSS 3多5倍,因此它可以识别不同的光线追踪效果,并在何时使用时间和空间数据方面做出更明智的决策。 DLSS于2019年2月首次发布,经过一系列重大升级,提高了图像质量和性能。 光线重建现在已经成为DLSS 3.5的一部分,该技术套件由GeForce RTX GPU上的Tensor…

Leave a Comment

麻省理工学院的研究人员利用深度学习和物理学修复运动干扰的MRI扫描

核磁共振成像(MRI)扫描是一种使用大型磁铁、无线电波和计算机来清晰显示身体内部结构的测试。医疗保健提供者使用MRI来评估、诊断和监测多种医疗状况。 虽然X射线和CT扫描各有优点,但MRI扫描具有更好的软组织对比度和高质量成像。尽管提供了出色的软组织对比度和高质量成像,MRI仍然容易受到运动干扰的影响,即使细微的运动也可能引入破坏性的图像伪影。这些伪影会影响医学图像的准确性,导致医生无法准确判断患者的问题,进而可能导致治疗效果不佳。 即使是短暂的扫描也可能因微小的运动而受到影响,这对MRI图像产生独特的影响。与相机模糊不同,MRI运动伪影可以扭曲整个图像。 根据华盛顿大学放射学研究的数据,大约有15%的脑MRI扫描受到运动的影响,需要进行额外的扫描。这种需要重复成像的要求导致医院每台扫描仪每年约花费115,000美元,以获得在各种MRI模式下具有诊断可靠性的图像。 为了解决这个问题,麻省理工学院的研究人员采取了重要的步骤,利用深度学习技术。他们使用深度学习找到了一个解决方案。他们将深度学习与物理学相结合,取得了惊人的结果。 他们的方法是在不改变扫描过程的情况下,通过计算构建一个无运动的图像来从受运动干扰的数据中恢复。采用这种综合方法的意义在于能够保持所得图像与实际测量结果之间的一致性。 未能实现这种对齐可能导致模型生成所谓的“幻觉”——看似真实的图像,实际上偏离了实际的物理和空间属性。这种差异有可能改变诊断结果,准确的医学图像表达的重要性凸显出来。 展望未来,他们强调了进一步研究更复杂的头部运动和影响各种身体部位的运动的激动人心的潜力。例如,在胎儿MRI方面,挑战在于应对快速和不可预测的动作,这超出了基本的平移和旋转模型的能力。这凸显了需开发更复杂的策略以考虑复杂的运动模式,为增强MRI在各种解剖情况下的应用提供了一个有希望的途径。

Leave a Comment

谷歌AI研究提出了一种使用大型语言模型(LLMs)进行个性化文本生成的通用方法

随着基于人工智能的技术在内容生成方面的应用增多,个性化文本生成引起了广泛关注。为了创建适用于特定受众、创作环境和信息需求的生成系统,它们必须能够提供个性化的回应,考虑到额外的上下文,例如用户已经写过的文档。 研究人员已经在多种场景下研究了定制文本的创建,例如评论、聊天机器人和社交媒体。大多数现有的工作提出的模型都是针对特定任务的,并依赖于领域特定的特征或信息。如何创建一种通用的策略,可以在任何情况下使用,得到的关注较少。大型语言模型(LLMs)在许多文本生成任务中日益突出,这要归功于生成式人工智能的兴起,特别是通过像ChatGPT1和Bard2这样的聊天机器人。然而,很少有研究探讨如何赋予LLMs这种能力。 最近,Google的研究提供了一种通过利用广泛的语言资源来生成独特内容的通用方法。他们的研究受到了一种常见的写作指导方法的启发,该方法将借用外部资源进行写作过程分解为更小的步骤:调研、源评估、总结、综合和整合。 为了训练个性化文本生成的LLMs,团队采用了类似的方法,采用了多阶段多任务结构,包括检索、排序、摘要、综合和生成。具体而言,他们利用当前文档的标题和第一行创建一个问题,并从个人上下文的二级存储库中获取相关信息,例如用户之前编写的文档。 接下来,他们对排名结果进行摘要,根据相关性和重要性对其进行排序。除了检索和摘要,他们还将检索到的信息综合成关键要素,然后将其输入到大型语言模型中生成新的文档。 在语言教学领域,人们普遍观察到阅读和写作技能相互发展。此外,研究表明,个体的阅读水平和阅读量可以通过作者识别活动来衡量,这与阅读能力相关。这两个发现促使研究人员创建了一个多任务环境,其中他们添加了一个辅助任务,要求大型语言模型识别特定文本的作者,以提高其阅读能力。他们希望通过给模型提供这个挑战,它将能够更准确地解释所提供的文本,并产生更引人入胜和量身定制的写作。 团队使用了三个公开可用的数据集,包括电子邮件往来、社交媒体辩论和产品评论,以评估所建议模型的性能。在所有三个数据集上,多阶段多任务框架相对于几个基准模型都显示出了显著的增益。

Leave a Comment

语言模型的未来:拥抱多模态以提升用户体验

人工智能正在进步,得益于超级有益和高效的大型语言模型的引入。基于自然语言处理、自然语言生成和自然语言理解的概念,这些模型能够使生活变得更轻松。从文本生成和问题回答到代码补全、语言翻译和文本摘要,LLM已经走过了很长的路。随着OpenAI最新版本的LLM,即GPT 4的开发,这一进步为模型的多模态性的进展打开了道路。与以往版本不同,GPT 4可以接受文本和图像的输入。 未来变得更加多模态,这意味着这些模型现在可以像人类一样理解和处理各种类型的数据。这种变化反映了我们在现实生活中的沟通方式,它涉及了结合文本、图像、音乐和图表以有效地表达意义。这一发明被视为用户体验的重要改进,可与此前聊天功能产生的革命效果相媲美。 在最近的一条推文中,作者强调了多模态在语言模型的用户体验和技术困难方面的重要性。字节跳动在实现多模态模型的承诺方面处于领先地位,这要归功于其著名的平台TikTok。他们使用文本和图像数据的组合作为其技术的一部分,并且通过这种组合驱动了各种应用,例如目标检测和基于文本的图像检索。他们方法的主要组成部分是离线批处理推理,它为200TB的图像和文本数据生成嵌入,从而可以在集成向量空间中处理各种数据类型而没有任何问题。 多模态系统实施过程中的一些限制包括推理优化、资源调度、弹性以及所涉及的数据和模型的规模庞大。字节跳动使用了灵活的计算框架Ray,该框架提供了许多工具来解决多模态处理的复杂性问题。Ray的能力提供了大规模模型并行推理所需的灵活性和可扩展性,尤其是Ray Data。该技术支持有效的模型分片,可以将计算任务分布在不同的GPU甚至同一GPU的不同区域上,从而保证即使是太大无法放在单个GPU上的模型也能够高效地处理。 迈向多模态语言模型开启了人工智能驱动互动的新时代。字节跳动使用Ray提供有效且可扩展的多模态推理,展示了这种方法的巨大潜力。人工智能系统理解、解释和响应多模态输入的能力必将影响人们与技术互动的方式,随着数字世界变得越来越复杂和多样化。与Ray等先进框架合作的创新企业正在为人工智能系统能够理解我们的语音和视觉线索铺平道路,实现更丰富、更类似人类的互动。

Leave a Comment

2023年最佳人工智能电子表格工具

当与其他数据源(包括营销数据平台)结合使用时,Excel 可以快速提供宝贵的洞察力。虽然大多数人认为它是一款电子表格程序,但它是一款功能强大的计算工具,能够解决复杂的问题。 然而,在充分使用之前,需要掌握许多复杂的公式。成为精通 Excel 所需的大量信息阻止了大多数用户发挥该程序的全部潜力。 这种情况只有在某些情况下才会发生。随着人工智能(AI)的出现,Excel 用户不再需要记住数百个冗长的 Excel 公式来进行复杂的计算和全面的洞察。 让我们来看看一些 Excel 的 AI 工具。 Botsheets Botsheets 是一个能够自动将讨论转化为电子表格的 AI 程序。通过将 Google Sheet 链接到用户的客户消息渠道,用户可以使用连接的 Google Sheet 中的列标题指示…

Leave a Comment

这篇AI论文介绍了一个包含超过260亿个三元组的综合RDF数据集,涵盖了所有科学学科的学术数据

由于科学出版物的增加,跟上最新研究变得越来越困难。例如,仅在2022年就记录了超过800万篇科学文章。研究人员使用各种技术,从搜索界面到推荐系统,来研究连接的知识实体,如作者和机构。将基础学术数据建模为RDF知识图(KG)是一种高效的方法。这样可以更容易地进行标准化、可视化和与链接数据资源的关联。因此,学术KG对于将以文档为中心的学术材料转化为链接和可自动化的知识结构至关重要。 然而,现有学术KG存在以下一种或多种限制: 它们很少包括每个学科的全面作品列表。 它们经常只涵盖特定领域,如计算机科学。 它们更新频率较低,使得许多研究和商业模型过时。 它们常常有使用限制。 即使它们符合这些标准,它们也不符合RDF等W3C标准。 这些问题阻碍了科学KG的广泛部署,如全面的搜索和推荐系统,或用于量化科学影响力。例如,Microsoft学术知识图(MAKG)及其RDF后代无法更新,因为Microsoft学术图在2021年被终止。 创新的OpenAlex数据集旨在弥补这一差距。然而,OpenAlex的数据不符合链接数据原则,也无法以RDF形式访问。因此,OpenAlex不能被视为KG,这使得语义查询、应用集成和连接到新资源变得困难。乍一看,它似乎是将科学文章的学术信息纳入Wikidata的一种简单方法,从而支持WikiCite运动。除了特定的模式外,数据量已经如此庞大,以至于Wikidata查询服务的Blazegraph三元组存储接近其容量限制,无法集成任何内容。 本文介绍了Karlsruhe Institute of Technology和Metaphacts GmbH的研究人员引入的非常大规模的学术领域RDF数据集SemOpenAlex,其中包括论文、作者、来源、机构、思想和出版商。SemOpenAlex拥有约2.49亿篇来自各个学术领域的论文和超过260亿个语义三元组。它建立在他们的综合本体论上,并引用了其他LOD源,包括Wikidata、Wikipedia和MAKG。他们提供了一个公共的SPARQL接口,以便快速有效地使用SemOpenAlex与LOD云进行集成。此外,他们提供了一个复杂的语义搜索界面,使用户能够实时检索数据库中包含的实体及其语义关系的信息(例如,通过显示共同作者或作者最重要的概念,这些概念是通过语义推理而不是直接包含在数据库中推断出来的)。 他们还提供了完整的RDF数据快照,以便进行大规模数据分析。他们利用AWS创建了一个流水线,可以定期更新SemOpenAlex而完全没有任何服务中断,这是由于SemOpenAlex的规模和集成到SemOpenAlex中的科学文章数量的增加。此外,他们还使用先前存在的本体论尽可能地保证系统的互操作性,符合FAIR原则,并为将SemOpenAlex与Linked Open Data Cloud集成打开了大门。通过提供每月更新,使得可以持续监测作者的科学影响力、跟踪获奖研究以及其他使用其数据的用例,他们填补了MAKG终止后的空白。他们通过免费和无限制地提供SemOpenAlex,使来自许多学科背景的研究团队能够访问其提供的数据并将其纳入研究中。目前已经存在SemOpenAlex的初始应用案例和生产系统。 总体而言,他们做出了以下贡献: 1. 他们使用流行的词汇为SemOpenAlex开发本体论。 2. 在https://semopenalex.org上,他们以RDF形式生成SemOpenAlex知识图,包含260亿个三元组,并向公众提供了所有SemOpenAlex的数据、代码和服务。 3. 通过使所有URI可解析,他们使SemOpenAlex能够参与到Linked…

Leave a Comment

使用Amazon SageMaker Clarify在临床环境中解释医疗决策

在这篇文章中,我们展示了如何使用Amazon SageMaker Clarify来改进临床环境中的模型可解释性在医学领域中使用的机器学习(ML)模型的可解释性变得越来越重要,因为为了获得认可,这些模型需要从多个角度进行解释这些角度包括医学、技术、法律和最重要的——患者的角度在医学领域中,基于文本开发的模型在统计学上已经变得准确,然而,为了为每个病人提供最佳护理,临床医生在伦理上要求评估与这些预测相关的弱点为了让临床医生能够根据每个病人的情况做出正确的选择,这些预测的可解释性是必需的

Leave a Comment

2023年最佳人工智能演示工具

现代演示软件已远远超越了PowerPoint的静态幻灯片和基本过渡效果。人工智能(AI)已经融入演示软件,提供更智能的设计建议、增强的功能和个性化功能,以吸引观众。本文介绍了当今最顶尖的人工智能(AI)驱动演示工具及其如何改变我们与观众互动和传递内容的方式。无论您是经验丰富的专业人士还是刚刚入门,您都可以了解更多关于这些AI驱动产品的功能。 Gamma Gamma推出了一款新产品,简化了文档、演示和网站。该平台的AI生成器是核心,它可以快速从头开始创建基本的演示或文档,为用户提供了一个坚实的基础。用户赞扬Gamma能够以新颖的方式传递信息,摆脱了静态PowerPoint幻灯片的限制。其有用的功能使演讲者能够顺利进行演示。它的“一键”视觉改进是一个突出的功能。用户可以通过单击一次完全改变演示或文档的视觉风格,省去了幻灯片掌握和组件对齐的耗时任务。该平台对设计的关注保证了内容始终与品牌标准一致,并且视觉上令人愉悦。 SlidesAI SlidesAI是一个演示创作程序,旨在帮助用户轻松创建看起来专业的演示。该程序强调用户友好性,允许演讲者以文本或计划涵盖的材料摘要开始演讲。SlidesAI因其基于文本输入创建演示的能力而与众不同。定制功能提供的各种字体和颜色选项使其适用于各种品牌和个人。 Decktopus Decktopus是一种基于云的软件服务,提供快速灵活的演示开发工具。最引人注目的一个方面是丰富的可定制模板。每个模板都可以以不同的方式进行定制,从更改布局到选择不同的字体。Decktopus还包括一个基于AI的内容助手,以补充其设计功能。使用此功能可以节省时间,同时制作出传达信息效果的精美演示。Decktopus的实时协作功能是其更实用的功能之一。团队可以共同创建演示,减少重复工作并确保统一性。 Slidesgo Slidesgo是一个新的网站,提供专为业务、教育、营销和医疗保健优化的Google Slide主题和PowerPoint模板。用户可以选择广泛的演示主题、格式、视觉风格、配色方案等选项,打造完全符合他们需求的演示。Slidesgo凭借其丰富的可定制演示模板而脱颖而出。此外,该软件的人工智能演示创建功能简化了开发过程,对于忙碌的专业人士来说是一个节省时间的选择。 iA Presenter iA Presenter通过以文本用户界面为中心来提供一种全新的演示方式。故事是这个尖端工具布局的核心,有助于从文本到视觉的平滑过渡。iA Presenter的“Turbostart”是一个突出的功能。这个功能消除了第一次演示的紧张感。用户可以通过导入预先存在的数据(如电子邮件、笔记和推文)避免从零开始。因为该软件的编辑器是基于文本的,您可以立即使用已经编写好的内容,节省创建幻灯片所需的时间。iA Presenter的编辑过程也非常直观。该工具允许用户轻松地在多个幻灯片之间拆分或合并内容,以灵活地发展故事。当正文材料和幻灯片标题之间有明确的界限时,演示更有可能成功。 Pitch Pitch的主要重点是促进业务增长,因此它致力于简化演示制作、协作和共享过程。Pitch在减少演示创建和修订方面的速度是一个重要的特点。借助该软件直观的编辑工具和实时分析,可以做出更好的决策。Pitch在用户定制方面依赖很重。用户可以选择预制模板或从头开始创建自己的模板,包括品牌的颜色和字体。该软件还允许对每个幻灯片的演示风格进行轻松定制,有助于保持演示中的统一品牌形象。创建可在后续项目中使用的模板是任何团队的时间和人力节省者。 Ludus Ludus的基于Web的服务是专为当今的艺术家而设计的。该平台的用户将欣赏到访问和整合Web资源到他们的演示文稿中是多么简单。Ludus最吸引人的特点之一是协作创意团队可以如何轻松地组织演示文稿。由于软件具备协作功能,控制团队的工作流程变得更简单。由于Ludus认识到每个团队成员的才能的价值,它允许创建专门的工作描述。因此,每个人都可以将他们的精力用在最有益处的地方,提高产出和信心。 ClassPoint ClassPoint被设计用于改进标准的PowerPoint演示文稿。它专门针对教职工,帮助他们将乏味的PowerPoint转变为令人兴奋、以受众为中心的体验。ClassPoint最显著的特点之一是其互动性。演讲者可以在PowerPoint中进行投票和使用白板工具,从而引起观众的兴趣。此外,AI生成的问题可以用于征求观众的反馈,从而实现更具互动性和合作性的课堂环境。ClassPoint是一个一体化解决方案,无需在PowerPoint之外使用其他教学工具。教育工作者可以借助学生互动功能,通过增强平台与熟悉的PowerPoint界面一起进行互动课堂。这种策略旨在通过减轻教师处理多个软件程序的负担来简化课堂体验。 Piggy Piggy是一家位于特拉维夫的公司,提供适用于现代化的解决方案,具有灵活的界面,可制作各种形式的数字娱乐。Piggy成立两年,由一个13人的团队运营,致力于改进数字自我表达的技术水平。Piggy是一个灵活的移动软件,可用于各种用途,包括文档和演示文稿的创建、图片相册制作和网站开发。该应用程序通过设计互动内容(如问卷和故事),强调用户的主动性。然后用户可以下载、嵌入或分享内容。 Beautiful.ai…

Leave a Comment

Can't find what you're looking for? Try refining your search: