Press "Enter" to skip to content

867 search results for "分类"

什么是对话式人工智能的关键区别?

介绍 在今天的世界中,您可能已经观察到,即使是孩子们也被Alexa吸引,驱使他们播放自己喜爱的音乐或电视节目。看到这些小人类使用最新技术之一而不知道它的工作原理是令人惊讶的。这就是人工智能的这个子类型的特殊之处——对话型人工智能。对话型人工智能使计算机和软件应用能够像人类一样听取、理解和回应。试试使用Microsoft的Cortana、Apple的Siri和Google的Bard来理解我们的话。或者前往OpenAI的ChatGPT,这是最新的、最轰动人心的对话型人工智能,它知道一切(直到2021年)。 在此之前,让我们先了解一下这些对话型人工智能模型是如何工作的。此外,我们将讨论它们的交流方式以及它们如何理解您的回应。 什么是对话型人工智能? 基本上,对话型人工智能是一种人工智能(AI)技术,模拟人类对话。它使计算机和软件应用程序能够使用口语/书面语言以类似于人类的方式与人类进行协作。这些系统可以以各种形式实现,例如聊天机器人、虚拟助手、语音激活智能设备和客户支持系统。 对话型人工智能如何工作? 对话型人工智能工作流程是一系列不同的过程。一个典型的对话型人工智能的工作方式如下。 交互式用户界面:它具有一个界面,用户可以输入文本。或者,ASR(自动语音识别)系统可以记录用户的语音并将其转换为文本。 自然语言处理:然后使用NLP技术从用户输入中提取意图,并将其转换为结构化数据进行分析。 自然语言理解(NLU):NLU专注于从用户的输入中提取意图和上下文。它涉及分析信息以确定用户的目标或所需操作。 自然语言生成(NLG):使用自然语言生成(NLG)生成响应进行对话。NLG用于推断上述过程并生成与人类对话的响应。 自然语言理解(NLU) 顾名思义,自然语言理解(NLU)是一种利用计算机软件理解用户输入的人工智能分支。它有助于弥合用户语言和系统处理和适当响应的能力之间的差距。 准确和上下文感知的语言理解的重要性 随着人工智能的进步,越来越多的公司在其运营中采用基于AI的技术。客户服务和管理是AI采用日益增加的领域之一。因此,能够准确分析客户情感和语言的AI正面临上升趋势。这减少了需要人类专业人员与客户互动并花费大量人力小时尝试理解他们的需求。 对话型人工智能系统中的NLU技术 NLU是所有对话型人工智能系统的重要组成部分。为了分类意图、提取实体并理解上下文,NLU技术通常与机器学习一起使用。它使用监督学习、命名实体识别和深度学习。 监督学习:通常使用带标签的训练数据进行NLU模型的训练。训练数据包括用户输入及其相应的意图和实体示例。使用这些数据,NLU模型学会识别输入和所需输出之间的模式和关系。 命名实体识别(NER):NER是一种特定的NLU技术,用于识别和分类文本中的命名实体。它提取实体,如名称、日期、组织或预定义类别。 深度学习:各种NLU任务利用循环神经网络(RNN)和变压器捕捉输入数据中更复杂的模式。它有助于有效地理解意图并提取实体。 智能虚拟助手(IVAs) 您是否与Siri、Cortana或Alexa互动过?如果是的话,那么您一定熟悉虚拟助手是什么。即使您没有,您至少也听说过它们。它们是高级对话型人工智能系统,可以模拟人类交互,协助用户完成各种任务并提供个性化的帮助。 虚拟助手在提供人类化互动方面的作用 虚拟助手在当今现实世界中有很多用途。以下是其中一些。 上下文感知:…

Leave a Comment

一个新的人工智能研究介绍了“识别任何东西模型(RAM)”:一种强大的图像标记基础模型

在自然语言处理(NLP)任务中,大型语言模型(LLM)在大规模在线数据集上训练表现出色。通过扩大数据规模,分割任何模型(SAM)在计算机视觉(CV)中显示出了出色的零样本定位能力。 不幸的是,SAM 无法生成语义标签,这是与定位相当的基本任务。多标签图像识别是识别单个图像的多个标签的目标,也称为图像标记。由于图像包含各种标签,包括对象、场景、属性和活动,图像标记是一个重要且有用的计算机视觉问题。 以下是阻碍图像标记的两个主要因素: 高质量数据的广泛收集。目前仍缺乏一个能够半自动或自动注释各类大量照片的高效数据注释引擎,以及一个标准化和全面的标记系统。 建立起足够的开放词汇表和强大的模型,采用高效灵活的模型设计,利用大规模的弱监督数据。 识别任何模型(RAM)是一个强大的图像标记基础模型,由OPPO研究院、国际数字经济学院(IDEA)和AI2机器人的研究人员刚刚推出。在数据方面,RAM可以克服标签系统不足、数据集不足、数据引擎低效和架构限制等问题。 研究人员首先创建了标准的全球命名约定。他们使用学术数据集(分类、检测和分割)和商业标记工具(Google、Microsoft和Apple)来丰富他们的标记系统。通过将所有可用的公共标记与常见的基于文本的标记相结合,标记方法产生6,449个标签,共同解决了绝大部分用例。研究人员表示,可以使用开放集识别来识别其余的开放词汇标签。 自动注释大规模照片使用标签系统是一项具有挑战性的任务。图像标记的提出方法受到了该领域以前的工作的启发,该领域使用大规模的公共图像文本对来训练强大的视觉模型。为了将这些大量的图片文本数据用于标记,团队采用了自动文本语义解析来提取图像标签。通过这种方法,他们可以在不依赖手动注释的情况下,基于图像文本对获得大量的图片标签。 因为互联网来源的图像文本组合往往存在随机噪声,所以团队创建了数据标记引擎来提高注释准确性。为了解决缺少标签的问题,他们采用现有模型来产生补充分类。在处理错误标记区域时,他们确定图像中与不同标签相关的某些部分,然后使用区域聚类方法查找和消除同一类别内的异常值。此外,还删除做出不一致预测的标签,以获得更精确的注释。 RAM通过为标签搜索添加语义上下文,允许对新颖类别进行泛化。RAM的识别能力可以通过这种模型架构为任何视觉数据集提高。通过展示一个在嘈杂的、无注释的数据上训练的通用模型可以击败高度监督的模型,RAM引入了一种新的图像标记范式。RAM需要一个免费且公开可用的没有注释的数据集。RAM的最强大版本只需在8个A100 GPU上训练三天。 据团队表示,RAM仍有改进的空间。这包括运行多个数据引擎迭代、增加骨干参数以提高模型容量,以及扩展训练数据集超过1400万张照片,以更好地覆盖不同领域。

Leave a Comment

前20个数据可视化实例

介绍 你一定听说过著名的说法,“一幅图胜过千言万语。”你是否曾经想过为什么呢?因为它们可以在不说任何话的情况下表达很多东西。在今天的数据驱动世界中,这句话比以往任何时候都更有价值。数据可视化是一门艺术,超越了数字和统计,为数据赋予生命,并将其转化为引人入胜的视觉故事。数据中隐藏的故事由一系列色调、形式和模式揭示,其中每个组件都和谐舞蹈。在我们数字化的时代,它作为清晰的灯塔,引导我们穿越复杂性,优雅地和精确地揭示洞见。 所以,让我们一起探索数据可视化的世界,把数据转化为艺术作品,通过每一个出色的视觉决策揭示知识。 什么是数据可视化? 数据和信息的图形表示被称为数据可视化。将非结构化数据转换为像地图、图表、图形和信息图表等可视化表示形式,帮助用户理解数据的模式、趋势和关系。 使用数据可视化进行分析和沟通的好处 通过利用图形组件、图表和交互特性,数据可视化在分析和沟通方面提供了许多优势。 可视化表示使人们更容易快速理解复杂的数据集。 可视化使人们能够发现在分析大量原始数据时可能被忽视的模式、趋势和相关性。 用户可以通过仪表板和信息图表等可视化表示形式更好地理解机会和潜在风险。 可视化使利益相关者更容易参与,并在一小部分时间内传达所有信息,而不是花费时间阅读整个统计摘要报告。 数据可视化的类型 有许多数据可视化,包括图表、图形、饼图、散点图、气泡图、直方图等。我们将在以下部分简要介绍它们。 选择适合数据的正确可视化 选择适合数据的可视化对于有效传达见解至关重要。选择可视化时考虑以下因素: 数据类型:确定您的数据是数值、分类、时间还是空间。不同的数据类型更适合特定的可视化风格。 分析目标:考虑您的研究目标。您是想展示对比、趋势、分布还是关系?不同的可视化技术在不同的领域中成功。 故事需求:考虑您想要您的数据讲述的故事。 了解您的目标受众和可视化将呈现的环境。选择适合他们的经验水平和熟悉程度的格式。 图表和图形 条形和柱形图 条形和柱形图通常比较分类数据或显示频率分布。例如,条形图可用于比较零售店不同产品的销售业绩,或显示服务的客户反馈评级分布。 线形和面积图 线形图显示由线连接的数据点,直观地表示一个特定时期的进展和波动。例如,线形图可以说明一家公司多年来的销售增长,而面积图可以显示特定行业不同竞争对手的市场份额。 饼图和环形图…

Leave a Comment

麻省理工学院的研究人员提出了一种新的多模式技术,将机器学习方法融合在一起,以更类似于人类的方式进行学习

人工智能在我们日常遇到的所有主要用例和应用中都是革命性的。其中一个领域围绕着大量的音频和视觉媒体。想想所有能够生成有趣视频、艺术性惊人的图像、复制名人声音或只需一键记录整个讲座的人工智能应用程序。所有这些模型都需要大量的数据进行训练。大多数成功的系统都依赖于带注释的数据集来自我教育。 最大的挑战是存储和注释此数据,并将其转换为模型可以摄入的可用数据点。说起来容易做起来难,公司需要帮助每年收集并创建金标准数据点。 现在,来自麻省理工学院、麻省理工-IBM沃森人工智能实验室、IBM研究和其他机构的研究人员已经开发出一种能够有效解决这些问题的开创性技术,即分析未标记的音频和视觉数据。这种模型具有很大的潜力和潜力,可以改善当前模型的训练方式。这种方法与许多模型共鸣,例如语音识别模型、转录和音频创建引擎以及对象检测。它结合了两种自我监督学习体系结构:对比学习和遮蔽数据建模。这种方法遵循一个基本思想:复制人类如何感知和理解世界,然后复制相同的行为。 正如麻省理工学院的博士后Yuan Gong所解释的那样,自我监督学习非常重要,因为如果你看看人类如何收集和学习数据,其中很大一部分是没有直接监督的。目标是在机器中实现相同的过程,使它们能够从未标记的数据中学习尽可能多的功能。这种训练成为可以利用和改进的强大基础,具体取决于用例的监督学习或强化学习。 这里使用的技术是对比音频 – 视觉遮蔽自编码器(CAV-MAE),它使用神经网络从音频和视觉数据中提取和映射有意义的潜在表示。这些模型可以在10秒YouTube剪辑的大型数据集上进行训练,利用音频和视频组件。研究人员声称,CAV-MAE比任何其他先前方法都要好得多,因为它明确强调了音频和视觉数据之间的关联,而其他方法则没有。 CAV-MAE方法包括两种方法:遮蔽数据建模和对比学习。遮蔽数据建模包括: 获取视频及其匹配的音频波形。 将音频转换为频谱图。 遮蔽75%的音频和视频数据。 然后,该模型通过联合编码器/解码器恢复缺失的数据。重建损失,即衡量重建预测和原始音频-视觉组合之间差异的损失,用于训练模型。这种方法的主要目的是将相似的表示映射到彼此靠近的位置。它通过关联音频和视频数据的相关部分来实现,例如连接口部的口型。 将基于CAV-MAE的模型与其他模型进行测试证明非常有启发性。测试是在音频视频检索和音频-视觉分类任务上进行的。结果表明,对比学习和遮蔽数据建模是互补的方法。 CAV-MAE在事件分类方面优于以前的技术,并保持与使用行业级计算资源训练的模型竞争力。此外,多模态数据显着提高了单模态表示的微调和音频事件分类任务的性能。 麻省理工学院的研究人员认为,CAV-MAE代表了自我监督音频-视觉学习进展的突破。他们设想,它的用例可以涵盖动作识别,包括运动、教育、娱乐、摩托车和公共安全,跨语言自动语音识别和音频-视频生成。虽然当前的方法侧重于音频-视觉数据,但研究人员的目标是将其扩展到其他模态,认识到人类感知涉及音频和视觉提示以外的多种感官。 很有意思看到这种方法随着时间的推移表现如何,并且有多少现有模型尝试纳入这种技术。 研究人员希望随着机器学习的进步,像CAV-MAE这样的技术将变得越来越有价值,使模型能够更好地理解和解释世界。

Leave a Comment

使用GraphStorm快速处理大规模企业图的机器学习:一种新的解决方案

我们很高兴地宣布,GraphStorm 0.1已经正式开源发布它是一个低代码企业级图机器学习(ML)框架,可在数天内构建、训练和部署复杂的企业级图形ML解决方案,而非数月使用GraphStorm,您可以构建直接考虑数十亿之间的关系或交互结构的解决方案

Leave a Comment

了解PRODIGY:一种预训练AI框架,可在图形上进行上下文学习

GPT模型是OpenAI开发的ChatGPT聊天机器人背后的变压器架构,它基于通过仅几个例子学习任务的概念。这种称为上下文学习的方法,使模型避免了使用数千个输入文本进行微调,只使用特定于任务的示例作为输入就能学习在不同任务上表现良好。针对特定任务微调模型可能非常昂贵,因为GPT是一个具有数十亿参数的“大”语言模型,由于在微调期间需要更新所有模型参数,因此相对而言成本较高。 上下文学习在代码生成、问答、机器翻译等方面得到了有效应用,但在图机器学习任务中仍然存在局限性和挑战。一些图机器学习任务包括识别在社交网络上传播半真半假或虚假新闻的传播者和跨电子商务网站的产品推荐。上下文学习在制定和建模这些任务的过程中面临局限性,无法形成和建模统一的任务表示,使模型能够处理各种任务而无需重新训练或参数调整。 最近,一组研究人员在其研究论文中介绍了PRODIGY,这是一个预训练框架,可实现在图形上下文中学习。PRODIGY(Pretraining Over Diverse In-Context Graph Systems)使用提示图表示形式来制定上下文学习。提示图作为上下文图任务表示,集成了节点、边缘和图级机器学习任务的建模。提示网络将输入节点或边缘与其他标签节点连接,并对提示示例和查询进行上下文化。这种互连表示允许指定各种图形机器学习任务到同一模型中,而不受图形大小的限制。 由斯坦福大学和卢布尔雅那大学的研究人员提出,团队设计了一种图形神经网络架构,专门用于处理提示图,并有效地对图结构化数据进行建模和学习。所提出的设计利用GNN教授提示图的节点和边缘的表示。此外,还引入了一系列上下文预训练目标,以指导学习过程,提供监督信号,使模型能够捕获相关的图形模式并在不同的任务中进行推广。 为了评估PRODIGY的性能和有效性,作者在涉及引文网络和知识图的任务上进行了实验。引文网络代表科学论文之间的关系,而知识图则捕获有关不同领域的结构化信息。使用上下文学习对预训练模型进行了测试,并将结果与硬编码适应性的对比预训练基线和使用有限数据的标准微调进行了比较。PRODIGY在准确性方面平均优于对比预训练基线的硬编码适应性18%。当应用上下文学习时,与标准微调相比,平均提高了33%。 总之,PRODIGY在基于图形的场景中似乎很有前途,如图机器学习应用中的上下文学习。它甚至可以在以前未见过的图形上执行下游分类任务,使其更加有效和有益。

Leave a Comment

SQL技术揭示巴西在线购物的见解

介绍 领先的零售公司Target扩大了其在巴西的电子商务业务以迎合不断增长的在线购物趋势。为了在这个竞争激烈的市场上取得成功,Target必须了解巴西电子商务的动态,并利用数据驱动的洞见来提升其业务。本文将使用结构化查询语言(SQL)动力查询分析Target的电子商务数据集,为改善其在巴西的业务提供可行建议。 学习目标 通过分析Target的电子商务数据集,掌握SQL的熟练程度。 学习如何使用SQL查询对数据集进行初始探索,包括数据清洗和准备。 了解如何使用SQL查询分析和解释巴西的电子商务趋势。 发展识别和分析电子商务数据中季节性模式的技能。 通过SQL分析学习提取有关客户购买模式和偏好的有价值见解。 发展基于数据的建议能力,针对数据集的SQL分析提供可行的见解,以改善电子商务业务。 阅读更多: SQL for Data Science Beginners ! 本文是Data Science Blogathon的一部分。 数据集的初始探索 在深入分析之前,我们对Target的电子商务数据集进行了初始探索。这包括检查数据、清洗数据并为分析做好准备。我们使用以下SQL查询在BigQuery中验证了“客户”表的列数据类型: SELECT column_name, data_type FROM…

Leave a Comment

使用机器学习解决代码审查评论

由亚历山大·弗瑞姆根 (Alexander Frömmgen),高级软件工程师莱拉·卡拉提扬 (Lera Kharatyan) 发布 代码更改审查是规模化软件开发过程中至关重要的一部分,占用了代码作者和代码审查人员相当数量的时间。作为这个过程的一部分,审查人员检查建议的代码,并通过自然语言编写的评论要求作者进行代码更改。在 Google,我们每年看到数百万个审查人员的评论,作者需要平均 ~60 分钟的积极引导时间,在发送更改进行审查和最终提交更改之间。在我们的测量中,代码作者必须做出的为了应对审查人员的评论所需的积极工作时间几乎是随着评论数量线性增长的。然而,通过机器学习 (ML),我们有机会自动化和简化代码审查过程,例如,根据评论的文本提出代码更改。 今天,我们描述了我们在 Google 的日常开发工作流程中应用最新的大型序列模型 (使用 DIDACT 方法论) 的应用,自动解决代码审查评论。截至今天,Google 的代码更改作者通过应用 ML 建议的编辑,处理了大量的审查人员评论。我们预计,在 Google 的规模下,这将每年减少数十万小时的代码审查时间。非请求的非常积极的反馈表明,ML 建议的代码编辑的影响增加了 Google…

Leave a Comment

大规模数据的差分隐私聚类

由Google研究的Graph Mining团队的Vincent Cohen-Addad和Alessandro Epasto发布 聚类是无监督机器学习(ML)中的一个核心问题,广泛应用于行业和学术研究的多个领域。在其核心,聚类包括以下问题:给定一组数据元素,目标是将数据元素分成组,使得相似的对象在同一组中,而不相似的对象在不同的组中。60多年来,这个问题在数学、计算机科学、运筹学和统计学中以其无数的变体进行了研究。聚类的两种常见形式是度量聚类,其中元素是度量空间中的点,例如k-means问题,和图聚类,其中元素是图的节点,其边表示它们之间的相似性。 在k-means聚类问题中,我们给出了度量空间中的一组点,目标是识别k个代表点,称为中心(在此处表示为三角形),以最小化每个点到其最近中心的平方距离之和。来源,版权:CC-BY-SA-4.0 尽管算法设计方面的聚类文献很广泛,但很少有实际工作专注于在聚类过程中严格保护用户的隐私。当聚类应用于个人数据(例如用户所做的查询)时,有必要考虑在实际系统中使用聚类解决方案的隐私影响以及输出解决方案揭示有关输入数据的信息量。 为了在严格意义上保护隐私,一个解决方案是开发差分隐私(DP)聚类算法。这些算法确保聚类的输出不会揭示有关特定数据元素(例如,用户是否进行了给定查询)或有关输入图中的敏感数据(例如,社交网络中的关系)的私有信息。鉴于隐私保护在无监督机器学习中的重要性,在最近几年中,Google一直在研究不同ially private metric或graph clustering和各种情境下的差分隐私,例如热图或设计DP算法的工具。 今天我们很高兴地宣布两个重要的更新:1)一种新的差分隐私层次图聚类算法,我们将在ICML 2023上展示,2)可扩展的差分隐私k-means算法代码的开源发布。此代码使用分布式计算将差分隐私k-means聚类应用于大规模数据集。在这里,我们还将讨论我们在健康领域最近推出的用于向公共卫生当局提供信息的聚类技术的工作。 差分隐私层次聚类 层次聚类是一种流行的聚类方法,它包括将数据集递归地分成越来越细的群集。生物学中著名的层次聚类的例子是分类系统,其中地球上的所有生命都被分成越来越细的组(例如,王国、门、纲、目等)。层次聚类算法接收表示实体相似性的图作为输入,并以无监督的方式学习这种递归分区。然而,在我们的研究中,尚不知道任何算法可以计算带有边缘隐私的图的层次聚类,即保护顶点交互的隐私。 在“带有可证明逼近保证的差分隐私层次聚类”中,我们考虑在DP上下文中可以对问题进行多好逼近,并对隐私保证建立了坚实的上限和下限。我们设计了一种多项式运行时间的逼近算法(其类型的第一个算法),它具有随节点数n(约为n 2.5 )缩放的附加误差和O(log ½ n)的乘法逼近,其中乘法误差与非私有设置相同。我们进一步为任何私有算法提供了一个新的附加误差下限(约为n 2 ),并提供了一个与此下限相匹配的指数时间算法。此外,我们的论文包括一种超越最坏情况的分析,重点关注分层随机块模型,这是一种展现自然分层聚类结构的标准随机图模型,并引入了一种私有算法,其返回与最优解相比可以忽略不计的附加成本,这再次匹配非私有状态下的最先进方法。我们相信这项工作扩展了图数据上隐私保护算法的理解,并将使这些设置中的新应用成为可能。 大规模差分隐私聚类 我们现在转换话题,讨论我们在度量空间聚类方面的工作。在差分隐私度量聚类的先前工作中,大多数专注于提高算法在 k-means…

Leave a Comment

一款R18游戏的玩家们,竟然干翻了国家游戏管理委员会

你有想过,有一天玩家能真的逼迫国家分级管理组织自我审查,重新分类,甚至重组结构么?

不敢想吧?

韩国玩家做到了。

2022年11月10日中午10点,韩国游戏管理委员会(下文简称游管委)召开了办公会议,宣布增强与游戏用户沟通,分类过程透明化,重新进行游戏分类,扩大重新分类小组人数并优先考虑游戏专业或者从业人士

Leave a Comment

即时工具|一个在线工具箱,内含300多款工具

一款在线高效办公工具,拥有近300款工具包括视频工具、音频工具、图片工具、文档处理、文档转换、办公辅助、设计工具等等,日常工作学习辅助绝对够你使用

即时工具是一款在线即用即走型工具箱,无需客户端在线一键使用。
目前拥有近300款在线工具,并且拥有良好的使用体验。
其中包括视频工具、音频工具、图片工具、文档处理、文档转换、办公辅助、设计工具、文本工具、数字工具、加密工具、单位转换等工具。

即时工具|一个在线工具箱,内含300多款工具

特色功能:

Comments closed

Can't find what you're looking for? Try refining your search: