Press "Enter" to skip to content

四海吧 Posts

一个新的人工智能研究介绍了“识别任何东西模型(RAM)”:一种强大的图像标记基础模型

在自然语言处理(NLP)任务中,大型语言模型(LLM)在大规模在线数据集上训练表现出色。通过扩大数据规模,分割任何模型(SAM)在计算机视觉(CV)中显示出了出色的零样本定位能力。 不幸的是,SAM 无法生成语义标签,这是与定位相当的基本任务。多标签图像识别是识别单个图像的多个标签的目标,也称为图像标记。由于图像包含各种标签,包括对象、场景、属性和活动,图像标记是一个重要且有用的计算机视觉问题。 以下是阻碍图像标记的两个主要因素: 高质量数据的广泛收集。目前仍缺乏一个能够半自动或自动注释各类大量照片的高效数据注释引擎,以及一个标准化和全面的标记系统。 建立起足够的开放词汇表和强大的模型,采用高效灵活的模型设计,利用大规模的弱监督数据。 识别任何模型(RAM)是一个强大的图像标记基础模型,由OPPO研究院、国际数字经济学院(IDEA)和AI2机器人的研究人员刚刚推出。在数据方面,RAM可以克服标签系统不足、数据集不足、数据引擎低效和架构限制等问题。 研究人员首先创建了标准的全球命名约定。他们使用学术数据集(分类、检测和分割)和商业标记工具(Google、Microsoft和Apple)来丰富他们的标记系统。通过将所有可用的公共标记与常见的基于文本的标记相结合,标记方法产生6,449个标签,共同解决了绝大部分用例。研究人员表示,可以使用开放集识别来识别其余的开放词汇标签。 自动注释大规模照片使用标签系统是一项具有挑战性的任务。图像标记的提出方法受到了该领域以前的工作的启发,该领域使用大规模的公共图像文本对来训练强大的视觉模型。为了将这些大量的图片文本数据用于标记,团队采用了自动文本语义解析来提取图像标签。通过这种方法,他们可以在不依赖手动注释的情况下,基于图像文本对获得大量的图片标签。 因为互联网来源的图像文本组合往往存在随机噪声,所以团队创建了数据标记引擎来提高注释准确性。为了解决缺少标签的问题,他们采用现有模型来产生补充分类。在处理错误标记区域时,他们确定图像中与不同标签相关的某些部分,然后使用区域聚类方法查找和消除同一类别内的异常值。此外,还删除做出不一致预测的标签,以获得更精确的注释。 RAM通过为标签搜索添加语义上下文,允许对新颖类别进行泛化。RAM的识别能力可以通过这种模型架构为任何视觉数据集提高。通过展示一个在嘈杂的、无注释的数据上训练的通用模型可以击败高度监督的模型,RAM引入了一种新的图像标记范式。RAM需要一个免费且公开可用的没有注释的数据集。RAM的最强大版本只需在8个A100 GPU上训练三天。 据团队表示,RAM仍有改进的空间。这包括运行多个数据引擎迭代、增加骨干参数以提高模型容量,以及扩展训练数据集超过1400万张照片,以更好地覆盖不同领域。

Leave a Comment

如何使用Langchain自动化数据分析?

介绍 在今天的世界中,企业和组织都严重依赖数据做出明智的决策。然而,分析大量数据可能是一项耗时且令人望而生畏的任务。这就是自动化发挥作用的地方。通过像Langchain和Gen AI这样的框架,您可以自动化您的数据分析,节省宝贵的时间。 在本文中,我们将深入探讨如何使用Langchain构建自己的代理程序并自动化数据分析。我们还将向您展示如何使用内置的pandas代理程序逐步创建Langchain代理程序的指南。 Langchain是什么? Langchain是一个用于构建具有大型语言模型(如chatGPT)的应用程序的框架。它提供了一种更好的管理内存、提示和创建链(一系列操作)的方法。此外,Langchain为开发人员提供了一个创建代理程序的工具。代理程序是可以根据条件执行一系列操作的实体。 Langchain中的代理程序类型 Langchain中有两种类型的代理程序: 动作代理程序:动作代理程序决定要执行的动作并逐个执行这些动作。 计划-执行代理程序:计划和执行代理程序首先决定要执行的一系列动作,然后逐个执行这些动作。 然而,这两个类别之间没有明确的区别,因为这个概念仍在发展中。 使用Langchain进行数据分析 请安装langchain和openai库。您可以通过下载所需的库,然后将它们导入到您的项目中来完成此操作。以下是如何操作: # 安装langchain和openai库 !pip install langchain openai # 导入库 import os import pandas…

Leave a Comment

增强视频基础模型的任务特异性适应性:引入视频适配器作为概率框架,用于适应文本到视频模型

基于互联网规模数据训练的大型文本到视频模型展现出了从任意编写描述生成高保真电影的非凡能力。然而,微调预训练的巨型模型可能代价高昂,难以将这些模型适应于具有有限领域特定数据的应用,例如动画或机器人视频。Google DeepMind、加州大学伯克利分校、麻省理工学院和艾伯塔大学的研究人员探索了如何在不进行微调的情况下自定义大型预训练文本到视频模型以适应各种下游领域和任务,灵感来自于一个小型可修改组件(如提示、前缀微调)如何使大型语言模型能够执行新任务而不需要访问模型权重。为了解决这个问题,他们提出了Video Adapter,一种通过使用大型预训练视频扩散模型的得分函数作为先验概率来生成特定任务的微小视频模型的方法。实验表明,Video Adapter可以使用预训练模型的参数仅占1.25%,以包含广泛的知识并在特定任务的微小视频模型中保持高保真度。可以使用Video Adapter生成高质量的特定任务的电影,包括但不限于动画、自我中心建模以及模拟和真实世界机器人数据的建模。 研究人员在各种视频创作工作中测试了Video Adapter。在困难的Ego4D数据和机器人Bridge数据上,Video Adapter生成的视频比高质量的预训练大型视频模型具有更好的FVD和Inception Scores,同时使用的参数少达80倍。研究人员定性地证明了Video Adapter可以生成类别特定的视频,如科幻电影和动画电影。此外,研究的作者展示了Video Adapter如何通过建模真实和模拟机器人电影并允许个性化风格化来为弥合机器人的臭名昭着的模拟到实际差距铺平道路。 主要特点 为了实现高质量且多功能的视频合成而无需在预训练模型上进行梯度更新,Video Adapter在采样时将预训练文本到视频模型的分数与领域特定微小模型的分数(仅使用1%参数)组合。 使用Video Adapter可以轻松地将预训练视频模型适应于人类和机器人数据的电影。 在相同的TPU小时数下,Video Adapter获得的FVD、FID和Inception Scores高于预训练模型和特定任务模型。 Video Adapter的潜在用途范围从动漫制作到领域随机化,以弥合机器人中的模拟现实差距。 与从互联网数据预训练的巨型视频模型相反,Video Adapter需要训练具有数量级更少参数的微小领域特定文本到视频模型。Video Adapter通过在采样期间组成预训练和领域特定视频模型的分数来实现高质量和可适应的视频合成。 使用Video…

Leave a Comment

最佳 AI Shopify 应用程序(2023年)

如果你在经营一个 Shopify 的在线商店,要想保持领先可谓是十分困难的。在一个不断有最尖端的技术和以人工智能为驱动的商店功能被推出的时代,很难判断哪些部分能够为你的 Shopify 网站提供所需的优势。 好消息是,许多 Shopify 应用程序利用人工智能为你提供个性化支持、基于大数据的决策、机器学习模型、算法等等。 以下是一些值得检查的应用程序: Dialogue AI Automatic Personalization  Shopify 的 Dialogue AI Automatic Personalization 旨在提高平台用户的平均订单价值、平均会话持续时间和转化率。它借助人工智能分析客户的在线活动,分析客户的偏好。Dialogue AI 提供相关和互补的商品推荐,以提高订单的平均价值。它会自动生成高利润产品的横幅,以取悦客户并增加销量。你可以使用它制作“如何”视频,向客户展示你的商品如何解决他们的问题。你所要做的就是创建视频、上传内容,让工具把它们放在潜在客户可以快速找到的地方。Dialogue AI 的自动个性化与各种平台和应用程序兼容。 Suggestr…

Leave a Comment

ChatGPT也能设计机器人吗?探索大型语言模型与人工智能协作在机器人设计中的交叉点-社会影响及更多

在最近发表在《自然机器智能》杂志的一项研究中,荷兰科技大学和瑞士洛桑联邦理工学院的研究人员深入探讨了OpenAI的ChatGPT平台的能力。好奇心促使他们调查这种先进的语言模型是否可以扩展其范围,超越生成诗歌、论文和书籍,协助机器人的设计过程。该团队试图确定在此方式下与人工智能合作的优势和潜在风险。 TU Delft的助理教授Cosimo Della Santina,与来自EPFL的博士生Francesco Stella和Josie Hughes,与ChatGPT展开了对话,重点关注粮食供应的增强。他们共同的头脑风暴会议使他们构思出了番茄收获机器人的想法,这是一个真正有用的创造。 研究人员发现ChatGPT在概念阶段的贡献尤为宝贵,因为它扩展了他们的专业知识。Stella解释说,这种语言模型提供了哪种作物对自动化最具经济可行性的见解。ChatGPT与之交互为设计过程中的明智决策铺平了道路。 此外,在实施阶段,ChatGPT提供了有用的建议,引导研究人员使用硅胶或橡胶作为夹具,以防止番茄被压碎。AI模型还建议采用Dynamixel电机,这是驱动机器人的最佳解决方案。这些协作努力最终导致了一个能够有效收获番茄的机械臂。 虽然研究人员发现协作设计过程丰富而积极,但他们注意到了自己作为工程师角色的变化。他们开始花更多时间进行技术任务,而ChatGPT则承担了共同研究员的角色。该团队探讨了人类和大型语言模型(LLMs)之间不同程度的合作,ChatGPT是其中之一的例子。 在最极端的情况下,AI提供所有输入,人类仅仅是遵循其指导,LLM实际上扮演研究员和工程师的角色。相反,人类则承担管理角色,负责定义设计目标。然而,这种情况在当前的LLMs中尚不可行,其可取性仍然存在争议。 Della Santina提出的一个潜在问题是机器人领域的错误信息和偏见的风险。LLMs基于概率生成响应,如果没有验证或验证不当,可能会导致误导或不准确的信息。研究人员还承认与LLMs合作的重要问题,包括抄袭、可追溯性和知识产权。 通过这种合作开发的番茄收获机器人将成为Della Santina、Stella和Hughes进一步研究机器人领域的有价值工具。此外,他们打算探索AI模型在设计其机器人身体方面的自主性。该团队认为,未来的一个开放性问题在于确定LLMs如何在不妨碍创造性思维和创新的情况下协助机器人开发人员解决21世纪的挑战。 随着研究人员继续利用像ChatGPT这样的AI模型的力量,他们的发现揭示了协作设计过程所涉及的潜在利益和风险。LLMs增强人类专业知识和扩大知识范围的能力是不可否认的。然而,必须谨慎行事,以确保准确性、透明度和保护机器人领域的创造性思维。通过在人类智慧和AI协助之间取得平衡,机器人领域可以应对未来的挑战,同时最小化潜在的风险。

Leave a Comment

前20个数据可视化实例

介绍 你一定听说过著名的说法,“一幅图胜过千言万语。”你是否曾经想过为什么呢?因为它们可以在不说任何话的情况下表达很多东西。在今天的数据驱动世界中,这句话比以往任何时候都更有价值。数据可视化是一门艺术,超越了数字和统计,为数据赋予生命,并将其转化为引人入胜的视觉故事。数据中隐藏的故事由一系列色调、形式和模式揭示,其中每个组件都和谐舞蹈。在我们数字化的时代,它作为清晰的灯塔,引导我们穿越复杂性,优雅地和精确地揭示洞见。 所以,让我们一起探索数据可视化的世界,把数据转化为艺术作品,通过每一个出色的视觉决策揭示知识。 什么是数据可视化? 数据和信息的图形表示被称为数据可视化。将非结构化数据转换为像地图、图表、图形和信息图表等可视化表示形式,帮助用户理解数据的模式、趋势和关系。 使用数据可视化进行分析和沟通的好处 通过利用图形组件、图表和交互特性,数据可视化在分析和沟通方面提供了许多优势。 可视化表示使人们更容易快速理解复杂的数据集。 可视化使人们能够发现在分析大量原始数据时可能被忽视的模式、趋势和相关性。 用户可以通过仪表板和信息图表等可视化表示形式更好地理解机会和潜在风险。 可视化使利益相关者更容易参与,并在一小部分时间内传达所有信息,而不是花费时间阅读整个统计摘要报告。 数据可视化的类型 有许多数据可视化,包括图表、图形、饼图、散点图、气泡图、直方图等。我们将在以下部分简要介绍它们。 选择适合数据的正确可视化 选择适合数据的可视化对于有效传达见解至关重要。选择可视化时考虑以下因素: 数据类型:确定您的数据是数值、分类、时间还是空间。不同的数据类型更适合特定的可视化风格。 分析目标:考虑您的研究目标。您是想展示对比、趋势、分布还是关系?不同的可视化技术在不同的领域中成功。 故事需求:考虑您想要您的数据讲述的故事。 了解您的目标受众和可视化将呈现的环境。选择适合他们的经验水平和熟悉程度的格式。 图表和图形 条形和柱形图 条形和柱形图通常比较分类数据或显示频率分布。例如,条形图可用于比较零售店不同产品的销售业绩,或显示服务的客户反馈评级分布。 线形和面积图 线形图显示由线连接的数据点,直观地表示一个特定时期的进展和波动。例如,线形图可以说明一家公司多年来的销售增长,而面积图可以显示特定行业不同竞争对手的市场份额。 饼图和环形图…

Leave a Comment

麻省理工学院的研究人员提出了一种新的多模式技术,将机器学习方法融合在一起,以更类似于人类的方式进行学习

人工智能在我们日常遇到的所有主要用例和应用中都是革命性的。其中一个领域围绕着大量的音频和视觉媒体。想想所有能够生成有趣视频、艺术性惊人的图像、复制名人声音或只需一键记录整个讲座的人工智能应用程序。所有这些模型都需要大量的数据进行训练。大多数成功的系统都依赖于带注释的数据集来自我教育。 最大的挑战是存储和注释此数据,并将其转换为模型可以摄入的可用数据点。说起来容易做起来难,公司需要帮助每年收集并创建金标准数据点。 现在,来自麻省理工学院、麻省理工-IBM沃森人工智能实验室、IBM研究和其他机构的研究人员已经开发出一种能够有效解决这些问题的开创性技术,即分析未标记的音频和视觉数据。这种模型具有很大的潜力和潜力,可以改善当前模型的训练方式。这种方法与许多模型共鸣,例如语音识别模型、转录和音频创建引擎以及对象检测。它结合了两种自我监督学习体系结构:对比学习和遮蔽数据建模。这种方法遵循一个基本思想:复制人类如何感知和理解世界,然后复制相同的行为。 正如麻省理工学院的博士后Yuan Gong所解释的那样,自我监督学习非常重要,因为如果你看看人类如何收集和学习数据,其中很大一部分是没有直接监督的。目标是在机器中实现相同的过程,使它们能够从未标记的数据中学习尽可能多的功能。这种训练成为可以利用和改进的强大基础,具体取决于用例的监督学习或强化学习。 这里使用的技术是对比音频 – 视觉遮蔽自编码器(CAV-MAE),它使用神经网络从音频和视觉数据中提取和映射有意义的潜在表示。这些模型可以在10秒YouTube剪辑的大型数据集上进行训练,利用音频和视频组件。研究人员声称,CAV-MAE比任何其他先前方法都要好得多,因为它明确强调了音频和视觉数据之间的关联,而其他方法则没有。 CAV-MAE方法包括两种方法:遮蔽数据建模和对比学习。遮蔽数据建模包括: 获取视频及其匹配的音频波形。 将音频转换为频谱图。 遮蔽75%的音频和视频数据。 然后,该模型通过联合编码器/解码器恢复缺失的数据。重建损失,即衡量重建预测和原始音频-视觉组合之间差异的损失,用于训练模型。这种方法的主要目的是将相似的表示映射到彼此靠近的位置。它通过关联音频和视频数据的相关部分来实现,例如连接口部的口型。 将基于CAV-MAE的模型与其他模型进行测试证明非常有启发性。测试是在音频视频检索和音频-视觉分类任务上进行的。结果表明,对比学习和遮蔽数据建模是互补的方法。 CAV-MAE在事件分类方面优于以前的技术,并保持与使用行业级计算资源训练的模型竞争力。此外,多模态数据显着提高了单模态表示的微调和音频事件分类任务的性能。 麻省理工学院的研究人员认为,CAV-MAE代表了自我监督音频-视觉学习进展的突破。他们设想,它的用例可以涵盖动作识别,包括运动、教育、娱乐、摩托车和公共安全,跨语言自动语音识别和音频-视频生成。虽然当前的方法侧重于音频-视觉数据,但研究人员的目标是将其扩展到其他模态,认识到人类感知涉及音频和视觉提示以外的多种感官。 很有意思看到这种方法随着时间的推移表现如何,并且有多少现有模型尝试纳入这种技术。 研究人员希望随着机器学习的进步,像CAV-MAE这样的技术将变得越来越有价值,使模型能够更好地理解和解释世界。

Leave a Comment

使用GraphStorm快速处理大规模企业图的机器学习:一种新的解决方案

我们很高兴地宣布,GraphStorm 0.1已经正式开源发布它是一个低代码企业级图机器学习(ML)框架,可在数天内构建、训练和部署复杂的企业级图形ML解决方案,而非数月使用GraphStorm,您可以构建直接考虑数十亿之间的关系或交互结构的解决方案

Leave a Comment

会议必备的顶级日历工具(2023)

日历,特别是谷歌日历,既有积极的方面,也有消极的方面。例如,它们可以帮助计划聚会,跟踪个人任务所花费的时间,甚至与朋友保持联系。然而,我们的日程表很容易快速失控。仅凭每周日历上一大堆蓝色复选框来安排行程可能非常让人恼火,这就是我们在这里汇集的原因:分享我们发现的最佳日历资源。 当你考虑到现在美国人平均花费15%到50%的时间在会议上时,很容易看出为什么安排日程可能会成为一场噩梦。以下是一些可以帮助您按时完成更多工作的最佳应用程序。我们的一些首选如下: Calendly Calendly 是默认的会议调度程序,有很好的理由。它使用简单可靠,安装默认包含的工具超出您所需的。Calendly 用户可以通过创建预订页面来“设置并忘记”,在邀请人可以从各种会议格式中选择,查看您的可用性并与您安排会议。这是对于那些收到很多会议请求并希望快速明确地回复的人来说是完美的工具。 Calendar Calendar 是一个完整的日历工具,而不仅仅是一个会议组织者。界面高度类似于 Google 日历,并提供在线和移动格式。它也是一个会议调度程序,因此您可以设置您的预订时间段并向他人发送链接。与将其优秀的约会制作功能锁定在付费墙后面的 Google 不同,Calendar 为您提供所有免费功能。使用免费计划,您可以将应用程序链接到现有日历服务之一,并创建最多两个完全可自定义的安排时间段。 Hive Hive 是一款将您的日历与项目管理数据结合在一个方便的位置的应用程序。Hive 的日历视图可以帮助监控具有严格截止日期的项目。该功能提供了对任何任务的灵活视图。根据您的需要,可以以多种不同的格式显示您的日历。Hive Calendar 还有助于进行高效的会议运作。将您的日历与 Hive 同步可以轻松记录谁将参加会议以及其他相关详细信息。通过将其连接到您的 Google 或 Microsoft…

Leave a Comment

小猪AI新闻,6月7日:ChatGPT为数据科学面试备忘单提供支持 • 面向特定数据角色的编程语言

ChatGPT 数据科学面试备忘单 • 面向特定数据角色的编程语言 • 数据科学家的 10 个 Jupyter Notebook 技巧和窍门 • 用 PandasGUI 革新数据分析 • OpenAI 的 Whisper API 用于转录和翻译

Leave a Comment

Google Bard的最新进展提高了逻辑和推理能力

在一个令人兴奋的突破中,由Google开发的语言模型Bard在其逻辑和推理能力方面正在迈出重要的一步。通过一种名为隐式代码执行的革命性技术,Bard正在提高其在数学任务、编码问题和字符串操作方面的熟练度。此外,Bard还推出了一个新的导出功能,允许用户将生成的表格无缝地转移到Google Sheets。Bard的最新进展遵循系统1和系统2思维的概念,这使得所有这些都成为可能。让我们探讨一下这些进展如何转变Bard的解决问题的能力。 还可阅读:Google AI的DIDACT永久性地改变了软件开发 Bard的演进:数学任务和编码问题 通过隐式代码执行的整合,Bard已经在数学任务和编码问题方面释放出了其潜力。这种开创性的技术使Bard能够识别计算提示并在后台执行代码,从而获得更准确的响应。将其自然语言处理的能力与逻辑代码执行相结合,Bard增强了处理复杂问题解决场景的能力。 简化数据管理:导出到Google Sheets Bard向用户需求响应推出了一个新的导出操作,当Bard作为其响应的一部分生成表格时,用户可以直接将其无缝导出到Google Sheets。这个功能简化了数据管理,使用户能够轻松地组织和分析信息。这使得Bard在各个领域成为了更有价值的工具。 还可阅读:Google Sheets的前5个人工智能工具 系统的结合:利用系统1和系统2思维 从人类智能的二分法中汲取灵感,Bard的进步与心理学家丹尼尔·卡尼曼所描述的“系统1”和“系统2”思维的概念相一致。系统1代表快速、直觉和不费力的思维,而系统2则代表缓慢、深思熟虑和费力的推理。像Bard这样的传统语言模型运行在系统1之下,产生快速但肤浅的响应。为了增强推理和逻辑能力,Bard现在融入了系统2思维的元素。 语言和代码的交响曲:隐式代码执行 通过融合大型语言模型(系统1)的优势和传统代码(系统2)的力量,Bard在响应准确性方面经历了一次变革性的升级。利用隐式代码执行,Bard检测到需要逻辑代码的提示,后台执行它,并使用结果生成更精确和有洞察力的响应。内部挑战数据集已经证明,在基于计算的单词和数学问题的准确性方面,计算机的准确性提高了约30%。 还可阅读:Google向Google Colaboratory添加了AI编码机器人Codey 接受限制:Bard的持续增长 虽然这些进展标志着重大的进步,但Bard承认完美并不保证。可能存在Bard不为提示响应生成代码、生成不正确的代码或从其响应中排除执行的代码的情况。尽管如此,这些增强功能代表了Bard成为更可靠和有用的工具的重大步伐,为寻求结构化、逻辑驱动的解决方案的用户提供了更全面和准确的体验。 还可阅读:Google I/O 2023中发生的所有事情? 我们的观点 通过隐式代码执行和增强的推理能力,Bard已经准备好更精确地处理数学任务、编码问题和字符串操作。通过将语言模型和传统代码的优势结合起来,Bard为问题解决开辟了新的可能性,并为用户提供了更全面和准确的体验。随着Bard的不断发展,它为AI动力工具的进一步发展奠定了基础。它为未来应用中的语言和逻辑的无缝集成铺平了道路。

Leave a Comment

了解PassGPT:一种基于密码泄漏训练的LLM,用于密码生成

尽管现在有越来越多的替代技术,但密码仍然是首选的身份验证方法,这主要是因为密码易于使用和记忆。此外,大多数程序在其他安全措施无法生效时使用密码作为备用计划。密码泄露是组织(和个人)面临的最大风险之一,因为它们非常常见。密码泄漏不仅可以为黑客提供访问系统的权限,还可以让研究人员寻找用户生成密码中隐藏的模式,这些模式可能用于开发和改进密码破解工具。 机器学习(ML)在从大规模密码泄露中提取和学习重要特征方面发挥了(并将继续发挥)重要作用,主要对两个主要领域的研究做出了实质性贡献:(1)密码猜测和(2)密码强度估算算法。同时,一类称为大型语言模型(LLMs)的ML模型在处理和理解自然语言(NLU)方面非常成功。基于Transformer架构的GPT模型、PaLM和LLaMA是这些模型的一些著名示例。 鉴于它们以前的成就,他们问:LLMs能够多好地识别人类生成密码复杂性中隐藏的基本特征和提示?瑞士苏黎世联邦理工学院、瑞士数据科学中心和纽约SRI国际的研究人员提供并仔细评估了PassGPT,这是一种基于LLM的密码猜测模型,为此提供了一种解决方案。PassGPT是一种离线密码猜测模型,基于GPT-2架构,可用于密码猜测和密码强度评估。 与以前的深度生成模型相比,PassGPT猜测到了20%更多未知密码,并展现了对独特泄漏的强大概括能力。此外,他们将向量量化添加到PassGPT中以进行改进。PassVQT是结果架构,可以使生成的密码更加复杂。与先前的深度生成模型创建整个密码不同,PassGPT逐渐对每个字符进行抽样,从而引入了有导向的密码创建的不同问题。在这种技术中,使用任意限制来对生成的密码进行抽样,从而确保更详细(字符级)的搜索空间有导向的探索。最后,PassGPT明确表示了密码的概率分布,与GAN不同。 他们展示了密码概率与现代密码强度估算器之间的一致性:PassGPT赋予更强的密码较低的概率。他们还寻找那些虽然被强度估算器认为是“强”的密码,但是通过生成技术很容易猜测的密码。他们展示了PassGPT的密码概率如何用于提高当前强度估算器的准确性。

Leave a Comment

一项新的人工智能研究引入了一种新型增强提示框架用于文本生成

大型语言模型(LLMs)彻底改变了自然语言生成领域。传统的微调方法用于响应下游任务需要访问LLMs的参数,这限制了它们在强大的黑匣子LLMs(如ChatGPT)上的使用,这些LLMs仅提供API。因此,最近的研究重点关注提示技术,通过提供许多任务特定的指示和演示来指导生成结果,证明提示可以显著影响结果,因此需要仔细设计。 虽然提示原则上是一种灵活的方法,但它今天通常使用的方式有些严格。但是在语言学习中并非如此;人们可以通过接受和回应积极和消极的反馈来提高语言技能。  中国东北大学、微软亚洲研究院、微软Azure翻译和NiuTrans研究的一项新研究邀请LLMs重新考虑并学习如何发现其输出中的任何缺陷,以确定决策容量的演变方式。为了在生成之前促进错误识别,他们设计了一种名为“Deliberate then Generate(DTG)”的新提示模板,其中包括指示和可能的输出。  确定候选人是DTG设计的重要部分。使用第二个基准系统的数据是一个简单的选择,因为它的输出通常具有良好的质量,只需要进行小的调整即可有效使用。因此,它无法促进有效的决策。研究人员建议使用与源材料无关的文本,例如随机文本选择或空字符串。由于这种方法成功地触发了LLMs的决策能力,因此DTG可以轻松适应各种文本生产工作,只需要对提示进行轻微修改。从心理学的角度来看,这项工作受到了语言习得的典型案例的启发,该案例在发展语言能力时考虑了负面证据。 团队进行了大量实验,以显示所提出的DTG提示相对于传统提示可靠地增强了GPT3.5(text-DaVinci-003)和GPT4的模型性能。这在七个文本生成任务和20多个数据集中都成立。机器翻译、简化和常识创造只是一些文本生成任务,其中由DTG提示的GPT实现了各种数据集的最先进性能。建议的DTG提示确实允许在生成之前进行决策和错误避免,这一点通过广泛的消融研究和统计误差分析得到证明。 研究人员计划在未来的工作中利用任务特定的领域知识来进一步提高DTG提示的效果。

Leave a Comment