Press "Enter" to skip to content

四海吧 Posts

解锁神经网络中的多样性力量:自适应神经元在图像分类和非线性回归中胜过同质性

神经网络是人工智能中的一种方法,它教会计算机以类似于人脑的方式处理数据。它使用连接的节点或神经元构成的分层结构,类似于人脑。人工神经元被排列成层级结构形成神经网络,用于各种任务,如模式识别、分类、回归等。这些神经元通过在训练过程中改变数字权重和偏差来形成稳固的连接。 尽管这些神经网络取得了进展,但它们也有限制。它们由大量相似类型的神经元组成。这些相同神经元之间的连接数量和强度可以在网络学习过程中发生变化。然而,一旦网络被优化,这些固定的连接定义了其架构和功能,无法改变。 因此,研究人员开发了一种可以提升人工智能能力的方法。它允许人工智能内部审视其结构并微调其神经网络。研究表明,通过多样化激活函数可以克服限制,并使模型能够高效工作。 他们在多样性上对人工智能进行了测试。北卡罗来纳州立大学物理学教授、北卡罗来纳州立大学非线性人工智能实验室主任威廉·迪托表示,他们创建了一个测试系统,其中包含一种非人类智能,即人工智能(AI),以查看人工智能是否会选择多样性而不是缺乏多样性,并且其选择是否会提高人工智能的性能。此外,他表示关键在于允许人工智能内部审视并学习其学习方式。 允许神经元自主学习激活函数的神经网络往往表现出快速多样化,并在图像分类和非线性回归等任务中表现优于同质神经网络。另一方面,迪托的团队赋予了他们的人工智能在其神经网络中自主确定神经元数量、配置和连接强度的能力。这种方法允许创建由网络内的各种神经元类型和连接强度组成的子网络。 迪托表示,他们赋予了人工智能内部审视并决定是否需要修改其神经网络组成的能力。实质上,他们给了它大脑的控制旋钮。因此,它可以解决问题,查看结果,并改变人工神经元的类型和混合直到找到最有利的一种。他将其称为人工智能的元学习。他们的人工智能还可以在多样或同质神经元之间进行选择。他进一步表示,他们发现在每个实例中,人工智能都选择多样性以增强其性能。 研究人员在一个标准的数字分类任务上测试了该系统,并发现该系统的准确性随着神经元数量和多样性的增加而提高。研究人员表示,同质人工智能在数字识别方面的准确率为57%,而元学习的多样性人工智能则达到令人印象深刻的70%准确率。 研究人员表示,未来他们可能会通过调整超参数来优化学习到的多样性,以提高性能。此外,他们将在更广泛的回归和分类任务中应用获得的多样性,使神经网络多样化,并评估其在不同情景下的鲁棒性和性能。

Leave a Comment

微软研究员提出了具有两阶段干预框架的开放词汇负责任视觉综合(ORES)

视觉综合模型由于大规模模型训练的进展而能够产生越来越逼真的视觉效果。鉴于使用合成图片的潜在风险增加,负责任的人工智能变得更加重要,特别是在合成过程中消除特定的视觉元素,如种族主义、性别歧视和裸露。但是,负责任的视觉综合是一个非常困难的任务,原因有两个。首先,合成的图片必须符合管理员的标准,例如不应出现“比尔·盖茨”和“微软创始人”等词语。其次,用户查询的非禁止部分应准确合成,以满足用户的要求。 现有的负责任的视觉综合技术可以分为三个主要类别来解决上述问题:改进输入、改进输出和改进模型。第一种策略是改进输入,集中在对用户查询进行预处理,以符合管理员的要求,例如构建黑名单来过滤不良内容。在开放词汇表的环境中,黑名单很难确保完全消除所有不良内容。第二种方法是改进输出,包括对生成的影片进行后处理,以符合管理员的规则,例如通过识别和删除不适宜的内容来保证输出的适用性。 这种技术很难识别开放词汇的视觉概念,它依赖于在特定概念上进行预训练的过滤模型。第三种策略是改进模型,尝试对整个模型或特定组件进行微调,以理解和满足管理员的要求,提高模型遵循预期准则并提供与指定规则和法规一致的材料的能力。然而,微调数据中的偏见常常对这些技术施加限制,使其难以达到开放词汇表的能力。这就引出了以下问题:管理员如何通过实现开放词汇负责任的视觉综合来有效地禁止创建任意的视觉概念?例如,用户可能要求在图1中生成“微软创始人在酒吧喝酒”的图片。 图1. 开放词汇负责任的视觉综合 根据地理、上下文和使用情况的不同,必须避免使用不适合的视觉概念进行适当的视觉综合。 当管理员将“比尔·盖茨”或“酒精”等概念禁止时,负责任的输出应以类似日常语言表达的方式澄清概念。微软的研究人员基于上述观察提出了一项名为开放词汇负责任的视觉综合(ORES)的新任务,其中视觉综合模型可以避免不明确表示的任意视觉元素,并允许用户输入所需的信息。然后引入了两阶段干预(TIN)结构。它可以通过使用大规模语言模型(LLM)进行可学习的指令重写和通过扩散综合模型进行快速干预来成功合成图片。 在可学习查询的指导下,TIN将特定应用于使用CHATGPT将用户的问题重写为降低风险的查询。在中间综合阶段,TIN通过用降低风险的查询替换用户的查询来干预合成。他们开发了一个基准测试,相关的基线模型,黑名单和负面提示,并提供了一个可公开访问的数据集。他们结合了大规模语言模型和视觉综合模型。据他们所知,他们是首次在开放词汇场景下研究负责任的视觉综合。 在附录中,他们的代码和数据集对所有人都是可访问的。他们作出了以下贡献: • 他们提出了开放词汇负责任的视觉综合(ORES)的可行性,并开发了一个带有适当基线模型的基准测试,建立了一个可公开访问的数据集。 • 作为ORES的成功解决方案,他们提供了两阶段干预(TIN)框架,其中包括 1)通过大规模语言模型(LLM)进行可学习教学的重写 2)通过扩散合成模型进行快速干预的合成 • 研究表明,他们的方法显著降低了不适当模型开发的机会。他们展示了LLM在负责任的视觉合成方面的能力。

Leave a Comment

30+ 人工智能工具适用于创业公司(2023年9月)

工作场所的创造力、分析能力和决策能力都正在被人工智能所革命化。如今,人工智能的能力为企业提供了巨大的机会,可以加速扩张并更好地控制内部流程。人工智能应用广泛,包括自动化和预测分析、个性化和内容开发等。以下是一些最佳的人工智能工具,可以帮助年轻企业取得竞争优势,并加速扩张。 Pecan AI Pecan AI通过自动化预测分析来解决当今的商业挑战:收缩预算、不断上升的成本以及有限的数据科学和人工智能资源。Pecan的低代码预测建模平台提供基于人工智能的预测分析,指导以数据为驱动的决策,帮助企业团队实现目标。 通过直观的低代码界面,分析师可以在几周内建立准确的模型,无需数据科学家。该平台支持预测模型的轻松实施,包括客户流失、转化、生命周期价值、交叉销售/升级预测、需求预测、市场组合建模等。该平台自动化数据准备、特征工程、模型构建、部署和模型监控。 与通用平台不同,Pecan提供针对特定业务问题的可行性预测。个体级别的预测提供了细致的洞察,并与流行的商业智能界面和业务系统集成。请访问pecan.ai了解更多信息并注册免费试用或导览。 Hostinger AI网站构建器 Hostinger提供了最佳的AI网站构建器,适合所有希望建立自己网站的人,包括初创企业所有者。凭借其用户友好的界面,无论是初学者还是专家都可以使用人工智能创建一个独特的在线平台。该构建器还配备了SEO工具和电子商务功能,让您进一步优化您的网站。 AdCreative.ai 通过AdCreative.ai,提升您的广告和社交媒体能力-这是终极的人工智能解决方案。告别几小时的创意工作,欢迎高转化的广告和社交媒体帖子,仅需几秒钟即可生成。立即通过AdCreative.ai实现最大的成功,最小的努力。 SaneBox SaneBox的强大人工智能可以自动为您组织电子邮件,其他智能工具确保您的电子邮件习惯比您想象的更高效。立即使用SaneBox将混乱变为有序。 DALL·E 2 OpenAI的DALLE 2是一种尖端的人工智能艺术生成器,可以通过单一文本输入创建独特且有创意的视觉效果。其人工智能模型是通过大量图像和文本描述的数据集进行训练的,以响应书面请求生成详细且具有视觉吸引力的图像。初创企业可以使用DALLE 2在广告、网站和社交媒体页面上创建图像。由于可以通过文本生成不同的图像,企业可以节省时间和金钱,无需手动获取或创建图形。 Otter AI Otter.AI利用人工智能技术,为用户提供实时的会议记录转录,这些记录可以共享、搜索、访问和保护。获得一个会议助手,可以记录音频、撰写笔记、自动捕捉幻灯片并生成摘要。 Notion Notion通过利用其先进的人工智能技术,旨在增加其用户群。他们的最新功能Notion AI是一个强大的生成式人工智能工具,可以帮助用户进行笔记摘要、识别会议中的行动项以及创建和修改文本等任务。Notion…

Leave a Comment

提升生成式人工智能体验:Amazon SageMaker 托管中引入流媒体支持

我们很高兴地宣布,通过Amazon SageMaker实时推理,响应流式传输已经可用现在,当使用SageMaker实时推理构建生成式AI应用程序(如聊天机器人、虚拟助手和音乐生成器)时,您可以连续地将推理响应流返回给客户端,以帮助您构建交互式体验通过这个新功能,您可以在可用时立即开始流式传输响应,而不是等待整个响应生成这降低了生成式AI应用程序的首字节响应时间在本文中,我们将展示如何使用SageMaker实时终端节点和新的响应流式传输功能为交互式聊天用例构建流式网络应用程序我们在示例演示应用程序UI中使用Streamlit

Leave a Comment

Google AI推出WeatherBench 2:用于评估和比较各种天气预报模型的机器学习框架

近年来,机器学习(ML)在天气预报中的应用越来越多。现在,ML模型在准确性方面可以与基于物理的运算模型相媲美,有希望这一进展很快能够提高全球天气预报的精度。采用客观和确定的评估指标对新方法进行开放和可重现的评估对实现这一目标至关重要。 Google、Deepmind和欧洲中心VoAGI-Range Weather Forecasts最近的研究提出了WeatherBench 2,这是一种用于天气预测模型的基准和比较框架。除了对用于训练大多数ML模型的ERA5数据集进行彻底复制外,WeatherBench 2还具有开源的评估代码和公开可用的云优化的基准和基线数据集。 目前,WeatherBench 2针对全球VoAGI范围(1-15天)的预测进行了优化。研究人员计划在不久的将来考虑将评估和基线纳入更多工作,例如现在预报和短期(0-24小时)和长期(15+天)预测。 天气预报的准确性很难用简单的得分来评估。对于某个用户来说,平均温度可能比风阵的频率和严重程度更重要。因此,WeatherBench 2包括了许多指标。为了与气象机构和世界气象组织进行标准评估一致,定义了几个重要的标准指标来总结该研究。 WeatherBench 2.0(WB2)是基于数据驱动的全球天气预报的黄金标准。它受到了自第一个WeatherBench基准发布以来出现的所有新AI技术的启发。WB2的构建目标是尽可能接近许多气象中心使用的操作预报评估。它还为将实验方法与这些操作标准进行比较提供了坚实的基础。 通过公开提供评估代码和数据,目标是促进高效的机器学习操作并确保可重现的研究结果。研究人员相信,根据社区的需求,可以在WB2中增加更多的指标和基线。该论文已经暗示了几个潜在的扩展,包括更多关注在细尺度上评估极端事件和影响变量,也许通过站点观测。

Leave a Comment

美国对某些中东国家实施了对NVIDIA芯片的出口限制

美国政府最近宣布了一套新的出口限制措施,针对特定的NVIDIA芯片对中东某些国家实施限制此举旨在控制可能被用于未经授权的军事应用的先进技术的传播鉴于NVIDIA在人工智能和机器学习技术方面的领导地位,这些技术[…]

Leave a Comment

这篇人工智能论文通过各种深度学习和机器学习算法,识别了行为和生理智能手机认证中的流行动态及其性能

多年来,移动设备在功能和受欢迎程度方面取得了显著进展,而安全措施却没有跟上。智能手机现在储存了大量敏感信息,安全问题成为了一个紧迫的关注点。研究人员一直在探索行为和生理生物特征识别技术以增强移动设备的安全性。这些方法利用了唯一的用户特征,如打字模式和面部特征。结合机器学习和深度学习算法已经显示出增强安全性的潜力。继续研究这些方法以增强移动设备在实际情境中的安全性非常重要。 在这个背景下,一支来自美国的研究团队发表了一篇新文章,以解决移动设备安全领域日益增长的差距。该论文旨在全面评估基于行为和生理生物特征的身份认证方法在增强智能手机安全性方面的表现。它基于该领域的先前研究,并确定了身份认证动态的趋势。此外,该研究强调,将深度学习特征与深度学习/机器学习分类相结合的混合方案可以显著提高身份认证性能。 随着该研究深入探讨移动设备安全的这些关键方面,它将其调查集中在以下主要问题上:“对于移动设备来说,最有效的生物特征身份认证方法是什么?哪些机器学习和深度学习算法与这些生物特征方法最搭配?”作者得出结论,他们对深度学习(DL)和机器学习(ML)算法在生物特征身份认证领域的广泛研究产生了重要的见解。他们发现仔细选择算法显著影响身份认证性能,卷积神经网络(CNN)和循环神经网络(RNN)在处理生理和行为动力学方面表现出色。CNN在处理生理数据(如面部和指纹身份认证)方面表现优异,而RNN在处理击键动力学方面发挥了重要作用。支持向量机(SVM)是行为生物特征分类的一个强有力的选择,尤其是在触摸、运动和击键动力学方面。该研究还注意到了混合身份认证系统的不断采用,其中算法如CNN用于特征提取。这些混合方法,如CNN + LSTM用于步态动力学和CNN + SVM用于面部认证,在各种情境下显示出提高身份认证性能的潜力。 最后,该论文还强调了所审查的研究中的一些局限性: 1. 小数据集:许多研究使用小数据集,这可能影响生物特征身份认证模型的质量和普适性,特别是对于需要更大数据量的深度学习模型来说。 2. 缺乏安全测试:许多研究没有对其模型进行各种安全攻击的测试,这可能使身份认证方法易受攻击。 3. 受限情境:一些研究在用户遵循严格指示的受限情境下收集和测试数据。这可能限制模型的实际应用性,因为它没有考虑到人们使用设备的变化性。 解决这些局限性对于推进生物特征移动身份认证方法的实用性和安全性至关重要。 总之,这项调查提供了对移动生物特征身份认证的全面了解。它突出了深度学习算法的有效性,尤其是CNN和RNN在行为和生理身份认证中的应用。混合模型,如CNN + SVM,展示了提高性能的潜力。根据论文的作者,未来的研究应该专注于DL算法,扩展高质量的数据集,并确保现实测试情境,以充分发挥移动生物特征身份认证的潜力。

Leave a Comment