四海吧 – Page 30 – 四海之内皆兄弟，四海带你涨姿势

德克萨斯州网络安全与人工智能深度嵌入的网络峰会

Published November 8, 2023 by 四海吧

深入了解我们的德克萨斯州网络峰会2023回顾了解人工智能如何影响网络安全，学习零信任策略，勒索软件的使用与禁忌等等

Leave a Comment

从10月30日到11月5日这个星期的计算机视觉最重要的论文

Published November 8, 2023 by 四海吧

每周，数个顶级学术会议和期刊展示了计算机视觉领域的创新研究，呈现了图像等各个子领域的令人兴奋的突破

Leave a Comment

您可以使用ChatGPT Vision进行数据分析的5种方式

Published November 8, 2023 by 四海吧

通过解释视觉数据，包括数学公式、数据提取、评估结果、仪表板和图表，增强数据分析能力

Leave a Comment

xAI发布PromptIDE：Prompt工程和人工智能AI可见性的新领域

Published November 8, 2023 by 四海吧

在人工智能开发领域取得突破性进展，xAI推出了PromptIDE，这是一款先进的集成开发环境，旨在革新提示工程和机器学习模型的可解释性。这一创新工具对于深入研究备受关注的Grok平台的基础模型Grok-1的工程师和研究人员来说是一个福音。PromptIDE为模型的思维过程提供了一个窗口，使得更深入地理解语言模型如何对提示作出反应以及如何通过优化其输出来提高准确性和相关性成为可能。 PromptIDE的核心是一个Python代码编辑器，配备了一个新发布的SDK，可以实现复杂提示技术的应用。这种强大的组合使得对模型参数的实时探索和操作成为可能。 PromptIDE带来的最重要的改进之一是其丰富的分析套件。通过执行提示，IDE会显示出丰富的信息，如逐标记分解，采样概率，替代标记建议和注意力可视化，使用户能够剖析模型的决策过程。除了这些技术成就之外，PromptIDE还通过提供一些提高用户体验的功能来优先考虑用户。它确保所有提示自动保存，包括版本控制系统以便于跟踪更改，并支持对比研究的分析结果的永久存储。此外，包括文件处理功能意味着用户可以在环境中上传和处理数据，而SDK的并发功能保证了对即使规模庞大的数据集的快速处理。 xAI不仅仅是推出了一个工具，而是在培育一个社区。PromptIDE旨在实现协作，用户可以通过点击按钮分享他们的提示和相关的分析结果。这个功能为共享学习体验和推动提示工程技术的累积发展铺平了道路。目前，PromptIDE仅对xAI早期访问计划的参与者开放，但已经在人工智能界引起了轰动。这将不仅加速Grok的开发，还为基于人工智能的应用提供了更大的透明度和有效性。当我们站在人工智能发展的新时代的边缘时，PromptIDE有望成为塑造我们与机器学习技术互动、理解和管理的未来的关键角色。这是朝着揭示常常隐晦的人工智能过程、体现出xAI对开放和进步承诺的一大步。对早期访问计划感兴趣的人可以期待PromptIDE功能的全面介绍，这将展示出人工智能开发的未来——一个透明、协作和最重要的是可触及的未来。 Announcing the xAI PromptIDE The xAI PromptIDE is an integrated development environment for prompt engineering…

Leave a Comment

OpenAI发布了GPT-4 Turbo，一个可定制的对人工智能未来的巨大飞跃

Published November 8, 2023 by 四海吧

在一个创新快速且革命性的行业中，OpenAI再次推动了人工智能在语言模型领域的潜力，引入了更强大且可定制化的GPT-4 Turbo。在公司的年度DevDay会议上，OpenAI首席执行官Sam Altman展示了这个新模型的能力，它不仅是前一代模型的一个巨大飞跃。GPT-4 Turbo具备更高的精度和更细致的理解能力，在人工智能领域中是一个强大的工具。 GPT-4 Turbo的卓越能力体现在其复杂文本生成上，现在可以轻松处理更复杂的请求。该模型可以生成摘要、撰写邮件，甚至撰写文章，达到人机内容生成之间的无缝衔接。但创新不仅仅停留在性能提升上。OpenAI在个性化方面取得了突破，允许开发者根据特定行业需求或公司声音微调模型。这种可定制化的能力非常重要，它为公司提供了将GPT-4 Turbo无缝集成到他们的运营中，以符合其品牌和运营标准的机会。 GPT-4 Turbo的可定制性还包括对模型输出的控制，提供了额外的安全保障，并与用户意图保持一致。这一功能解决了人工智能开发中的一个关键问题：确保技术始终在道德使用和公共利益的范围内。 GPT-4 Turbo最重要的潜在影响之一是其对可访问性的潜力。Altman强调了该模型能够赋予残疾人士力量的能力，暗示它可以作为一种辅助技术，增强与数字平台的交流和互动。尽管围绕这些进展存在激动人心的氛围，但OpenAI谨慎行事，对部署持有有意识的态度。该公司加强了对安全和负责任的人工智能开发的承诺，确保伴随强大的技术而来的是必要的监督。 GPT-4 Turbo的推出不仅标志着OpenAI的里程碑，也是该行业的一个转型时刻。它预示着一个未来，AI不仅仅是一个工具，它可以成为合作者、创造者和我们在数字进化中要维持的价值观的守护者。核心要点： OpenAI的GPT-4 Turbo是其语言模型的更强大和更细致版本，提供前所未有的文本生成能力。新模型允许广泛定制，开发者可以根据特定行业需求和公司品牌进行调整。 GPT-4 Turbo具备增强的控制功能，以确保输出安全并符合用户意图，解决了人工智能中的道德问题。该模型为提高可访问性提供了可能性，潜在地帮助有残疾的人士。 OpenAI在将更先进和多功能的技术引入市场时继续优先考虑安全和负责任的人工智能部署。这篇文章的首发地址是：OpenAI…

Leave a Comment

OpenAI API — 介绍与ChatGPT背后模型的11个实际实施示例

Published November 8, 2023 by 四海吧

ChatGPT在当今不再需要进一步介绍，在这篇文章中，我们想更深入地了解如何以编程方式与驱动ChatGPT的模型和引擎进行交互（例如，GPT-4…

Leave a Comment

使用Go构建一个REST API：面向时间序列的数据分析

Published November 8, 2023 by 四海吧

这篇文章是关于使用Go语言构建REST API来执行CRUD（创建、读取、更新、删除）操作和计算时间序列数据统计的示例Go是构建…的常见选择

Leave a Comment

LoRA – 直观而全面地解释

Published November 8, 2023 by 四海吧

精调是将机器学习模型调整到特定应用的过程，在实现一致和高质量的性能方面至关重要在本文中，我们将讨论……

Leave a Comment

用JAX和Haiku从零开始实现Transformer编码器 🤖

Published November 8, 2023 by 四海吧

在2017年的开创性论文“注意力就是一切”[0]中引入的Transformer架构，可以说是近年来深度学习史上最具影响力的突破之一，使得…

Leave a Comment

“在部署生成 AI 方面，企业面临的选择：开源模型还是专有模型”

Published November 7, 2023 by 四海吧

据2023年中期的数据，对生成式人工智能的兴趣激增导致该领域涌现出350多家公司[1]，其价值主张囊括了从基础模型到具体应用案例的全部范围这一广度的…

Leave a Comment

揭秘时间序列异常值：1/4

Published November 7, 2023 by 四海吧

这是2019年12月21日在即将到来的大流行病的远离轰鸣声中，一束光照在了米兰的意甲首秀中的一个年轻人身上，他的外貌和动作……

Leave a Comment

这个AI通讯简报就是你需要的一切 #72

Published November 7, 2023 by 四海吧

这周，AI新闻被OpenAI的Devday和许多新模型和功能的发布所主导，这淹没了埃隆·马斯克早些时候加入LLM竞赛并使用xAI的Grok GPT-3类模型的消息

Leave a Comment

探索数据科学职位称谓：数据分析师 vs. 数据科学家 vs. 数据工程师

Published November 7, 2023 by 四海吧

不，它们并不是同样的工作！了解它们不同的职责、技能和使用的工具然后，为自己选择正确的职业道路

Leave a Comment

随着婴儿潮一代退休，德国企业转向机器人

Published November 7, 2023 by 四海吧

随着德国的婴儿潮一代退休，进一步加剧了该国的劳动力短缺问题，许多公司正在用机器人填补工作职位空缺

Leave a Comment

使用牛轧糖提升科学文件处理

Published November 7, 2023 by 四海吧

简介在不断发展的自然语言处理和人工智能领域中，从科学PDF等非结构化数据源中提取有价值的信息变得越来越重要。为了解决这个挑战，Meta AI推出了“Nougat”或称“学术文档的神经光学理解”，这是一种基于Transformer的先进模型，旨在将科学PDF转录成常见的Markdown格式。Nougat出现在Lukas Blecher、Guillem Cucurull、Thomas Scialom和Robert Stojnic的论文《Nougat：学术文档的神经光学理解》中。这为光学字符识别（OCR）技术带来了开创性的转变，而Nougat是Meta AI强大的AI模型中的最新成员。在本文中，我们将探讨Nougat的能力，了解它的架构，并演示使用该模型转录科学文档的实际示例。学习目标了解Meta AI最新的科学文档Transformer模型Nougat。了解Nougat如何借鉴其前身Donut，并引入先进的文档AI方法。学习Nougat，包括其视觉编码器、文本解码器和端到端训练过程。深入了解OCR技术的发展，从ConvNets的早期阶段到Swin架构和自回归解码器的革命性能量。本文作为数据科学博文马拉松的一部分发表。 Nougat的诞生 Nougat并不是Meta AI家族中的第一个Transformer模型。它继承了它的前身“Donut”的理念，展示了以Transformer为基础的模型中视觉编码器和文本解码器的能力。这个概念很简单：将像素数据输入模型，获得文本输出。这种端到端方法消除了复杂的流水线，并证明了注意力就是所需的一切。让我们简要讨论驱动Nougat等模型的“视觉编码器、文本解码器”范式的基本概念。作为Nougat的前身，Donut引入了在单个模型中结合视觉和文本处理的能力。与传统的文档处理流水线不同，这些模型在端到端操作，将原始像素数据转化为文本内容。这种方法利用了Transformer架构的注意力特性来产生结果。 Nougat接过火炬在Donut取得成功的基础上，Meta AI推出了Nougat，将OCR技术推向了一个新的水平。与其前身一样，Nougat采用了基于Swin Transformer的视觉编码器和基于mBART的文本解码器。Nougat从科学PDF的原始像素中预测文本的Markdown形式。这代表了将科学知识转录成熟悉的Markdown格式的重大突破。 Meta…

Leave a Comment

Bard 新的ChatGPT竞争者

Published November 7, 2023 by 四海吧

在不断优化人工智能用户体验的过程中，谷歌推出了巴德(Bard)，其是最新也是最先进的对话系统

Leave a Comment

5个免费的大学数据分析课程

Published November 7, 2023 by 四海吧

想要进入数据分析领域但不知道从何开始？来看看这5个免费的大学数据分析课程吧

Leave a Comment

AI与教育公平：弥合差距的蓝图

Published November 7, 2023 by 四海吧

在理想的世界里，每个人都有同等的机会接受优质教育然而，实际情况与此观点相去甚远与社会经济地位、文化障碍和语言障碍等因素相关的教育地位和质量存在差异尽管我们生活在一个技术和社会前所未有的时代[…]

Leave a Comment

格洛克：埃隆·马斯克旗下的AI聊天机器人

Published November 7, 2023 by 四海吧

深入了解Elon Musk的xAI的Grok，一个带有实时信息检索、幽默和增强推理能力的AI聊天机器人了解关于Grok的技术支持Grok-1，它的培训、评估等等

Leave a Comment

为什么快速工程是一种时尚趋势

Published November 7, 2023 by 四海吧

各种媒体一直在大肆宣扬即时工程，让它看起来像是理想的工作——你不需要学习如何编码，也不需要了解深度学习、数据集等ML概念你会同意，这似乎太……

Leave a Comment

AWS研究人员推出Gemini：在大规模深度学习训练中开创快速故障恢复技术

Published November 7, 2023 by 四海吧

来自莱斯大学和亚马逊网络服务的研究团队开发了一个名为GEMINI的分布式训练系统，旨在改进大型机器学习模型训练中的故障恢复。系统处理了使用CPU内存进行检查点的挑战，从而确保更高的可用性并最小化对训练流量的干扰。GEMINI相对现有解决方案显示出显著改进，使其成为大规模深度学习模型训练的有希望的进展。 GEMINI引入了一种分布式训练系统来改进大型模型训练的恢复过程。以往的解决方案受到带宽和存储限制的限制，这影响了检查点频率和模型准确性，尽管深度学习框架如PyTorch和TensorFlow提供检查点接口。 GEMINI的方法优化了检查点放置和流量调度，使其在这一领域具有重要意义。深度学习模型，特别是大型模型，以其出色的性能而闻名。然而，由于复杂性和时间消耗，大型模型的训练经常需要改进。当前的大型模型训练故障恢复解决方案受到远程存储中带宽有限的限制，这导致了显著的恢复成本。GEMINI引入了创新的CPU内存技术，使快速故障恢复成为可能。 GEMINI用于最优检查点放置策略以最大化恢复概率，并使用流量调度算法以减少干扰。评估是在NVIDIA GPU上进行的，但适用于其他加速器，如AWS Trainium。 GEMINI显着提高了故障恢复能力，超过现有解决方案的13倍。评估结果证实了它在减少时间浪费同时不影响训练吞吐量方面的有效性。 GEMINI的可扩展性在不同的故障频率和训练规模下得到证明，展示了其在大规模分布式训练中的潜力。 GEMINI中的流量交织算法对训练吞吐量产生积极影响，进一步提高系统的效率。现有的大型模型训练故障恢复解决方案受远程存储带宽的限制，无法实现高检查点频率，导致显著浪费时间。该研究侧重于使用固定计算资源的静态和同步训练，忽略了弹性和异步训练方法的考虑。当前研究没有涉及用于存储检查点历史的CPU内存大小的问题，除了故障恢复之外的其他目的。总之，GEMINI是一个高效且可扩展的分布式训练系统，通过将检查点存储到CPU内存和先进的放置策略，提供快速可靠的故障恢复。其高检查点频率有助于减少时间浪费，而不影响训练吞吐量，使其成为在GPU集群上进行大规模分布式训练的绝佳解决方案。

Leave a Comment

计算机视觉的战场：选择你的冠军

Published November 7, 2023 by 四海吧

迁移学习已经改变了计算机视觉，但仍有许多开放问题例如，什么是最好的架构？哪个对于某个任务最好？每篇文章都声称是最先进的…

Leave a Comment

使用A/B测试的端到端实验设计

Published November 7, 2023 by 四海吧

如果你曾经好奇过实验设计和A/B测试，你来对了这篇文章是你设置第一个实验需要的路线图，从定义问题开始…

Leave a Comment

密歇根大学的研究人员在AI的心理理论方面开创了新领域：揭示了心理学分类法和严格的评估协议

Published November 7, 2023 by 四海吧

密歇根大学的一支研究团队提倡开发新的基准和评估协议，评估大型语言模型（LLM）的心智理论（ToM）能力。研究建议采用全面和情境化的评估方法，将机器ToM分为七个心理状态类别。该研究强调了对LLM心智状态的综合评估的必要性，将其视为物理和社交环境中的代理。该研究解决了LLM中缺乏健壮的ToM和改善基准和评估方法的必要性。它指出了现有基准的不足之处，并提出了一种全面的评估方法，其中将LLM视为不同情境中的代理。研究强调了有关机器ToM的持续争论，强调了其限制和对更健壮的评估方法的呼吁。它旨在指导未来在将ToM与LLM整合并改善评估手段方面的研究。对于人类的认知和社交推理来说，ToM是至关重要的，在AI中具有启用社交互动的重要性。研究对Chat-GPT和GPT-4等LLM是否拥有机器ToM提出了质疑，并强调了它们在复杂的社交和信念推理任务中的局限性。需要重新审查现有的评估协议，进行全面调查。它主张采用机器ToM分类和情境化评估方法，将LLM视为真实环境中的代理。该研究引入了一种用于机器ToM的分类方法，并主张采用情境化评估方法评估LLM。文中对现有的基准进行了回顾，并进行了关于感知视角承担的文献调查。以网格世界中的一项试点研究作为概念验证。研究人员强调了谨慎设计基准的重要性，以避免捷径和数据泄漏，并突出了当前基准的局限性，这是由于有限的数据集访问。该方法提出了机器ToM的分类方法，包括七个心智状态类别。它主张采用一种全面的、情境化的评估方法，以全面评估心智状态，并防止捷径和数据泄漏。文中以网格世界中的试点研究作为概念验证。它强调了当前ToM基准的局限性，并强调了开发具有高质量注释和私有评估集的新型可扩展标准的必要性。它建议采用公正的评估实践，并计划制定更全面的标准。总之，该研究强调了在LLM中评估机器ToM的需要。提倡采用全面且情境化的评估方法，将LLM视为真实环境中的代理，并强调了谨慎策划基准的重要性，以防止捷径和数据泄漏。该研究强调了开发具有高质量注释和私有评估集的更大规模基准的重要性，并概述了未来系统基准发展的计划。作为未来的工作，需要开发新的机器ToM基准，以解决未经探索的方面，避免捷径，确保具备高质量注释的可扩展性。应该关注公正的评估，记录提示和提出一种情境化的ToM评估方法，其中模型被视为各种情境中的代理。建议在情境设置中实施复杂的评估协议。尽管承认试点研究的局限性，但计划在未来进行系统的、更大规模的基准研究。

Leave a Comment

Python继承的常见实践和陷阱：菱形问题，混合，和其他

Published November 6, 2023 by 四海吧

继承，就像面向对象编程中的任何其他概念一样，允许开发者重用代码并开发出优雅且可扩展的软件解决方案考虑到庞大的Python社区开发了多种…

Leave a Comment

亚马逊为广告商试点AI动力图像生成工具

Published November 6, 2023 by 四海吧

亚马逊正在进行一项开创性的尝试，将尖端人工智能技术融入其广告和营销工具中，以改革广告商创造营销内容的方式。这一突破性发展使广告商能够将平庸的产品图像和文案材料转化为引人注目的广告视觉内容。电商巨头亚马逊的子公司亚马逊广告透露，他们已经开始试验一种广告图像生成的人工智能工具。该工具承诺将无趣的产品照片变得生动，将其提升为能引起消费者共鸣的动态广告图片。亚马逊今年初委托进行的一项调查揭示了广告商的一个关键痛点：近75%的受访者表示，他们在执行成功的营销活动中面临的主要挑战是如何制作引人入胜的广告创意和选择合适的创意格式。亚马逊的初步测试凸显了这个问题的重要性。例如，在移动设备上通过品牌赞助广告市场同样的烤面包机时，选择将烤面包机呈现在空白背景中还是在厨房环境中呈现，后者的点击率高出40%。团队强调，制作引人入胜和独具个性的广告创意往往需要巨大的成本投入，并可能需要额外的专业知识。为了应对这个挑战，亚马逊推出了一种图像生成的人工智能工具，让各行各业的广告商能够轻松创建引人注目的视觉内容，无需技术专业知识。广告商使用这个工具非常简单。他们在亚马逊广告控制台中选择自己的产品，然后点击“生成”。该工具会自动生成一组带有品牌身份和生活方式元素的精选图片。此外，广告商还可以输入文本提示，进一步定制图像内容。亚马逊广告主要为各类利益相关方提供服务，包括在亚马逊平台注册的卖家、供应商、书商、出版商、程序开发人员和广告代理机构。目前，这个图像生成工具的使用范围仅限于一小部分试点广告商，因为它还处于测试阶段。然而，亚马逊计划在不久的将来扩大其可用性。为了帮助卖家无缝地创建内容，亚马逊还在今年9月引入了一项文本生成服务，可以通过卖家中心访问。这项服务简化了制作引人入胜的产品描述的流程。卖家只需输入几个词或句子来描述他们的产品，系统会自动生成高质量的文本，可以进一步编辑以满足特定需求。亚马逊进军基于人工智能的内容创作领域，标志着广告创意流程向民主化迈出了重要一步。通过提供能利用人工智能力量的直观工具，这家电商巨头将重塑数字广告的格局，使其对各种规模的企业更具可访问性和效果。随着这项技术的不断发展，它有望彻底改变数字领域中产品的营销和销售方式。文章来源：Amazon Pilots AI-Powered Image Generation Tool for Advertisers，首发于MarkTechPost。

Leave a Comment

“‘声音触控’技术如何通过声音提供视觉体验”

Published November 5, 2023 by 四海吧

在一个科技奇迹不断涌现的时代，一项引人注目的突破从澳大利亚研究人员的实验室中浮现出来——声音触控这项开创性的技术承诺重新定义视力障碍人士的辅助设备领域由悉尼科技大学、悉尼大学和…研发的一个勤奋的团队打造

Leave a Comment

在DataRobot和AWS Hackathon 2023中构建一个GenAI CV筛选器

Published November 5, 2023 by 四海吧

本文描述了一种生成式AI简历筛选工具的解决方案，该解决方案使我们在2023年DataRobot和AWS黑客马拉松比赛中获得第三名作为解决方案设计的一部分，需要使用DataRobot和AWS Bedrock

Leave a Comment

微软推出数据公式化器：一种基于概念的可视化创作工具，利用人工智能智能代理解决可视化创作中的数据转换挑战

Published November 5, 2023 by 四海吧

数据可视化以图形或图片形式呈现数据，帮助人们理解数据内的模式、趋势和见解。有效的数据可视化在数据分析中起着至关重要的作用。它使数据分析师能够探索复杂的数据集，理解模式，并向各利益相关者传达有意义的见解。如今，有许多工具可用于创建数据的可视化表示。然而，数据必须转化为整洁的格式才能创建可视化。由于这需要编程经验或单独的数据处理工具，数据转换仍然是可视化工作的一道障碍。这要求一定的编程专业知识或熟悉额外的数据处理工具。它凸显了数据可视化的复杂性，并强调了数据分析师需要更简单、更无缝的流程来创建有效的可视化，无论他们的技术背景如何。因此，研究人员在克服数据可视化障碍方面取得了重要进展。他们在人工智能（AI）和人机交互（HCI）领域的合作努力产生了一种创新工具，称为Data Formulator：一种由人工智能驱动的可视化创作工具，引入了数据表达的开创性范式。 Data Formulator旨在简化复杂的数据可视化过程。与传统方法相比，该工具区分高级可视化概念与数据处理的具体细节。数据分析师将其对可视化的想法描述为“数据概念”——希望看到的特定字段或类别，即使在原始数据中不存在。通过以这种方式表达自己的想法，分析师帮助AI代理理解他们的意思，使代理能够将概念与相关视觉关联起来，以促进可视化过程。意识到分析师可能不清楚自己想要什么，Data Formulator通过展示数据可能的不同可视化方式来协助分析师。它给分析师提供了许多选择，使一切更加透明。不仅如此，Data Formulator还提供给分析师用于更改数据的AI程序和新数据本身。这使得分析师更容易查看所有内容，并使他们的想法在下次改进。由Data Formulator派遣的AI代理将输入数据转换为突出显示这些概念的数据，创建所需的可视化效果。在展示结果时，Data Formulator提供反馈，以帮助作者理解和检查转换后的数据和可视化效果。 Data Formulator基于分析师的输入使用两种不同的方法：基于示例的概念定义和自然语言查询。对于前者，程序合成器生成一个专门的数据重新整形程序，而后者调用语言模型（LLM）生成代码，创建所描述的新数据类别。生成的转换后的数据编译成一个结构化表，与相应的可视化效果一起。除了可视化外，这种方法还可以用于数据清理、整合、探索和故事叙述。理想的AI系统将遵循高级指令，在整个数据分析管道中建议操作，并促进用户与AI代理之间的合作，实现数据可视化目标。研究人员表示，创建能够成功向分析师传达结果的AI工具——即使结果不明确、模糊或不准确——对此合作至关重要。

Leave a Comment

使用Python轻松从头实现多类支持向量机

Published November 5, 2023 by 四海吧

在这个故事中，我们将以软间隔和核方法的形式实施支持向量机学习算法我们将从简要概述支持向量机及其训练开始…

Leave a Comment

四海吧 Posts