Press "Enter" to skip to content

40 search results for "New Scientist"

伦理与社会通讯第5期:“拥抱脸”走进华盛顿及其他2023年夏日的思考

关于AI中“伦理”最重要的一点是它与价值观有关。伦理不告诉你什么是对的或错的,它提供了一个价值观的词汇表,透明度、安全性、公正性,并提供了优先考虑它们的框架。今年夏天,我们能够将我们对AI中的价值观的理解带给欧盟、英国和美国的立法者,帮助塑造AI监管的未来。这就是伦理的闪光之处:在还没有法律制定的情况下帮助开辟前进道路。 符合Hugging Face对开放和问责的核心价值观,我们在这里分享了我们所说和所做的一些内容。其中包括我们CEO克莱姆在美国国会作证和美国参议院AI洞察论坛上的发言;我们对欧盟AI法案的建议;我们对NTIA关于AI问责的意见;以及我们首席伦理科学家梅格在民主党代表团的意见。在许多这些讨论中,经常出现的问题是为什么AI中的开放性是有益的,我们在这里分享了我们对这个问题的回答的一些内容here。 顺应我们的核心价值观民主化,我们也花了很多时间公开演讲,并有幸与记者进行交流,以帮助解释目前AI领域的情况。这包括: 莎夏在AI的能源使用和碳排放方面的评论(The Atlantic,The Guardian,两次,New Scientist,The Weather Network,华尔街日报,两次),以及参与了华尔街日报关于这一主题的发表的一部分;对AI末日风险的看法(Bloomberg,The Times,Futurism,Sky News);关于生成AI中的偏见的详细信息(Bloomberg,NBC,Vox);解释边缘化工人如何为AI创建数据(The Globe and Mail,The Atlantic);强调AI中的性别歧视(VICE);以及在MIT Technology Review上就AI文本检测、开放模型发布和AI透明度发表见解。 内森就语言模型和开放发佈的最新进展发表评论(WIRED,VentureBeat,Business Insider,Fortune)。 梅格就AI和虚假信息发表评论(CNN,半岛电视台,纽约时报);关于在AI中公平处理艺术家作品的需要(华盛顿邮报);生成AI的进展及其与更大利益的关系(华盛顿邮报,VentureBeat);通过报告解释记者如何更好地塑造AI的发展(CJR);以及解释AI中的基本统计概念困惑度(Ars Technica);并强调性别歧视的模式(Fast Company)。 艾琳就理解AI的监管环境发表评论(MIT Technology…

Leave a Comment

使用 QLoRA 对 Llama 2 进行微调,并在 Amazon SageMaker 上部署,配备 AWS Inferentia2

在这篇文章中,我们展示了使用参数高效微调 (PEFT) 方法对 Llama 2 模型进行微调,并将微调后的模型部署在 AWS Inferentia2 上我们使用 AWS Neuron 软件开发工具包 (SDK) 来访问 AWS Inferentia2 设备,并从其高性能中受益然后,我们使用一个由 […] 提供支持的大型模型推断容器

Leave a Comment

利用实体提取、SQL查询和具有Amazon Bedrock的代理来提升基于RAG的智能文档助手的能力

近年来,由于生成式人工智能(Generative AI)的快速发展,尤其是通过指导微调和强化学习等训练技术引入的大语言模型(LLMs)的性能改善,会话型人工智能(Conversational AI)取得了长足的进步在正确提示的情况下,这些模型可以进行连贯的对话,而无需任何特定任务的训练数据[…]

Leave a Comment

VoAGI新闻,12月6日:GitHub存储库用于掌握机器学习• 5个免费课程,掌握数据工程

本周在VoAGI上:发现来自机器学习课程、训练营、书籍、工具、面试题、备忘单、MLOps平台等的GitHub代码库,以掌握机器学习,保障你梦寐以求的工作 • 数据工程师必须准备和管理数据驱动的整个数据工作流所需的基础设施和工具…

Leave a Comment

15+ AI 开发工具(2023年12月)

GitHub Copilot GitHub Copilot是一种市场领先的人工智能辅助编码助手。作为一个能使开发人员以更高效的方式生成优质代码的工具,Copilot基于OpenAI的Codex语言模型开发。该模型既训练有自然语言理解能力,又有广泛的公共代码数据库,使其能够提供有见地的建议。从完成整行代码和函数到撰写注释,以及辅助调试和安全检查,Copilot为开发人员提供了宝贵的工具。 Amazon CodeWhisperer Amazon的CodeWhisperer是一个基于机器学习的代码生成器,可在Visual Studio和AWS Cloud9等各种IDE中提供实时编码建议。它基于大规模开源代码数据集进行训练,可以提供代码片段到完整功能的建议,自动化重复任务并提升代码质量,是寻求效率和安全性的开发人员的福音。 Notion AI 在Notion工作区中,AI助手Notion可以帮助完成各种与写作相关的任务,包括创造性、修订和概要。它提高了写电子邮件、工作描述和博客文章等任务的速度和质量。Notion AI是一个能够自动化各种写作任务的AI系统,从博客和列表到头脑风暴和创作写作都可以轻松地重新组织和转换AI生成的内容,使用拖放文本编辑器工具。 Stepsize AI Stepsize AI是一个旨在优化团队生产力的协作工具。作为一个项目历史记录和任务管理者,它与Slack、Jira和GitHub等平台集成,以简化更新并消除沟通不畅。其主要特点包括对活动的统一摘要、即时回答问题和强大的数据隐私控制。 Mintlify Mintlify是一个节省时间的工具,可直接在您喜爱的代码编辑器中自动生成代码文档。只需单击一次,Mintlify Writer就可以为您的函数创建结构良好、上下文感知的描述。非常适合开发人员和团队,在生成复杂函数的精确文档方面表现出色,因其高效和准确性而备受赞誉。 Pieces for Developers Pieces for…

Leave a Comment

“Rasa-驱动的 Chatbot:无缝 Confluence 和 Jira 集成指南”

介绍 在近年来,聊天机器人在人工智能的推动下发展成了功能复杂的对话代理工具。本指南深入探讨了构建一个高级的Rasa-powered聊天机器人的过程,该机器人专门针对与Confluence页面和Jira工单相关的用户查询进行了定制。将Confluence和Jira集成起来带来了很多好处,可以简化信息检索,并促进协同工作环境的形成。Confluence有助于协同文档编写,而Jira则是一个强大的项目管理工具。通过创建与这些平台无缝集成的聊天机器人,可以提高可访问性,优化团队进行内容协作和项目管理的效率。 学习目标 在本文中,您将学习到: Rasa项目设置:学习如何启动一个Rasa项目,为高级聊天机器人的开发奠定基础。 NLU意图定义:定义Confluence和Jira查询的特定自然语言理解(NLU)意图,提高聊天机器人的理解能力。 自定义动作开发:创建基于Python的自定义动作,与Confluence和Jira的API进行交互,从而扩展功能。 模型训练和测试:了解模型训练过程,确保聊天机器人的泛化能力,并进行迭代测试以持续改进。 本文是作为数据科学博文的一部分发表的。 基础概念 Rasa Rasa是一个开源的对话人工智能平台,可以帮助开发人员构建强大的上下文感知的聊天机器人。Rasa利用机器学习来理解并响应复杂的用户输入,不仅仅是简单的基于规则的系统。其自然语言处理能力和对话管理工具使得Rasa成为创建智能对话代理的多功能解决方案。 Jira Jira是由Atlassian开发的一款著名的项目管理和问题追踪工具。在敏捷软件开发中被广泛使用,Jira通过组织任务、追踪问题和使团队的工作流程变得更加高效来促进协作。其丰富的功能,如可自定义的工作流和实时协作,有助于在开发团队和项目经理中的广泛使用。Jira的丰富的RESTful API允许与外部工具和应用的无缝集成,实现实时数据交换和自动化。 Confluence Confluence同样是由Atlassian开发的一个协同平台,用于组织内的高效文档编写、知识共享和团队合作。它是一个集中化的空间,供团队创建、共享和协作于内容,使其成为项目文档、会议记录和一般知识管理的重要工具。实时协同编辑可以让多个团队成员同时在同一文档上进行工作。通过Confluence强大的搜索能力,可以高效地找到相关信息。Confluence与Jira等Atlassian产品无缝集成,创造了一个统一的项目管理和文档生态系统。 聊天机器人 聊天机器人已成为现代数字互动的重要组成部分,能够提供即时和个性化的响应。由人工智能驱动,聊天机器人能够解释用户的输入、理解上下文,并提供相关信息或执行操作。从客户支持到流程自动化,聊天机器人改变了企业与用户互动的方式,提高了效率和用户体验。聊天机器人利用自然语言处理来识别用户意图,使其能够以上下文相关和准确的方式响应。在Rasa的上下文中,自定义动作是Python函数,扩展了聊天机器人的功能,使其能够执行除简单意图识别之外的任务。 先决条件 在我们深入开发过程之前,请确保您拥有必要的工具和访问权限: Python和虚拟环境 确保您已安装Python。使用以下命令创建并激活虚拟环境: # 命令提示符(Windows)或终端(macOS/Linux)…

Leave a Comment

ChatGPT的代码解释器:GPT-4高级数据分析用于数据科学家

介绍 ChatGPT是由OpenAI开发的强大语言模型,凭借其理解和对人类输入进行对话回应的能力,席卷了全球。ChatGPT最令人兴奋的特点之一是其能够生成包括Python、Java、JavaScript和C++在内的各种编程语言的代码片段。这个特性使得ChatGPT成为开发人员的热门选择,他们可以通过它快速原型设计或解决问题,而不需要自己编写整个代码库。本文将探讨ChatGPT对数据科学家的高级数据分析代码解释器以及它的工作原理和生成机器学习代码的用途。我们还将讨论使用ChatGPT的一些优点和限制。 学习目标 了解ChatGPT的高级数据分析如何工作以及如何用它生成机器学习代码。 学习如何使用ChatGPT的高级数据分析来为使用Python的数据科学家生成代码片段。 了解ChatGPT的高级数据分析生成机器学习代码的优点和限制。 学习如何使用ChatGPT的高级数据分析设计和实现机器学习模型。 了解如何预处理机器学习数据,包括处理缺失值,编码分类变量,对数据进行归一化和缩放数字特征。 学习如何将数据拆分为训练集和测试集,并使用准确率、精确率、召回率、F1分数、均方误差、绝对误差、R平方值等指标评估机器学习模型的性能。 通过掌握这些学习目标,人们应该了解如何使用ChatGPT的高级数据分析生成机器学习代码并实现各种机器学习算法。他们还应该能够将这些技能应用到现实世界的问题和数据集上,展示他们在使用ChatGPT的高级数据分析处理机器学习任务方面的熟练程度。 本文作为”数据科学博客马拉松”的一部分发表。 ChatGPT的高级数据分析是如何工作的? ChatGPT的高级数据分析基于一种称为Transformer的深度学习模型,该模型经过大量文本数据的训练。Transformer使用自注意机制来理解输入文本的不同部分之间的上下文和关系。当用户输入提示或代码片段时,ChatGPT的模型根据训练数据学到的模式和结构生成响应。 ChatGPT的高级数据分析可以通过利用大量的在线代码来生成代码片段。ChatGPT的模型可以通过分析开源存储库和其他代码源学习各种编程语言的语法、语义和习惯用法。当用户请求生成相关且可行的代码片段时,ChatGPT的模型可以利用这些知识生成代码。 使用ChatGPT生成机器学习代码 机器学习是ChatGPT的高级数据分析最有前景的应用之一。随着深度学习和机器学习应用的兴起,它们越来越成为研究和开发的重要领域。然而,设计和实现这些模型可能复杂且耗时,需要在线性代数、微积分、概率论和计算机科学等方面具备专业知识。 ChatGPT的高级数据分析可以通过生成机器学习代码片段来简化这个过程,用户可以将这些代码片段集成到自己的项目中。例如,用户可以要求ChatGPT生成一个基于提供的以.csv格式输入的加利福尼亚州房价训练数据的线性回归技术的代码片段。ChatGPT的模型可以根据用户的输入生成包含必要导入、数据预处理步骤、模型架构和训练过程的代码片段。 将数据集上传到ChatGPT中的代码解释器,并在下面的提示框中输入。 提示: 使用sklearn对上述数据集执行线性回归,并显示所有步骤的Python代码。数据中的预测变量是median_house_value。 回答: 使用sklearn在“housing.csv”数据集上进行线性回归的步骤,以“median_house_value”作为目标变量,如下所示: 数据探索:加载数据集并快速检查其结构。 数据预处理:处理缺失值,对分类变量进行编码(如果有),并对数值特征进行缩放。 数据拆分:将数据集拆分为训练集和测试集。…

Leave a Comment

亚马逊转录宣布推出一款新的基于语音模型的ASR系统,支持扩展至100多种语言

亚马逊转录是一项完全托管的自动语音识别(ASR)服务,可帮助您将语音转换为文本,并轻松地将其添加到您的应用程序中今天,我们很高兴地宣布推出了一种下一代多十亿参数语音基础模型驱动的系统,将自动语音识别扩展到超过100种语言在本文中,我们将讨论一些相关内容…

Leave a Comment

掌握数据科学战略的艺术:与人工智能领域的先驱Vin Vashishta进行对话

潜入Analytics Vidhya的数据科学转型世界,通过Analytics Vidhya领先数据系列的突破性演讲《以数据为先导》。在这个系列的独家采访中,Analytics Vidhya的CEO Kunal Jain与杰出的人工智能领导者Vin Vashishta进行了一场激动人心的对话。揭示Vin的旅程的秘密,他从技术职位转变为领导职位的战略性转变,分享了宝贵的见解和经验。 与Vin Vashishta,V Squared的创始人兼人工智能顾问对话 让我们开始吧! 关键见解 踏上Vin Vashishta非凡的旅程,从安装个人电脑到成为人工智能战略的开拓者。 揭示他对领导者关键决策的看法:在快速解决方案与数据科学应用的可靠性之间取得平衡。 深入了解Vin在行业趋势爆发前预见行动的独特过程,指导他在不断变化的环境中的战略举措。 探索他的创业起源并见证其多年来的发展,亲身经历了挑战和胜利的第一手账户。 深入了解Vin对商业愿景的重要性的信念,即使对于最新技术的晚期采用者,也为持续成功提供动力。 了解为什么Vin主张技术专家进入不同的领域,强调在快速发展的领域中前进的必要性。 您是如何开始您的数据科学之旅的? 起初,我接受教育以成为土木工程师,追随着我父亲的脚步。然而,我12岁时第一次接触编程对我产生了深远的影响。我被在虚拟环境中创造东西的能力所吸引。大学的第一年我上了一门编程课程,立刻就知道这是我的激情所在。我的注意力转移到了编程上,那大约是在1994-1995年。我的数据科学之旅并不直接。我在90年代的第一次人工智能繁荣周期中毕业。尽管我渴望为微软工作并构建先进的模型,但我一直从事更传统的软件工程角色。我从安装个人电脑一步步升职到建立网站和数据库管理。我的第一份公司工作涉及到在公司内部安装软件和平台,直接与客户合作。这种经历至关重要,因为它教会了我交付软件承诺的重要性。 您在数据科学模型方面早期面临的挑战是什么? 我的第一个数据科学项目是在2012年,那时候我们没有今天这样的库和资源。我使用不同的语言构建模型,包括C、C++和Java,因为由于技术限制我们必须对所有东西进行优化。我们没有现在这样的云基础设施,大规模的数据只有大型公司才能获得。我早期的客户是大型公司,直到2016年才有中小型企业来找我。与这些较小的客户合作使我遇到了现实世界的限制,如预算和时间,这与企业界有所不同。 您是如何从技术角色过渡到战略和领导角色的? 在2012年被解雇后,我迅速将我的副业咨询转变为全职事业,创办了V…

Leave a Comment

“将生成式人工智能和强化学习融合实现自我改进”

介绍 在人工智能不断发展的领域中,两个关键角色联手合作,打开了新的局面:生成式人工智能和强化学习。这些尖端技术有潜力创造自我改进的人工智能系统,使我们离实现机器自主学习和适应的梦想更近了一步。这些工具为能够改进自己的人工智能系统铺平了道路,使得机器能够自主学习和自适应的想法更加接近。 近年来,人工智能在理解人类语言、帮助计算机观察和解释周围世界方面取得了巨大成就。像GPT-3这样的生成式人工智能模型和Deep Q-Networks这样的强化学习算法站在这一进展的前沿。尽管这些技术在单独使用时已经具有了革命性的影响力,但它们的融合打开了人工智能能力的新维度,并将世界的边界推向了更舒适的境地。 学习目标 获取关于强化学习及其算法、奖励结构、强化学习的一般框架和状态-动作策略的必要和深入的知识,以了解代理机构如何做出决策。 探索这两个领域如何共生地结合在一起,以在决策情景中创建更具适应性和智能性的系统。 研究和分析各种案例研究,展示将生成式人工智能与强化学习在医疗保健、自主车辆和内容创作等领域进行整合的有效性和适应性。 熟悉Python库,如TensorFlow、PyTorch、OpenAI’s Gym和Google’s TF-Agents,以在实施这些技术时获得实际的编程经验。 本文作为数据科学博文马拉松的一部分发表。 生成式人工智能:赋予机器创造力 生成式人工智能模型,如OpenAI的GPT-3,旨在生成内容,无论是自然语言、图像还是音乐。这些模型的工作原理是预测在给定上下文中接下来会发生什么。它们已经被用于自动化内容生成和能够模仿人类对话的聊天机器人等方面。生成式人工智能的特点是能够从学习到的模式中创造出新的东西。 强化学习:教会人工智能做出决策 来源–Analytics Vidhya 强化学习(RL)是另一个开创性的领域。它是让人工智能像人类一样通过试错学习的技术。它已经被用于教授人工智能玩复杂的游戏,如Dota 2和围棋。强化学习代理通过接收行为的奖励或惩罚来学习,并利用这些反馈来不断改进。从某种意义上讲,强化学习使人工智能获得了一种自治形式,使其能够在动态环境中做出决策。 强化学习的框架 在本节中,我们将揭示强化学习的关键框架: 行为实体:代理机构 在人工智能和机器学习领域,术语“代理机构”指的是任务是与指定的外部环境进行交互的计算模型。它的主要角色是做出决策和采取行动,以实现既定目标或在一系列步骤中累积最大奖励。 周围的世界:环境 “环境”指的是代理人操作的外部背景或系统。实质上,它构成了超出代理人控制范围但可以观察到的每一个因素。这可以是虚拟游戏界面,也可以是机器人在迷宫中导航的现实世界环境。环境是评估代理人表现的“真实基准”。…

Leave a Comment

出色表现:基于RTX的大型语言模型使用TensorRT-LLM在Windows上提速4倍

生成式人工智能 是个人计算历史上最重要的趋势之一,为游戏、创作、视频、生产力、开发等领域带来了进步。 GeForce RTX 和搭载了专用AI处理器Tensor Cores的NVIDIA RTX GPU,正在原生地将生成式人工智能的能力带到超过1亿台Windows PC和工作站上。 如今,在Windows上通过TensorRT-LLM获得的生成式人工智能速度提高了4倍,该开源库可加速最新的AI大型语言模型(如Llama 2和Code Llama)的推理性能。上个月,TensorRT-LLM发布了适用于数据中心的版本。 NVIDIA还发布了帮助开发者加速LLMs的工具,包括使用TensorRT-LLM优化自定义模型的脚本、经过TensorRT优化的开源模型以及展示LLM响应的速度和质量的开发者参考项目。 现在,通过Automatic1111发布的稳定扩散式混合生成式人工智能在流行的Web UI中提供TensorRT加速,它的速度比之前最快版本快2倍。 此外,RTX Video Super Resolution (VSR) 1.5版本已经作为今天的Game Ready Driver发布的一部分,也将在下个月初发布的NVIDIA Studio Driver中提供。…

Leave a Comment

Can't find what you're looking for? Try refining your search: