Press "Enter" to skip to content

168 search results for "动机"

Google DeepMind发布了一个包含100万条轨迹和一个通用AI模型(RT-X)的开放式X体验,以帮助推动机器人如何学习新技能的进展

在人工智能(AI)和机器学习(ML)领域的最新进展中,大规模学习来自多样化和广泛的数据集的能力已经展示出开发极其有效的AI系统的能力。最好的例子是创建了通用预训练模型,这些模型经常表现优于在较小的、特定任务数据上训练的狭义专门化对应物。与在专门化和受限数据上训练的模型相比,开放性词汇图像分类器和大型语言模型表现出更好的性能。 然而,相对于计算机视觉和自然语言处理(NLP)可以轻松从互联网中获取大数据集的情况,为机器人交互收集可比较的数据集是具有挑战性的。即使在机器人领域最广泛的数据采集计划中,所获得的数据集通常远远小于视觉和NLP基准测试中的数据集以及其多样性。这些数据集通常集中在某些特定地点、物品或任务受限的群体上。 为了克服机器人领域的障碍,并朝着与其他领域的大数据体制类似的方式前进,一组研究人员提出了一种受到在不同数据上对大型视觉或语言模型的预训练达到泛化效果的启发的解决方案。该团队已经发布了他们的Open X-Embodiment(OXE)仓库,其中包括来自21个机构的22种不同机器人实体的数据集,以及用于促进对X-体现模型的进一步研究的开源工具。该数据集涵盖了超过100万个情景的500多种技能和150,000多个任务。主要目的是证明使用来自不同机器人和环境的数据进行学习的策略可以获得正向转移,并且比仅使用来自特定评估设置的数据进行训练的策略表现更好。 研究人员在这个数据集上训练了高容量模型RT-X。他们的研究主要发现是RT-X显示了正向转移。通过利用来自不同机器人平台的学习内容,该模型在这个广泛的数据集上的训练使其能够增强多个机器人的能力。这一发现意味着可以创造出灵活而有效的一般性机器人规则,适用于各种机器人环境。 该团队使用广泛的机器人数据集训练了两个模型。大型视觉语言模型RT-2和高效的基于Transformer的模型RT-1被训练成以7维向量格式表示位置、方向和握持相关数据的机器人动作。这些模型旨在使机器人更容易处理和操作物体。它们还可以在更广泛的机器人应用和场景上实现更好的泛化。 总之,该研究讨论了将预训练模型应用于机器人中的想法,就像自然语言处理和计算机视觉成功地做到了一样。他们的实验结果显示了这些一般性X-机器人策略在机器人操纵语境下的潜在有效性。

Leave a Comment

释放英国的人工智能驱动机遇 释放英国的人工智能驱动机遇

人工智能是人类目前正在研究的最深奥的技术它是解决重大社会问题和改善我们日常生活的关键部分,从应对气候变化到研发新药这项技术的一些早期种子就在英国播下,从英国数学家艾伦·图灵在50年代的工作到谷歌DeepMind今天在蛋白质折叠方面的工作我们的初创企业生态系统、学术机构和数以百万计的数字优先企业充分展示了英国在释放人工智能的经济潜力方面具备的良好条件根据谷歌2023年的经济影响报告,我们希望了解人工智能对英国经济的潜在影响这份由Public First编撰的报告揭示了谷歌的工具(如搜索、地图、Workspace、云、Play和Android)将在今年为英国创造约1180亿英镑的经济价值它还强调,在适当的条件下,AI驱动的创新到2030年时可能为英国经济创造超过4000亿英镑的经济价值以下是报告的一些关键发现概述:提高生产力新的人工智能创新将为英国带来显著的生产力提升总体而言,Public First估计,生成式人工智能可以为英国的普通劳动者每年节省超过100小时的时间,这将是自谷歌搜索问世以来对劳动生产率的最大改进更广泛地说,AI可以为全科医生和教师每年节省超过70万小时的行政工作沉重的工作负荷和过长的工作时间是导致人们离开医疗和教育行业的最重要因素,加剧了人员短缺问题使用人工智能可以帮助缓解诸如卫生和教育等领域不断增加的成本压力,并释放出80多亿英镑的公共部门资源供其他用途使职业更具可获得性人工智能还有可能加速新的辅助技术的发展,这些技术可以帮助超过100万残疾人在工作中发挥作用,每年为经济增加超过300亿英镑的价值根据英国国家统计局的统计数据,英国工作年龄人口中大约五分之一目前有残疾,残疾人就业率约为普通人的三分之二AI生成的字幕等技术可以帮助残疾人重获独立性,与周围世界建立联系,并给他们回归职场的选择,为英国创造经济增长机会开启技能获取之门人工智能可以帮助每个人掌握数字技能,以充分利用数字经济使用AI导师和编码助手可以让每个人更容易提升自己的数字技能,每年为英国的生产力增加超过48亿英镑如今,约35%的企业表示他们很难找到拥有良好数字技能的员工,而39%的失业人员表示他们缺乏数字技能是他们找工作的障碍这就是为什么自2015年以来,谷歌已经访问了英国500多个地点,并已经培训了超过100万人的数字技能,帮助他们发展业务和职业这只是人工智能在推动英国生产力和为该国提供关键经济推动力方面的三个例子公共、私营和第三部门共同努力释放这一潜力至关重要推动英国创新的社会创新基金谷歌.org的人工智能社会创新基金还将向在英国推动使用人工智能帮助社区的项目的社会企业家分配价值100万英镑的资金选定的社会企业家将获得现金拨款、指导以及谷歌初创企业加速器团队的加速支持,以确保他们的创新想法有机会推动有意义的变革社会企业家可以在Social Tides网站上注册他们的兴趣!我们对英国的持续承诺这个国家有着继续保持技术领导地位的巨大机会英国是一个创新的中心,谷歌自豪地将其视为家园已经超过20年政府已经提出了英国成为全球人工智能、科学和技术领导者,并确保每个人都具备数字技能,将技术主导的增长和机会带给该国各地的雄心壮志谷歌正在与这一愿景合作——通过可持续、负责任和有影响力的技术,利用人工智能帮助英国每个人实现他们的雄心壮志,无论是大还是小阅读谷歌完整的英国经济影响报告请点击此处

Leave a Comment

2024 年值得关注的前 12 位数据科学领袖

在蓬勃发展的数据科学领域,2024年的到来标志着关键时刻,我们将聚焦于一群杰出人物,他们推动创新,塑造着分析学的未来。《2024年十二位数据科学领袖榜单》作为一个指路明灯,庆祝这些人的卓越专业知识、远见领导力以及在该领域的重要贡献。让我们一起探索这些开创性思想家的故事、项目和有前瞻性的观点,他们承诺将塑造数据科学的发展轨迹。这些杰出领导者不仅是先驱者,更是引领我们进入一个无与伦比的创新和发现时代的先锋。 2024年十二位数据科学领袖榜单 随着我们临近2024年,我们将关注一群具有显著专业知识、领导能力和卓越贡献的人士。《2024年十二位数据科学领袖榜单》旨在承认和关注这些人,将他们视为思想领袖、创新者和预计在未来一年取得重大里程碑的影响者。 随着我们深入了解细节,明显地看到这些人的观点、举措和倡议能够改变我们在解决各个行业面临的复杂挑战时的方法和数据利用。无论是在预测分析方面的进展,还是对伦理人工智能实践的倡导,或者是开发尖端算法,这些名单上的人士都有望在2024年影响数据科学领域。 1. 吴恩达 “如今人工智能的主要挑战在于找到合适的业务背景来适应它。我热爱技术,它为我们提供了许多机会。但是最终,技术需要被融入到业务使用案例中。” 吴恩达博士是一位拥有机器学习(ML)和人工智能(AI)专业知识的英裔美籍计算机科学家。在谈到他对AI发展的贡献时,他是DeepLearning.AI的创始人,Landing AI的创始人兼首席执行官,AI Fund的普通合伙人,并且是斯坦福大学计算机科学系的兼职教授。此外,他曾是Google AI旗下Google Brain深度学习人工智能研究团队的创始领导者。他还曾担任百度的首席科学家,指导了一个由1300人组成的人工智能团队,并发展了公司的全球AI战略。 吴恩达先生负责领导斯坦福大学的大规模在线开放课程(MOOC)的发展。他还创办了Coursera,并为超过10万名学生提供机器学习(ML)课程。作为机器学习和在线教育的先驱者,他拥有卡内基梅隆大学、麻省理工学院和加州大学伯克利分校的学位。此外,他在机器学习、机器人学和相关领域发表了200多篇研究论文,并入选了《时代》杂志评选的全球最具影响力人物100人。 网站:https://www.andrewng.org Twitter:@AndrewYNg Facebook:Andrew Ng、Google Scholar。 2. Andrej Karpathy “我们本应让人工智能做所有工作,而我们玩游戏,但我们在做所有工作,而AI在玩游戏!” Andrej Karpathy是一位来自斯坦福大学的斯洛伐克-加拿大双博士学位获得者,在OреոΑӏ负责构建一种JARVIS。他曾担任特斯拉的人工智能和自动驾驶视觉总监。Karpathy对深度神经网络充满热情。他从多伦多开始,修读计算机科学和物理学的双学位,之后前往哥伦比亚深造。在哥伦比亚,他与Michiel van…

Leave a Comment

15+ AI 开发工具(2023年12月)

GitHub Copilot GitHub Copilot是一种市场领先的人工智能辅助编码助手。作为一个能使开发人员以更高效的方式生成优质代码的工具,Copilot基于OpenAI的Codex语言模型开发。该模型既训练有自然语言理解能力,又有广泛的公共代码数据库,使其能够提供有见地的建议。从完成整行代码和函数到撰写注释,以及辅助调试和安全检查,Copilot为开发人员提供了宝贵的工具。 Amazon CodeWhisperer Amazon的CodeWhisperer是一个基于机器学习的代码生成器,可在Visual Studio和AWS Cloud9等各种IDE中提供实时编码建议。它基于大规模开源代码数据集进行训练,可以提供代码片段到完整功能的建议,自动化重复任务并提升代码质量,是寻求效率和安全性的开发人员的福音。 Notion AI 在Notion工作区中,AI助手Notion可以帮助完成各种与写作相关的任务,包括创造性、修订和概要。它提高了写电子邮件、工作描述和博客文章等任务的速度和质量。Notion AI是一个能够自动化各种写作任务的AI系统,从博客和列表到头脑风暴和创作写作都可以轻松地重新组织和转换AI生成的内容,使用拖放文本编辑器工具。 Stepsize AI Stepsize AI是一个旨在优化团队生产力的协作工具。作为一个项目历史记录和任务管理者,它与Slack、Jira和GitHub等平台集成,以简化更新并消除沟通不畅。其主要特点包括对活动的统一摘要、即时回答问题和强大的数据隐私控制。 Mintlify Mintlify是一个节省时间的工具,可直接在您喜爱的代码编辑器中自动生成代码文档。只需单击一次,Mintlify Writer就可以为您的函数创建结构良好、上下文感知的描述。非常适合开发人员和团队,在生成复杂函数的精确文档方面表现出色,因其高效和准确性而备受赞誉。 Pieces for Developers Pieces for…

Leave a Comment

“AWS上的NVIDIA GPU将在全宇宙Isaac模拟器中实现2倍的模拟飞跃,加速智能机器人的发展”

在云端开发更智能的机器人即将获得速度倍增器。 NVIDIA Isaac Sim和NVIDIA L40S GPUs即将登陆亚马逊云服务,使开发者能够在云端构建和部署加速机器人应用。Isaac Sim是一个可扩展的人工智能机器人模拟器,构建于NVIDIA Omniverse开发平台,用于构建和连接OpenUSD应用程序。 L40S GPU将强大的人工智能计算与图形和媒体加速相结合,旨在为下一代数据中心工作负载提供动力。基于Ada Lovelace架构,L40S可以实现超高速实时渲染,与上一代相比,Omniverse的性能提升高达3.8倍,提升了工程和机器人团队的能力。 加速度的世代跃迁使得在使用Isaac Sim进行一系列机器人模拟任务时,与A40 GPU相比,获得了2倍的性能提升。 L40S GPU还可以用于生成式人工智能工作负载,从几小时内对大型语言模型进行精调,到文本到图像和聊天应用的实时推理。 NVIDIA L40S在AWS Marketplace上的新Amazon Machine Images (AMIs)将使机器人工程师们能够轻松访问预配置的虚拟机,以执行Isaac Sim工作负载。 模拟中的机器人开发加速了应用部署的过程,为零售业、食品加工业、制造业、物流等行业注入了强大动力。 根据ABI…

Leave a Comment

“遇见 GO To Any Thing(GOAT):一种通用导航系统,可以在完全未知的环境中,以图像、语言或类别的方式查找任何指定对象”

来自伊利诺伊大学厄巴纳-香槟分校、卡内基梅隆大学、乔治亚理工学院、加州大学伯克利分校、Meta人工智能研究机构和Mistral人工智能团队的研究人员合作开发了一种名为GO To Any Thing(GOAT)的通用导航系统。这个系统是为家庭和仓库环境中延长自主运行时间而设计的。GOAT是一个多模态系统,可以从类别标签、目标图像和语言描述中解释目标。它是一个终身系统,受益于过去的经验。GOAT适用于各种机器人实体。 GOAT是一个用于移动机器人的多功能导航系统,能够利用类别标签、目标图像和语言描述在各种环境下进行自主导航。GOAT利用深度估计和语义分割创建一个3D语义体素地图,用于准确的对象实例检测和记忆存储。语义地图有助于空间表示、跟踪对象实例、障碍物和已探索区域。 GOAT是一个受到动物和人类导航洞察力启发的移动机器人系统。GOAT是一个通用导航系统,能够在各种环境中自主运行,根据人类输入执行任务。GOAT是多模态、终身学习和平台无关的,使用类别标签、目标图像和语言描述进行目标规定。该研究评估了GOAT在到达未见过的多模态对象实例方面的性能,并强调了它在以前方法中基于SuperGLUE的图像关键点匹配优于CLIP特征匹配的优越性。 GOAT是一个通用导航系统,采用模块化设计和实例感知的语义记忆,用于基于图像和语言描述的多模态导航。该计划是通用的、适应终身学习的,并通过在家庭中进行大规模真实世界实验来展示其功能。利用“路径长度加权成功率”等指标对GOAT的性能进行评估,而无需预先计算地图。代理程序使用全局和局部策略,使用快速行进方法进行路径规划和点导航控制器以达到路径上的航点。 在九个家庭的实验试验中,GOAT作为一种通用导航系统取得了83%的成功率,超过以前的方法32%。它的成功率从第一个目标的60%提高到经过探索后的90%,展示了其适应性。GOAT无缝处理下游任务,如拾取和放置以及社交导航。定性实验展示了GOAT在波士顿动力Spot和Hello Robot Stretch机器人上的部署。在真实世界家庭中对Spot进行的大规模定量实验展示了GOAT相对于三个基准的卓越性能,在匹配实例和有效导航方面表现出色。 出色的多模态和平台无关设计使得可以通过各种方式进行目标规定,包括类别标签、目标图像和语言描述。模块化的架构和实例感知的语义记忆可以区分同一类别的实例,以实现有效的导航。在没有预先计算地图的大规模实验中进行评估,GOAT展示了其多样性,并将其能力扩展到拾取和放置、社交导航等任务。 GOAT的未来轨迹包括在各种环境和场景中全面探索其性能,以评估其广泛性和稳健性。研究将致力于提高匹配阈值,以应对勘探过程中的挑战。根据目标类别对实例进行子采样将进一步探索以提高性能。GOAT的持续发展包括优化全局和局部策略,并可能整合额外的技术以实现更高效的导航。广泛的真实世界评估将涵盖不同的机器人和任务,以验证GOAT的多功能性。进一步探索可以将GOAT的适用范围扩展到物体识别、操纵和交互等领域。

Leave a Comment

Etan Ginsberg, Martian联合创始人 – 采访系列

埃坦·金斯伯格是 Martian 的联合创始人,Martian 是一个动态路由每个提示到最佳 LLM 的平台通过路由,Martian 实现了比任何单个提供商(包括 GPT-4)更高的性能和更低的成本该系统基于该公司独特的模型映射技术,将复杂的黑盒中的 LLM 解释为更可理解的形式

Leave a Comment

Can't find what you're looking for? Try refining your search: