Press "Enter" to skip to content

Author: 四海吧

设计速度引领先潮:Trek Bicycle使用NVIDIA GPU开发的自行车参加环法自行车赛

NVIDIA RTX正在为设计带来新的循环。Trek Bicycle正在使用GPU将设计概念变为现实。 这家位于威斯康星州的公司是世界上最大的自行车制造商之一,旨在打造具有最高品质工艺的自行车。Trek Bicycle与其新合作伙伴Lidl(一家国际零售连锁公司)还拥有一个自行车队,现在称为Lidl-Trek。该队参加了年度环法自行车赛,使用Trek Bicycle的旗舰产品系列,包括Emonda、Madone和Speed Concept。Trek的许多团队配件和设备,如轮组和公路赛头盔,也是由Trek设计的。 自行车设计涉及复杂的物理学,一个关键挑战是在舒适性和骑行质量之间平衡空气动力学效率。为了解决这个问题,Trek的团队正在使用NVIDIA A100 Tensor Core GPU运行高保真的计算流体动力学(CFD)模拟,为自行车的空气动力学设定新的基准,同时确保骑行舒适和平稳。 设计师和工程师还在Dell Precision工作站上使用NVIDIA RTX技术进行工作流程的进一步改进,其中包括NVIDIA RTX A5500 GPU和搭载双RTX A6000 GPU的Dell Precision 7920。 实时可视化自行车设计 为了启动产品设计过程,团队首先进行用户研究,生成早期设计概念并开发一系列想法。然后,他们建立原型并根据需要迭代设计。 为了提高性能,自行车需要在路上或山地上给人一种特定的感觉。因此,Trek花了很多时间与运动员一起研究,找出需要进行关键更改的地方,包括几何形状和框架的灵活性,以及减少颠簸的影响。…

Leave a Comment

用BERT构建自定义FAQ聊天机器人

聊天机器人已成为许多组织用于各种目的的越来越标准和有价值的界面。它们在不同行业中有许多应用,例如为客户提供个性化的产品推荐,提供全天候的客户支持来解决查询问题,协助客户预订等等。本文探讨了创建专门用于客户互动的FAQ聊天机器人的过程。FAQ聊天机器人解答特定领域内的问题,利用预定义的问题列表和相应的答案。这种类型的聊天机器人依赖于语义问题匹配作为其基本机制。 学习目标 了解BERT模型的基础知识 了解Elasticsearch及其在聊天机器人中的应用 创建聊天机器人的机制 在Elasticsearch中进行索引和查询 本文是作为Data Science Blogathon的一部分发布的。 BERT是什么? BERT(Bidirectional Encoder Representations from Transformers)是谷歌于2018年发布的一个大型语言模型。与单向模型不同,BERT是基于Transformer架构的双向模型。它通过考虑句子中在它之前和之后出现的单词来学习理解单词的上下文,实现更全面的理解。 BERT面临的一个主要挑战是无法在自然语言处理任务中达到最先进的性能。主要问题是标记级别的嵌入在文本相似性方面无法有效使用,导致在生成句子嵌入时性能较差。 然而,为了解决这个挑战,开发了Sentence-BERT(SBERT)。SBERT基于一个Siamese网络,它每次接收两个句子,并使用BERT模型将它们转换为标记级别的嵌入。然后,它对每组嵌入应用汇聚层以生成句子嵌入。在本文中,我们将使用SBERT进行句子嵌入。 Elasticsearch是什么? Elasticsearch是一个开源的搜索和分析引擎,具有强大的实时处理能力、高度可扩展性,并专为处理大规模数据而设计。它基于Apache Lucene库开发,提供全文搜索功能。Elasticsearch具有高度可扩展性,因为它提供了一个高度分布式的网络,可以跨多个节点进行扩展,提供高可用性和容错性。它还提供了一个灵活而强大的RESTful API,允许使用HTTP请求与搜索引擎进行交互。它支持各种编程语言,并提供客户端库以便于应用程序集成。 如何使用BERT和Elasticsearch创建聊天机器人? 本文将教我们如何使用预训练的BERT和Elasticsearch创建FAQ聊天机器人。 步骤1)安装SBERT库 #安装sentence…

Leave a Comment

OpenAI和Meta因侵犯版权而被起诉

在一项令人震惊的法律进展中,著名喜剧演员Sarah Silverman和备受赞誉的作家Christopher Golden和Richard Kadrey对OpenAI和Meta提起了诉讼。这些诉讼声称侵犯版权,并将AI模型的使用推到了聚光灯下。作者声称,OpenAI和Meta分别在非法获取的数据集上训练了他们的ChatGPT和LLaMA模型,这些数据集中包含了他们的作品。随着这些法律斗争的展开,它们引发了关于数字时代版权保护边界的重要问题。 还阅读:AI使用个人数据的争议:深入探讨Bard使用Gmail的情况 针对OpenAI和Meta的指控 Silverman、Golden和Kadrey声称他们的作品来自“影子图书馆”网站,例如Bibliotik、Library Genesis和Z-Library。他们认为,他们的书籍通过种子系统以批量方式提供,并在未经他们同意的情况下用于训练OpenAI的ChatGPT和Meta的LLaMA。作为证据呈现的展品显示,这些AI模型可以概括作者的书籍,侵犯了他们的版权。此外,作者声称,AI聊天机器人没有复制他们的版权管理信息。 还阅读:用简单的术语理解ChatGPT和模型训练 针对Meta的诉讼 针对Meta的诉讼声称该公司的LLaMA模型的训练数据集包含了作者的作品。Meta的训练数据集ThePile由EleutherAI组织,据称是从Bibliotik的内容副本中提取的。作者认为,Bibliotik和其他“影子图书馆”是明显非法的来源。通过利用这些数据集,Meta的AI模型据称违反了版权法。 法律之战展开 Silverman、Golden和Kadrey提起的诉讼包括六项指控,其中包括各种版权侵犯、疏忽、不当得利和不公平竞争。作者寻求法定损害赔偿、利润归还等。律师Joseph Saveri和Matthew Butterick代表作者。他们强调了许多作家、作者和出版商的担忧,他们担心ChatGPT具有生成与受版权保护材料相似文本的神奇能力。 还阅读:什么是数据安全?|威胁、风险与解决方案 更广泛的影响 这些诉讼超越了OpenAI和Meta,它们引发了关于在不断进步的AI技术面前版权保护限制的基本问题。创造力与人工智能之间的斗争凸显了确保作者和创作者权益的明确指南的必要性。这些法律案件的结果可能对AI发展的未来产生深远影响,迫使公司在创新与知识产权之间寻求平衡。 还阅读:专家表示,AI正在窃取您的数据 我们的观点 Silverman、Golden、Kadrey、OpenAI和Meta之间的法律争端凸显了为AI模型获取训练数据集的挑战。这些诉讼强调了在数字时代确立道德和法律框架以保护作者和创作者权益的重要性。随着社会在AI和版权之间不断演变的关系中努力寻求平衡,确保创新的同时尊重知识产权是至关重要的。最终,这些诉讼的结果将塑造AI技术的未来和版权保护的限度。

Leave a Comment

人工智能 vs 人类智能:7个主要区别

介绍 人工智能从虚构的AI角色JARVIS发展到现实生活中的ChatGPT已经走了很长一段路。然而,人类智慧是支持个体学习、理解和提出创新解决方案的属性,而人工智能则是基于提供的数据模仿人类。由于如今人工智能变得如此普遍,一个新的讨论,人工智能与人类智能的对比,已经出现,比较了这两种竞争的范式。 什么是人工智能? 人工智能是与创建能够执行通常需要人类智能和感知的各种任务的智能计算机相关的数据科学的一个子领域。这些复杂的机器可以从先前的错误和历史数据中学习,分析周围的环境,并决定必要的措施。 人工智能是一个综合性的领域,吸取了许多其他学科的思想和方法,包括计算科学、认知科学、语言学、神经科学、心理学和数学。 机器能够自我学习、自我分析和自我改进,在处理过程中几乎不需要人力。它被应用于几乎所有的行业,包括媒体行业、医疗保健行业、图形和动画等,以帮助技术根据它们的行为模拟人类动作。 什么是人类智能? 人类智能指的是一个人的智力能力,使其能够推理、理解各种表达、理解复杂的概念、解决数学问题、适应不断变化的环境、利用知识来控制自己的环境并与他人沟通。 它可以提供关于特定技能和知识体系的事项的信息,这些事项可能与不同的人有关,或者在情报特工和定位器的特定情况下,可能与他们必须访问的外交信息有关。此外,它还可以提供关于社交网络和个人关系的详细信息。 人类智能和行为源于一个人独特的遗传混合、童年发展以及对不同事件和环境的经验。此外,它完全依赖于个体利用其新获得的知识来改变其环境的能力。 人工智能 vs. 人类智能 以下是人类智能和人工智能之间的详细区别: 参数 人类智能 人工智能 起源 人类天生具有推理、思考、评估和执行其他认知任务的能力。 人工智能是人类洞察力的创新;诺伯特·维纳通过理论化批评机制为推进该领域做出了贡献。 学习能力 人类智能可以通过观察、经验和自我教育获取新信息,并将其应用于新领域。 人工智能可以通过统计模型和算法从海量数据中学习。它们无法建立独特的人类分析风格;它们只能通过数据和经常性的训练进行学习。 创造力 通过创新思维和创造力,人类智能可以产生新的概念、文学、音乐和艺术。…

Leave a Comment

NVIDIA的人工智能拯救地球免受气候变化的侵袭

在柏林地球虚拟化引擎倡议峰会上的主题演讲中,NVIDIA创始人兼首席执行官黄仁勋揭示了人工智能和数字孪生技术在气候研究中即将引发的下一波创新浪潮。这次活动在柏林著名的哈纳克之家聚集了180名与会者,强调了气候建模的重要角色以及研究人员、政策制定者和行业之间的合作,以可持续方式应对气候挑战。让我们深入了解黄仁勋演讲的重点亮点,了解NVIDIA的Earth-2平台和地球虚拟化引擎(EVE)倡议如何为气候突破铺平道路。 还可阅读:NVIDIA的人工智能模型拯救地球,从NASA获得资金 气候建模的关键作用 黄仁勋以著名物理学家理查德·费曼的一句话开启了他的演讲,强调了通过创造来实现理解的重要性。他承认气候研究人员在制定政策、引导产业和保护地球健康方面的重要作用。为了实现这种理解,演讲强调了气候建模的重要性及其对未来的影响。 NVIDIA Earth-2:加速气候和天气预测 NVIDIA Earth-2平台是一个全面的开放平台,集成了人工智能和高分辨率模拟,以加速气候和天气预测。利用像ICON和IFS这样的先进数值模型,以及通过NVIDIA Modulus的FourCastNet和GraphCast等神经网络模型,Earth-2使研究人员能够以前所未有的速度和规模模拟和可视化全球大气层。在NVIDIA强大的DGX GH200、HGX H100和OVX超级计算机上运行,这个平台承诺具有突破性的气候研究能力。 还可阅读:农业的未来:利用数据科学优化作物产量 地球虚拟化引擎(EVE):推动气候科学可访问性 EVE是一个国际合作项目,集结了专注于气候科学、高性能计算(HPC)和人工智能的数字基础设施。EVE的主要目标是为可持续的地球管理提供易于访问的千米级气候信息。通过倡导以2.5公里分辨率进行协调的气候预测,EVE承诺加速进展,并建立在25年气候研究进展的基础上。 还可阅读:AI模型的环境成本:碳排放和用水量 气候研究人员的三大奇迹 黄仁勋概述了实现气候研究人员雄心勃勃目标所必须发生的三个关键奇迹: 快速高分辨率气候模拟 大量数据的预计算 与NVIDIA Omniverse的交互式数据可视化 GH200 Grace Hopper超级芯片:加速CPU的突破 为了支持这项前沿研究,NVIDIA推出了GH200…

Leave a Comment

微软高级数据科学家的成功故事

介绍 在当今数字时代,数据的力量不可否认,那些掌握利用其潜力的技能的人正在引领着塑造技术未来的潮流。在这些开拓者中,有一个卓越的个体,他就是尼尔马尔先生,数据科学领域的远见者,他已经成为世界一流科技巨头之一微软公司的高级数据科学家,成为推动力量。 认识尼尔马尔先生,他是坚韧、聪明和坚定奉献的化身。尼尔马尔先生从平凡的开始踏上了一段变革之旅,使他们成为微软公司高级数据科学家职业生涯的巅峰。他的迅猛崛起是一个激励人心的成功故事,不仅对有抱负的数据科学家有启示,也对任何有梦想和决心追求伟大的人有启示。 在这篇成功故事文章中,我们深入探讨了尼尔马尔先生的旅程,追溯了塑造他非凡职业生涯的关键里程碑、挑战和成功。我们探索了他领导的开创性项目、他所产生的变革性影响以及他一路上学到的宝贵经验。通过尼尔马尔先生的故事,我们发现在不断发展变化的数据科学世界中蓬勃发展所必需的特质和心态。 让我们开始对话吧! AV:请强调一下您的职业轨迹、教育背景以及它们如何帮助您获得第一份数据科学家的工作? 尼尔马尔先生:我的职业轨迹从来没有一条线性的道路。我们每个人都有自己的故事,我相信它们都很有趣。下面是我的故事:我在尼泊尔完成了IT工程的本科学位。我于2007年移民美国攻读硕士学位。在完成硕士学位后,我加入了美国陆军。是的,听起来非常不寻常。由于2009年美国爆发了一次大衰退(这也恰好是我毕业的那一年),就业市场非常糟糕,特别是对国际学生来说。美国陆军运行了一个特殊试点项目,我经历了所有必要的流程成为一名军人。在我成长的过程中,我有一些加入军队的激情。这是实现这个梦想的方式。 当我在军队中时,我完成了MBA学位。2014年,我完成了第一份入伍合同后,我离开了美国陆军。同年,我获得了在美国海军部门担任网络安全分析师的第一份数据角色,成为美国联邦政府雇员。在这份工作期间,我完成了第三个数据科学硕士学位。在作为数据分析师工作并建立学术资历以及数据科学技能的经验后,我转向私营行业,在2018年担任威尔斯法戈银行的首个数据科学家职位。从那时起,我一直从事数据科学,并目前在微软担任高级数据科学家。 AV:您能告诉我们一个您参与过的项目,您必须使用数据来解决一个现实世界的问题,并对业务或产品策略产生的影响进行说明吗? 尼尔马尔先生:有很多例子。首先,我们不必拥有“数据科学家”的职称来处理和解决任何数据问题。有一些误解就是这样。我们可以担任数据分析师、数据工程师、业务分析师或任何与数据相关的职位。 我主要在网络安全领域工作。我们的两个主要关注领域是调查和检测。在处理网络安全问题时,异常检测是一个非常流行的问题领域之一。我曾经参与一个数据科学团队建立异常检测系统,帮助安全分析师节省时间,确定要关注的事件/警报。这对于节省他们的时间和资源具有重要影响。 AV:您用数据科学解决过的最具挑战性的问题是什么?您是如何解决这个问题的?结果如何? 尼尔马尔先生:我要说的是,对我来说最具挑战性的问题尚未解决。由于我们生活在高度创新的人工智能世界中,我们应该时刻意识到对手现在拥有比以往任何时候都更先进的工具。然而,如果我必须提到一个有趣的问题,那么我会选择用户行为分析,也称为用户实体行为分析,在行业中被广泛称为UEBA。UEBA是一种发现威胁的网络安全功能,通过识别与正常基线偏离的用户活动来发现威胁。 一个简单的例子:我们有一个用户经常从A地登录,突然间我们看到从B地登录的活动。这可能是与旅行有关的正常行为,但仍然偏离了正常行为,因此必须查看以确认正常与恶意之间的差异。UEBA最具挑战性的部分是理解和创建基线。 数据驱动的洞察 AV:您可以分享一个时间,您必须向非技术利益相关者传达复杂的数据驱动洞察的故事吗?您是如何确保他们理解这些洞察和它们对业务的影响的? 尼尔马尔先生:作为一名数据科学家,我们会遇到多种这样的场景。大多数业务利益相关者对其问题和预期解决方案都非常了解。然而,有时很难向他们解释为什么某些解决方案是有意义的,而某些解决方案则不是。我可以分享一个例子。我们建立了一个欺诈检测模型,它是一个二元分类器,用于欺诈和非欺诈交易。欺诈分析师对他们的领域非常了解。但是对于我们向他们解释模型结果来说,将其分解为他们的语言是具有挑战性的。 如果我们分享诸如模型调整和超参数或交叉验证或抽样方法之类的细节,这些对他们来说将没有多少意义。但是,如果我们解释更高层次的内容,例如基于特征排名我们发现哪些属性是有用的,类别不平衡的一些挑战是什么,这些对他们来说就有意义了。因此,数据科学家始终以业务语言交流非常重要。   AV:您如何确保您的团队构建的机器学习模型对最终用户是可解释和透明的,特别是在安全和威胁检测的背景下? 尼尔马尔先生:像我在之前的例子中提到的那样,模型的互操作性在向业务合作伙伴解释模型时非常重要。无论您在哪个领域工作,这都很重要。在安全和威胁检测方面,这变得更加重要,因为我们构建的任何模型都必须能够向威胁分析师解释,以便他们可以采取适当的行动。我可以在这里分享一个很好的例子,即“良性正例”的概念。当我第一次听到这个术语时,我有点困惑,因为我只知道真正的正例和假正例。但是在安全领域,良性正例很重要。以下是这些类别的详细说明: 真正的正例(TP):由安全工具检测到的恶意行为。 良性真正的正例(B-TP):由安全工具检测到的实际但非恶意的行为,例如渗透测试或已批准应用程序生成的已知活动。 假正例(FP):虚警,表示该活动并未发生。 AV:您是否遇到过数据杂乱或不完整的情况?您是如何处理的,结果如何?…

Leave a Comment