18 search results for "PyTorch Lightning"

深度学习库介绍：PyTorch和Lightning AI

Published September 26, 2023 by 四海吧

PyTorch和Lightning AI的简单解释

Leave a Comment

“五步学习PyTorch入门指南”

Published October 7, 2023 by 四海吧

这个教程提供了一个深入介绍如何使用PyTorch和其高级封装器PyTorch Lightning进行机器学习的教程本文涵盖了从安装到高级话题的关键步骤，提供了一种实践方法来构建和训练神经网络，并强调使用Lightning的好处

Leave a Comment

使用Amazon SageMaker智能筛选，将深度学习模型训练加速高达35%

Published November 30, 2023 by 四海吧

在当今快速发展的人工智能领域，深度学习模型已经成为创新的前沿, 并且在计算机视觉（CV），自然语言处理（NLP）和推荐系统等领域有广泛的应用然而，训练和优化这些模型所带来的成本不断增加，给企业带来了挑战这些成本主要是由[…]驱动的

Leave a Comment

NVIDIA为一些最大的亚马逊Titan基础模型提供训练能力

Published November 28, 2023 by 四海吧

关于大型语言模型的一切都是巨大的——巨大的模型在数千个NVIDIA GPU上的大规模数据集上进行训练。这对于追求生成式人工智能的公司来说会带来很多大的挑战。 NVIDIA NeMo是一个构建、定制和运行LLM的框架，有助于克服这些挑战。亚马逊网络服务的一支由经验丰富的科学家和开发人员组成的团队正在创建Amazon Titan为Amazon Bedrock提供基础模型，后者是一项基于基础模型的生成式人工智能服务，并在过去的几个月中一直使用NVIDIA NeMo。 “与NeMo合作的一个重要原因是它的可扩展性，它具有优化功能，可以在高GPU利用率下运行，并使我们能够扩展到更大的集群，以便我们能够更快地训练和交付模型给我们的客户，”亚马逊网络服务的高级应用科学家Leonard Lausen说。融入大规模环境 NeMo中的并行技术使得大规模LLM的训练更加高效。与AWS的弹性适配器相结合，可以将LLM分散到多个GPU上加速训练。 EFA提供了一个UltraCluster网络基础设施，可以直接连接超过10,000个GPU，并通过NVIDIA GPUDirect绕过操作系统和CPU。这种组合使得AWS的科学家们能够提供优秀的模型质量，这是仅依赖数据并行化方法无法实现的。适用于各种规模的框架 “NeMo的灵活性，”Lausen说，“使得AWS能够根据新的Titan模型、数据集和基础设施的特点来定制训练软件。” AWS的创新包括从Amazon Simple Storage Service（Amazon S3）到GPU集群的高效流处理。“由于NeMo基于像PyTorch Lightning这样的流行库构建，这些改进很容易融入其中，这些库标准化了LLM训练流程组件，”Lausen说。 AWS和NVIDIA的目标是吸取他们的合作所学，为顾客带来像NVIDIA…

Leave a Comment

LLMs的参数高效微调（PEFT）：全面介绍

Published September 1, 2023 by 四海吧

“参数高效微调指南，涵盖了LoRa、LLaMA-Adapter、P-Tuning、prompt tuning、prefix tuning、AdaLoRa、IA3、Adapters、soft prompts等”

Leave a Comment

任何项目的机器学习库

Published August 31, 2023 by 四海吧

在机器学习项目中有许多可用的库请查阅一份综合指南，了解在您的项目中应该使用哪些库

Leave a Comment

学习新的数据科学技能，正确的方式

Published August 26, 2023 by 四海吧

我们倾向于将学习曲线看作是整洁、平滑、持续向上趋势的线条然而，仔细观察任何学习过程，你会发现沿途有许多低谷和平台期…

Leave a Comment

“ML流水线架构设计模式（附带10个真实世界的示例）”

Published August 22, 2023 by 四海吧

每个机器学习从业者都会意识到，在Jupyter Notebook中训练模型只是整个项目的一小部分准备好一个工作流程，将数据从原始形式转化为预测结果，同时保持响应性和灵活性，才是真正重要的此时，数据科学家或…

Leave a Comment

使用Hydra跟踪您的实验

Published August 3, 2023 by 四海吧

“就像第一次编写的代码中不可能没有错误一样，第一次训练出完全正确的模型也是不可能的那些…”

Leave a Comment

Graphcore和Hugging Face推出新的IPU-Ready Transformers产品线

Published July 16, 2023 by 四海吧

Graphcore和Hugging Face显著扩展了Hugging Face Optimum中可用的机器学习模态和任务范围，这是一个用于优化Transformer性能的开源库。开发人员现在可以方便地访问各种现成的Hugging Face Transformer模型，并经过优化以在Graphcore的IPU上提供最佳性能。在Optimum Graphcore推出后不久推出的BERT Transformer模型，开发人员现在可以访问包括自然语言处理（NLP）、语音和计算机视觉在内的10个模型，这些模型配有IPU配置文件以及准备好的预训练和微调模型权重。新的Optimum模型计算机视觉 ViT（Vision Transformer）是图像识别的突破性技术，它使用Transformer机制作为其主要组件。当图像输入到ViT中时，它们被划分为小块，类似于语言系统中处理单词的方式。每个块都由Transformer（嵌入）进行编码，然后可以单独处理。自然语言处理（NLP） GPT-2（生成型预训练Transformer 2）是一个在大规模英语语料库上进行自我监督预训练的文本生成Transformer模型。这意味着它仅在原始文本上进行预训练，没有以任何方式对其进行人工标记（这就是为什么它可以使用大量公开可用的数据），它使用自动化过程从这些文本中生成输入和标签。更准确地说，它通过猜测句子中下一个单词来训练生成文本。 RoBERTa（鲁棒优化BERT方法）是一个在大规模英语语料库上进行自我监督预训练的Transformer模型，类似于GPT-2。更准确地说，RoBERTa使用了掩码语言建模（MLM）目标进行预训练。给定一个句子，模型会随机掩盖输入中的15%单词，然后将整个掩码句子输入模型，并预测掩盖的单词。RoBERTa可以用于掩码语言建模，但主要用于在下游任务上进行微调。 DeBERTa（具有解耦注意力的解码增强BERT）是用于NLP任务的预训练神经语言模型。DeBERTa使用两种新颖技术（解耦注意力机制和增强掩码解码器）对2018年的BERT和2019年的RoBERTa模型进行了改进，显著提高了模型的预训练效率和下游任务的性能。 BART是一个具有双向（类似BERT）编码器和自回归（类似GPT）解码器的Transformer编码器-解码器（seq2seq）模型。BART通过（1）使用任意的噪声函数破坏文本和（2）学习一个模型来重构原始文本进行预训练。BART在文本生成（例如摘要、翻译）的微调上特别有效，但在理解任务（例如文本分类、问答）上也表现良好。 LXMERT（从Transformer中学习跨模态编码器表示）是用于学习视觉和语言表示的多模态Transformer模型。它有三个编码器：对象关系编码器、语言编码器和跨模态编码器。它是通过一系列任务进行预训练，包括掩码语言建模、视觉-语言文本对齐、ROI特征回归、掩码视觉属性建模、掩码视觉对象建模和视觉问答目标。它在VQA和GQA视觉问答数据集上取得了最先进的结果。 T5（文本到文本转换Transformer）是一个革命性的新模型，可以将任何文本转换为用于翻译、问答或分类的机器学习格式。它引入了一个统一的框架，将所有基于文本的语言问题转换为文本到文本格式的迁移学习。通过这样做，它简化了在各种NLP任务中使用相同的模型、目标函数、超参数和解码过程的方式。语音 HuBERT（隐藏单元BERT）是一个在音频上进行自我监督语音识别预训练的模型，它学习了连续输入上的声学和语言模型的组合。HuBERT模型在Librispeech（960h）和Libri-light（60,000h）基准测试中，使用10分钟、1小时、10小时、100小时和960小时的微调子集，要么与现有的wav2vec 2.0性能相匹配，要么有所改进。 Wav2Vec2是一个用于自动语音识别的预训练自我监督模型。Wav2Vec2使用一种新颖的对比预训练目标，从大量无标签的语音数据中学习强大的语音表示，然后在少量转录语音数据上进行微调，优于最佳的半监督方法，而且概念上更简单。…

Leave a Comment

解码着装规范 👗：深度学习用于自动化时尚物品检测

Published July 12, 2023 by 四海吧

在充满活力的电子商务世界中，时尚行业就像是一个独立的T台但如果我们能够用深度学习的精确性来解读这个T台的着装规范，而不是凭借设计师的眼光，会怎样呢？

Leave a Comment

部署自定义ML模型作为SageMaker端点

Published December 8, 2023 by 四海吧

从数据收集到模型部署，开发一个机器学习（ML）模型涉及到关键步骤在通过测试完善算法和确保性能之后，最后一个关键步骤是…

Leave a Comment

2024年要使用的前5个生成AI库

Published December 5, 2023 by 四海吧

介绍在不断发展的技术领域中，人工智能（AI）已成为一股变革力量。从最初的基本算法到现代机器学习模型的复杂性，AI的发展之路确实是一场革命。现在，随着生成AI库在搜索中的出现，一个引人入胜的篇章展开了。但是，到底什么是genAI呢？跨入未来，体验生成AI的魅力！与传统模型不同，genAI能够创建新的数据，重塑产业。像ChatGPT这样的工具引领着变革商业格局的道路。探索“2024年的前5个生成AI库”，揭示尖端AI工具的力量和潜力。从重新定义创新到革新用户体验，这些库标志着AI进化的前沿。让我们一起踏上这个激动人心的未来生成AI之旅！什么是生成AI库？生成AI库是生成人工智能的基石，作为预训练模型和算法的存储库。本质上，这些库赋予开发者和企业利用AI的创造潜力，而无需从头开始。通过提供学习模式和数据的基础，生成AI库可以生成各种输出，从文本和音乐到视觉。利用这些库可以简化开发过程，促进创新和效率。生成AI库使得广泛范围的应用和行业能够轻松获取先进的AI能力，实现了普惠性。通过实践学习，提升你的生成AI技能。通过我们的GenAI Pinnacle Program，探索向量数据库在高级数据处理中带来的奇迹！ 2024年使用的前5个生成AI库 1. Open AI OpenAI的API是生成AI中的一项突破性工具，为深入参与到生成AI领域的专业人士提供了一种变革性的解决方案。该API以灵活的“输入文本，输出文本”界面脱颖而出，允许生成AI专业人士将其无缝集成到日常工作和项目中。它对于几乎任何英语语言任务都具有适应性，为实验、开发和探索提供了广阔的空间。该API在理解和执行任务时表现出色，只需少量示例即可。这是生成AI编程的直观选择，使专业人士能够简化工作流程，将精力集中在创造性输出上，而不是复杂的系统问题。该API的灵活性还包括通过任务特定训练来提高性能，使用户可以根据自己提供的数据集或反馈进行定制。OpenAI对简洁性的承诺确保了对广泛用户群体的易用性，而对技术的持续升级则表明了对快速发展的机器学习领域保持步伐的承诺。此外，OpenAI对负责任的AI使用的强调在其对有害应用的谨慎监控和终止访问中体现出来。私人测试版的发布反映了对用户安全的承诺，并伴随着对语言技术与安全相关方面的持续研究。使用OpenAI的API的生成AI从业者创造了一个有力的工具，为积极的AI系统做出贡献。这个API不仅仅带来收入方面的效益，还推动了通用AI的进步，消除了障碍，推动着生成AI社区朝着无限可能的未来迈进。 2. PandasAI PandasAI是一款革命性的生成AI驱动的数据分析库，它重新塑造了生成AI专业人士日常任务的格局，为数据分析和处理带来了范式转变。建立在广泛使用的Pandas库的基础上，PandasAI通过融合生成AI模型来提高生产力。通过自然语言界面，传统的Pandas任务，如预处理和数据可视化，得到了提升。 PandasAI的吸引力在于它能够将复杂的编码过程转化为自然语言界面。生成AI消除了对广泛编码知识的需求，使数据科学家可以通过与数据集进行对话来查询数据集。这一创新极大地加快了预处理和分析阶段，是传统编码实践的一次离开。该库开启了新的可能性，使得技术和非技术专业人士都能够轻松地与数据集进行交互。 PandasAI的核心是生成式人工智能（GenAI），这是一种通过识别现有数据中的模式来产生多样数据类型的子集。通过利用GenAI，PandasAI引领了一个新时代，用户无需编写复杂的代码，而是可以用自然语言表达他们的意图，并见证他们的指令精确执行。这种转变的方法不仅简化了日常任务，还为生成式人工智能领域的数据分析过程铺平了道路，使其更具包容性和高效性。 3. HuggingFace Transformers HuggingFace Transformers为GenAI专业人士提供了一套改变日常任务和项目的转型工具集。该库提供超过20,000个预训练模型的即时访问，所有这些模型都基于最先进的Transformer架构，为数据科学家、人工智能从业者和工程师们提供了民主化的自然语言处理（NLP）工具。…

Leave a Comment