Search Results for “SIMD”

你的Rust代码加速的九个SIMD规则（第二部分）

Published December 16, 2023 by 四海吧

探索使用SIMD加速Rust代码的九个基本规则学习coresimd，优化技巧，并提升性能至7倍

Leave a Comment

为了加速你的Rust代码的SIMD，需要遵循九个规则（第一部分）

Published December 13, 2023 by 四海吧

探索使用SIMD加速Rust代码的九个基本规则了解coresimd、优化技术，并将性能提升7倍

Leave a Comment

使用 QLoRA 对 Llama 2 进行微调，并在 Amazon SageMaker 上部署，配备 AWS Inferentia2

Published December 13, 2023 by 四海吧

在这篇文章中，我们展示了使用参数高效微调 (PEFT) 方法对 Llama 2 模型进行微调，并将微调后的模型部署在 AWS Inferentia2 上我们使用 AWS Neuron 软件开发工具包 (SDK) 来访问 AWS Inferentia2 设备，并从其高性能中受益然后，我们使用一个由 […] 提供支持的大型模型推断容器

Leave a Comment

“超快速BERT：指数级加速语言建模”

Published December 10, 2023 by 四海吧

语言模型和生成型人工智能因其功能而闻名，是人工智能行业的热门话题全球研究人员正在提升其效能和能力这些系统通常是深度学习模型，它们在广泛标注的数据上进行预训练，并融合了自注意力神经网络它们使用各种层次——前馈、递归、嵌入和注意力——来处理输入文本并产生[…]

Leave a Comment

通过Go和Metal着色语言编程Apple GPU

Published December 6, 2023 by 四海吧

在下面我将描述使用cgo在Go和本机C之间进行接口的过程，以及如何使用它来与苹果的Metal性能着色器框架的Objective-C绑定接口，还有如何…

Leave a Comment

使用Python进行零到高级的Langchain提示工程化

Published August 5, 2023 by 四海吧

大型语言模型（LLM）的一个重要方面是这些模型用于学习的参数数量模型拥有的参数越多，它就越能理解单词和短语之间的关系这意味着拥有数十亿参数的模型具备生成各种创造性文本格式和回答开放性问题的能力

Leave a Comment

介绍：使用英特尔软件优化 CPU 上的 AI 效率正如我们在之前的博客文章中详细介绍的那样，英特尔 Xeon CPU 提供了一组专为 AI 工作负载设计的特性，例如 AVX512 或 VNNI（矢量神经网络指令），用于使用整数量化神经网络进行高效推断，以及额外的系统工具，以确保以最高效的方式完成工作。在本博客文章中，我们将重点介绍软件优化，并让您了解英特尔的新一代 Ice Lake Xeon CPU 的性能。我们的目标是为您提供软件方面的全部信息，以充分利用您的英特尔硬件。与之前的博客文章一样，我们将展示基准测试结果和图表，以及新的工具，使所有这些参数和特性易于使用。今年四月，英特尔推出了最新一代英特尔 Xeon 处理器，代号 Ice Lake，针对更高效和高性能的 AI…

Leave a Comment