四海吧 – Page 29 – 四海之内皆兄弟，四海带你涨姿势

Press "Enter" to skip to content

认识CodeGPT：AI社区中掀起风潮的全新代码生成工具

Published November 9, 2023 by 四海吧

在AI代码生成工具中，CodeGPT是程序员的最爱之一。它是用于Visual Studio Code的附加组件，利用GPT-3语言模型生成代码、翻译语言、撰写各种类型的内容和回答问题。 CodeGPT目前还在开发中，但它有潜力改变开发人员编码的方式。CodeGPT能够理解自然语言是与其他AI代码生成工具不同的特点之一。这意味着开发人员可以用自然语言编写描述来指示CodeGPT构建代码，而不是使用正式的编程术语。对于学习新语言或框架的开发人员来说，这样节省的时间可能是很大的。 CodeGPT的另一个优点是它能够生成高效和惯用的代码。CodeGPT之所以具有这个优势，是因为它经过大量实际项目的代码训练。这意味着CodeGPT精通每种编程语言的规范和标准。最后，CodeGPT经常发布更新和增强功能。CodeGPT团队定期更新软件，修复可能出现的问题。这意味着CodeGPT在代码生成、语言翻译、内容创建和问题回答等各种任务中不断改进。 CodeGPT的应用领域： CodeGPT可以自动完成不完整或不清楚的代码片段。特别是在处理庞大而复杂的代码库时，这对工程师来说是一个巨大的时间节省。使用CodeGPT可以生成函数、类甚至整个程序。这可以帮助快速生成基本代码或开发新概念。 CodeGPT可以帮助程序员重构代码，推荐更清晰、更惯用的代码结构。它还可以帮助程序员发现和修复代码中常见的安全漏洞。在调试代码方面，CodeGPT是一个有用的工具，因为它提供可能导致错误的原因，并提供修复建议。查找错误：CodeGPT可以帮助开发人员通过识别潜在问题和提供测试来发现代码中的错误。如果使用正确，CodeGPT是一个强大的工具，可以提高程序员编写代码的速度、效率和质量。您可以在这里获取CodeGPT：https://marketplace.visualstudio.com/items?itemName=DanielSanVoAGI.dscodegpt&ssr=false 您可以在这里下载并使用Mistral：https://docs.codegpt.co/docs/tutorial-ai-providers/ollama Introducing CodeGPT, running the @MistralAI 7B model locally in VSCode…

Continue reading

Leave a Comment

“Phind的新人工智能模型在编码方面表现优于GPT-4，在速度上类似于GPT-3.5，并具备16k的上下文”

Published November 9, 2023 by 四海吧

<img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/11/Screenshot-2023-11-08-at-8.11.55-PM-1024×520.png”/><img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/11/Screenshot-2023-11-08-at-8.11.55-PM-150×150.png”/><p>在编码和技术问题解决中，速度和准确性之间的权衡一直是一个挑战，当寻找复杂问题的答案时，开发人员经常需要快速可靠的帮助。</p><p>GPT-4经常面临较慢的响应时间问题。获得答案的延迟可能会影响生产力。</p><p>Phind的v7模型超过了GPT-4的编码能力，而且速度非常快。Phind模型的响应时间提高了5倍，只需10秒钟即可提供高质量的技术问题答案，相比其前身需要50秒的等待时间，有了显著的改进。</p><p>Phind模型现在已经进入第7代，该模型是基于CodeLlama-34B优化而建立的，是第一个在HumanEval得分中超过GPT-4的模型。这个新模型经过了700亿个高质量代码和推理问题的令人印象深刻的优化。虽然它获得了显著的HumanEval分数达到了74.7％，但值得注意的是，真实世界中的有用性往往超越这些指标。通过全面的反馈收集和用户体验，Phind模型已经证明了在实际编码场景中，能够始终达到或超过GPT-4的效用。</p><p>Phind模型的一大亮点是其速度。通过利用NVIDIA的H100s和TensorRT-LLM库的强大功能，它可以在单个流中每秒处理100个标记，为需要帮助的用户提供快速的协助。</p><p>此外，Phind模型在响应中提供了广泛的上下文支持，支持高达16,000个标记。目前，该模型允许在网站上输入最多12,000个标记，其余4,000个用于基于网络的结果。</p><p>尽管Phind模型提供了实质性的好处，在某些方面仍需要改进。一个值得注意的挑战是一致性，特别是处理复杂问题时。在这些情况下，Phind模型可能需要更多的迭代才能得出正确答案，而GPT-4则不同。</p><p>总之，Phind模型是解决高效可靠编码辅助的持续问题的一种有希望的解决方案。它集合了卓越的编码能力，显著的速度和广泛的上下文支持，为用户提供了真实世界的帮助。随着这个模型的不断发展和解决剩余的挑战，它有潜力在回答技术问题的方式上实现革命性的改变，为开发人员和技术爱好者提供更高效和生产力的编码体验。</p><p>本文发表在<a href=”https://www.xiaozhuai.com/chinese-ai-researchers-have-proposed-4k4d-a-4d-point-cloud-representation-that-enables-hardware.html”>xiaozhuai.com</a>上，原文标题《Phind的新AI模型在编码方面超越了GPT-4，速度和16k上下文类似于GPT-3.5》。</p><p>本文首发于<a href=”/?s=MarkTechPost”>MarkTechPost</a>。</p>

Leave a Comment

LLM革命：改变语言模型

Published November 9, 2023 by 四海吧

介绍在过去几年中，语言模型领域经历了一场巨大的演变，特别是随着大规模语言模型（LLMs）的出现。这些模型具备数十亿个参数和对自然语言的深刻理解，对于改变人工智能领域起到了关键作用。今天，我们将探索这场革命，重点介绍从闭源到开源LLMs的转变，精细调整的重要性以及最近出现的高效调整技术的发展。学习目标：了解闭源和开源LLMs的区别。了解LLMs中的传统和参数高效调整。探索不同的参数高效调整策略。学习使用Ludwig进行高效调整。闭源vs开源LLMs：选择正确的方法语言模型领域存在着闭源模型（如OpenAI的ChatGPT、GPT 3.5和GPT 4）和开源变种（如Meta、Google和各种研究实验室提供的）之间的两极分化。闭源LLMs由于其管理基础设施和快速概念验证能力，成为一个引人注目的起点。这些模型提供高质量的预训练数据集，并且无需设置基础设施，使得那些探索LLMs能力的人可以轻松入门。然而，尽管闭源LLMs易于获取，但它们存在根本性的局限性。它们缺乏模型所有权和极少的自定义能力，特别是对于数据隐私和模型控制至关重要的领域，这使得闭源LLMs不太适合长期投资。相比之下，开源LLMs提供了一个有希望的替代方案。它们使得完全拥有模型和自定义成为可能，并便利地获得开源空间中的创新发展。而付出的代价则是主机费用和困难。传统微调和参数高效微调微调成为了最大化LLMs潜力的关键过程，特别是考虑到特定领域任务的情况下。闭源模型常常缺乏所需的灵活性进行微调，而开源模型则可以完全控制这个过程。微调允许通过更新模型权重将预训练的LLMs适应于特定任务，从而提高性能。这是将这些通用模型个性化为专用应用的手段，为独特任务优化性能。关于微调和类似检索增强生成（RAG）模型之间的辩论，重点在于是否需要针对具体任务进行定制的模型，而非通用智能模型。开源LLMs的性质允许自定义和高效微调以实现卓越的任务特定性能。传统微调涉及更新所有模型参数，这一过程已被证明是资源密集型、耗时且不总能获得最佳的任务特定性能。然而，参数高效微调的最新创新取得了突破。通过冻结预训练LLM并仅训练一小部分特定任务层（不到总模型权重的1%），高效微调变得既节约资源又更有效。向参数高效微调的转变显著影响了LLMs如何适应特定任务。通过仅关注训练少量特定任务层，这个过程变得更具成本效益和高效性。这种创新方法在较小数据集上实现了最佳任务特定性能，展示了开源LLMs相对于闭源模型的潜力。 Meta等人的LIMA论文等研究支持了在较小数据集上进行微调可以超越GPT 4等闭源模型性能的观点。这种通过较少数据实现更多的概念的概念突出了开源LLMs在适当微调下的效率和效果。理解高效训练策略在利用预训练模型进行特定任务时，LoRA（低秩自适应）和QLoRA（量化低秩自适应）已经成为有效微调大型语言模型（LLMs）的创新方法。这些方法对于将预训练模型定制为专用任务而最小化附加参数非常重要。 LoRA：对体系结构的深入研究 LoRA的体系结构涉及低秩分解，通过将变压器架构中的大型权重矩阵分解为较小矩阵来实现。在变压器的上下文中，LoRA专注于查询，键和值线性投影。通常，这些线性投影具有大的权重矩阵，例如1024×1024，LoRA将其分解为较小的矩阵，例如1024×8和8×1024。这些较小的矩阵相乘，可以产生原始的维度。这种压缩大大减少了可调参数的数量，约为总LLM参数的一半到1%。在变压器体系结构的上下文中，LoRA为键和查询投影层集成了适配器模块。这些通过低秩分解构造的适配器保持了原始形状，同时使其能够插入到变压器层中。基本层保持冻结状态，只有适配器权重是可训练的。…

Continue reading

Leave a Comment

Core42和Cerebras发布Jais 30B，为阿拉伯语大型语言模型设定了新的基准

Published November 9, 2023 by 四海吧

Cerebras和Core42（G42公司和总部位于阿联酋的全国性云和生成AI赋能机构）宣布推出 Jais 30B，这是其开源阿拉伯大型语言模型（LLM）的最新和最精细版本。 Jais 30B是其上一版本Jais 13B的重大升级，Jais 13B于2023年8月发布。新模型具有300亿个参数，而Jais 13B只有130亿个，并且它是在更大的数据集上进行训练的。这导致在语言生成、摘要和阿拉伯-英语翻译方面取得了显著的改进。 Jais 30B现已与单语英语模型持平，并在基础模型评估中胜过大多数开源模型。该模型还能够用阿拉伯语和英语生成更长、更详细的回答。 Core42致力于负责任和安全的AI实践，Jais 30B开发团队进一步加强了其过程和政策，以监管模型产生偏见、仇恨或有害内容的情况。 Jais 30B可在Hugging Face上下载。 Hugging Face基础模型：https://huggingface.co/core42/jais-30b-v1 Hugging Face聊天模型：https://huggingface.co/core42/jais-30b-chat-v1 Jais 30B的推出是Core42和阿拉伯语世界的重要里程碑。该模型有可能彻底改变我们在阿拉伯语中的沟通、学习和工作方式。该文章由MarkTechPost发布：作者：Core42和Cerebras发布了Jais 30B，创造了阿拉伯大型语言模型的新标杆。

Leave a Comment

解读隐藏马尔可夫模型的力量

Published November 9, 2023 by 四海吧

介绍你是否曾经思考过智能手机语音识别的机制，以及天气预报的复杂性？如果是的话，你可能会对隐藏马尔可夫模型（HMM）所起的关键作用感到好奇。这些数学结构在语音识别、自然语言处理和生物信息学等领域产生了深刻的变革，使系统能够解开顺序数据的复杂性。本文将简要介绍隐藏马尔可夫模型、它们的应用、组成部分、解码方法等内容。学习目标了解隐藏马尔可夫模型（HMM）的基本组成部分，包括状态、观测、转移概率、发射概率和初始状态概率。探索HMM的主要解码算法：前向算法、维特比算法和鲍姆-韦尔奇算法，以及它们在语音识别、生物信息学等领域的应用。认识到HMM的局限性和挑战，并学会如何减轻这些问题，比如对初始化的敏感性、独立性假设和数据数量需求。隐藏马尔可夫模型来源：Wisdom ML 隐藏马尔可夫模型（HMM）是由Baum L.E.于1966年引入的强大统计模型。它们利用观察数据揭示了马尔可夫过程中的隐藏状态。HMM在语音识别、字符识别、移动通信、生物信息学和故障诊断等领域起着关键作用。它们通过概率分布将关注事件和状态之间的差距连接起来。HMM是双重随机的，结合了一个主要的马尔可夫链和连接状态和观测的过程。它们在解码监控数据的趋势、适应变化的模式以及包含季节性等元素方面表现出色。在时间序列监视中，HMM是无价的，甚至可以扩展到空间信息应用。 HMM的应用由于其对顺序数据和隐藏状态建模的能力，隐藏马尔可夫模型（HMM）在多个领域有着广泛的应用。让我们探索HMM在不同领域的应用：使用步态进行人类识别：HMM在基于独特步态模式识别个体的身份方面发挥着重要作用。通过对人们独特的行走风格建模，HMM可以帮助区分一个人和另一个人。这个应用在安全系统和访问控制中至关重要，通过融合人类步态分析来增强生物特征识别方法。从时间顺序图像中识别人类动作：HMM在识别和分类从顺序图像或视频帧中的人类动作方面至关重要。通过捕捉不同姿势和动作之间的时间依赖性和转换，HMM可以准确地识别个人的各种活动。这个应用在监视、视频分析和体育表现评估等领域广泛应用。通过视频识别面部表情：在情感计算和人机交互中，HMM用于分析视频中的面部表情。通过捕捉面部肌肉运动和表情的时间动态，它们帮助识别和解释情绪和情绪变化。这个应用对于理解用户体验、情感反应和各种交互系统中的非语言沟通线索至关重要。 HMM的基本组成部分隐藏马尔可夫模型（HMM）具有定义其结构和功能的几个基本组成部分。了解这些组成部分对于有效地使用HMM非常重要。以下是HMM的基本组成部分：状态（S）观测（O）转移概率（A）发射概率（B）初始状态概率（π）状态空间（S）观测空间（O）…

Continue reading

Leave a Comment

这篇人工智能研究介绍了PERF：将单张图像转化为可探索的3D场景的全景NeRF变换

Published November 9, 2023 by 四海吧

NeRF代表神经辐射场，是一种基于深度学习的三维场景重建和视图合成技术。为了准确地构建三维表示，通常需要多张场景的图像或视图。 NeRF包括一组从不同视点拍摄的场景图片。 NeRF已经激发了扩展和改进，例如NeRF-W，旨在使其更加高效、准确，并适用于各种场景，包括动态场景和实时应用。其变种对计算机视觉、计算机图形和三维场景重建领域都产生了重要影响。然而，如果只有一张图片并且想要融入3D先验知识，就需要改善三维重建的质量。目前的技术限制了视野范围，这极大地限制了其在面对真实世界的360度全景场景和大尺寸情况下的可扩展性。研究人员提出了一种名为PERF的360度全景新视图合成框架。其中PERF代表全景神经辐射场。他们的框架通过单个全景图来训练一个全景神经辐射场。全景图是通过捕捉多张图像，通常是连续的，然后将它们拼接在一起形成一个无缝的广角景观、城市景观或其他场景的表示。团队提出了一种协同RGBD修复方法，用于完成可见区域的RGB图像和深度图的修复。他们还训练了一个单目深度估计器，用于生成从输入全景图中不可见的新奇外观和三维形状。从单个全景图中训练一个全景神经辐射场（NeRF）是一个具有挑战性的问题，原因是缺乏三维信息、大尺寸对象遮挡、重建和生成的耦合问题以及在填充期间可见区域和不可见区域之间的几何冲突。为了解决这些问题，PERF包括三个步骤：1）获得带深度监督的单视角NeRF训练；2）协同RGBD修复感兴趣区域；3）使用渐进式填充和抹除生成。为了优化感兴趣区域的深度图预测并使其与整体全景场景一致，他们提出了填充和抹除方法，该方法通过从随机视角填充不可见区域并从其他参考视图中观察到的冲突几何区域进行抹除，以获得更好的三维场景完成。研究人员在Replica和PERF-in-the-wild数据集上进行了实验。他们证明了PERF实现了最新的单视角全景神经辐射场技术。他们表示PERF可以应用于全景到三维、文本到三维和三维场景风格化任务，以获得令人惊叹的结果和几个有前景的应用。 PERF显著提高了单镜头NeRF的性能，但严重依赖深度估计器和稳定扩散的准确性。因此，团队表示未来的工作将包括改进深度估计器和稳定扩散模型的准确性。

Leave a Comment

达尔塔湖-分区、Z-Order和Liquid聚类

Published November 9, 2023 by 四海吧

Big Data的一个让其变得困难的因素一直都是它的名字，就是它是大的尤其是在合理划分的情况下，划分一直都是提升大量查询执行速度的一种方式……

Continue reading

Leave a Comment

“搜索中的生成式人工智能扩展至120多个新的国家和地区”

Published November 8, 2023 by 四海吧

“搜索中的生成AI，或搜索生成体验（SGE），正扩展到全球，并新增了四种新语言”

Continue reading

Leave a Comment

使用MONAI Deploy在AWS上构建医学影像AI推理流程

Published November 8, 2023 by 四海吧

在这篇文章中，我们向您展示如何创建一个可在使用MONAI Deploy App SDK构建的应用程序中重复使用的MAP连接器，以与AWS HealthImaging集成并加速从云原生DICOM存储中检索图像数据，用于医学影像人工智能工作负载MONAI Deploy SDK可用于支持医院运营我们还演示了两种托管选项，以便在SageMaker上大规模部署MAP AI应用程序

Continue reading

Leave a Comment

用亚马逊CodeWhisperer进行可持续优化

Published November 8, 2023 by 四海吧

这篇文章探讨了亚马逊CodeWhisperer如何通过提高资源效率来帮助代码优化，从而实现可持续发展计算资源高效编码是一种旨在减少处理一行代码所需能源量的技术，从而帮助公司整体消耗更少能源在这个云计算时代，[…]

Continue reading

Leave a Comment

NVIDIA与APEC经济体合作，改变人们的生活，增加机会，改善结果

Published November 8, 2023 by 四海吧

在越南，当病人进入医疗机构感到困扰时，医生利用英伟达技术进行更准确的扫描以诊断他们的疾病。在香港，另一组医生利用生成式人工智能发现治疗患者的新方法。改善市民的健康和福祉，增强经济和社区的发展是2023年亚太经济合作组织（APEC）峰会即将在旧金山召开的关键主题。当他们会面讨论改善市民和社会生活的大胆解决方案时，英伟达的人工智能和加速计算项目是一个关键的推动者。英伟达致力于改善日常人群的结果，同时解决未来的挑战，这是多年来与APEC合作伙伴的深度投资的积累。英伟达在该地区的业务非常强大，包括数以千计的员工和在农业、医疗保健和教育等领域的众多合作项目，致力于提供新技术和员工培训计划，以增强产业发展和推进生成式人工智能研究。除了技术进步，这些努力还推动经济增长，创造高薪工作机会，并提高全球人民的健康和福祉。研究和国家计算合作伙伴关系英伟达与几个APEC经济体建立了先进的人工智能研究合作伙伴关系。这些合作促进人工智能和高性能计算方面的科学突破，以应对包括医疗保健、技能发展和创建更强大的本地人工智能生态系统等国家挑战。例如：澳大利亚的国家科学与研究机构CSIRO与英伟达合作，推进澳大利亚的人工智能计划，涵盖气候行动、空间探索、量子计算和人工智能教育等领域。新加坡的国家超级计算中心和教育部与英伟达合作，重点推动主权级人工智能能力发展，特别关注医疗保健、气候科学和数字孪生等领域。泰国是东南亚首个参与英伟达“人工智能国家”项目的国家，将教育部与一系列顶尖大学的联盟组织在城市规划、公共卫生和自动驾驶等领域开展公私合作。在越南，英伟达与越南最大的雇主Viettel以及越南科学技术学院合作，提升员工技能，加速将人工智能服务引入工业，部署下一代5G服务。创新生态系统创业公司是人工智能创新的前沿，健康的创业公司生态系统对于推动APEC经济体内的技术发展至关重要。英伟达加速是一个免费计划，帮助创业公司更快地创新。通过该计划，英伟达支持APEC内的5000多家创业公司，并且全球支持超过15000家创业公司，提供尖端技术、与风险投资家的联系，以及最新的技术资源。在2023年，英伟达将近1000家APEC地区的创业公司加入了该计划。除了创造经济机会，加速还支持中小型企业开发创新解决方案来应对社会面临的一些最大挑战。以下是其中一些成员的情况：在马来西亚，Tapway使用人工智能技术来减少拥堵，为每天超过100万名乘客提供交通资源优化。在新西兰，Lynker利用地理空间分析、深度学习和遥感技术进行地球观测。Lynker的技术可以测量农场的碳吸收情况，检测、监测和恢复湿地，并实现更有效的灾害救援。在泰国，AltoTech Global与加速合作伙伴，将人工智能软件与物联网设备整合，优化酒店、建筑、工厂和智能城市的能源消耗。AltoTech的最终目标是为实现零碳经济做出贡献，并帮助客户实现零碳目标。数字技能提升和增长工具英伟达深度学习研究所（DLI）提供人工智能培训和数字技能提升计划，培养创新并创造经济机会。 DLI的培训和认证计划旨在帮助个人和组织加快在人工智能、高性能计算和工业数字化方面的技能发展和劳动力转型。课程由NVIDIA专家创建和教授，提供实践操作、自主学习和带领学习的方式，将现实世界的经验和深厚的技术知识带给开发人员和IT专业人员。通过该计划，NVIDIA已经培训了超过11.5万名APEC经济体的个人，其中今年有超过1.6万名新学员。此外，NVIDIA开发者计划为APEC经济体的200多万开发人员提供软件开发工具包、应用程序接口、预训练的人工智能模型和性能分析工具，帮助开发人员创造和创新。会员可以免费获得实际操作的培训、访问开发者论坛以及提前获得新产品和服务的权限。…

Continue reading

Leave a Comment

医生在患者护理中与人工智能搏斗

Published November 8, 2023 by 四海吧

美国食品和药物管理局对人工智能工具的批准引发了医生对其改善病患护理能力的质疑

Continue reading

Leave a Comment

回归、个性化和Kaggle综合征

Published November 8, 2023 by 四海吧

最近，我做了一个使用Kaggle黑色星期五预测数据集进行预测案例研究的工作，该数据集创建于六年前，已经下载了超过32,000次虽然有超过100…

Continue reading

Leave a Comment

如何构建基于计算机视觉的汽车损伤检测系统

Published November 8, 2023 by 四海吧

让我们探索设计双模型计算机视觉解决方案的原则，并评估Mask R-CNN和U-Net人工智能算法的能力

Continue reading

Leave a Comment

通过CloudWatch的高级指标、仪表板和警报优化AWS成本

Published November 8, 2023 by 四海吧

在这篇文章中，我们深入探讨如何利用Amazon CloudWatch的先进仪表板来高效地管理和分析AWS的成本

Continue reading

Leave a Comment

30/10至5/11每周最重要的LLM论文

Published November 8, 2023 by 四海吧

大型语言模型（LLMs）近年来发展迅速随着新一代模型的开发，研究人员和工程师保持对最新进展的了解非常重要…

Continue reading

Leave a Comment

“我如何利用ChatGPT和人工智能在线赚钱”

Published November 8, 2023 by 四海吧

仅在过去的一年中，我将我的线上内容扩展到超过10万名读者，创建了我的第一个Udemy课程，推出了一个YouTube频道，并正在出版我的第一本电子书这一切都源于我的热爱和对美丽时尚的丰富知识

Continue reading

Leave a Comment

这项AI研究介绍了Atom：一种用于高效准确的大型语言模型（LLM）服务的低位量化技术

Published November 8, 2023 by 四海吧

“`html 大型语言模型是人工智能领域最近的引进，已经席卷全球。这些模型由于其令人难以置信的能力，被所有人使用，包括研究人员、科学家甚至学生。凭借其模仿人类的能力，能够回答问题、生成内容、摘要文本、完成代码等等，这些模型已经走过了很长的路程。大型语言模型在许多领域中都是必需的，包括情感分析、智能聊天机器人和内容创作。由于它们使用了大量的计算资源，因此有效地利用GPU资源来增加吞吐量。这是通过批处理多个用户请求来完成的，并且为了进一步提高内存利用率和计算能力，使用了大型语言模型量子化技术。然而，现有的量子化方法，如8位权值激活量子化，并没有充分利用新一代GPU的能力。由于这些GPU上的整数运算器是4位的，因此目前的量子化技术并不是为了最大的效率而设计的。为了解决这个问题，一组研究人员引入了Atom，这是一种新的方法，可以最大化大型语言模型的吞吐量。Atom是一种低位量化技术，旨在大幅提高吞吐量而不损失精度。它使用低位运算符和低位量化来减少内存使用，以实现这一目标。它使用一种特殊的细粒度和混合精度量化的组合来保持卓越的准确性。研究团队分享了Atom在4位权值激活量化配置上的评估结果。结果显示，与典型的16位浮点（FP16）方法相比，Atom可以在相同的目标范围内保持延迟，并且将端到端吞吐量提高了最多7.73倍；相比于8位整数（INT8）量化，吞吐量提高了2.53倍。这使得Atom成为应对日益增长的服务需求的可行解决方案，因为它可以保持期望的响应时间水平，并大大提高大型语言模型处理请求的速度。研究人员总结了主要贡献如下。对大型语言模型的服务进行了全面分析，这是研究性能分析的第一步。确定了使用低位权值激活量化方法的重要性能优势。提出了一种独特而精确的低位权值激活量化技术，名为Atom。研究团队分享Atom采用了多种策略来确保最佳性能。它使用混合精度，对其余关键激活和权重使用降低精度，同时保持前者的准确性。使用了细粒度组量化来减少量化过程中的错误。 Atom采用动态激活量化，通过调整每个输入的独特分布来减少量化错误。为了进一步提高整体性能，该方法还处理了KV缓存的量化。研究还提出了一种长期管理（LLM）服务的综合框架。研究团队共同设计了一种有效的推理系统，构建了低位GPU内核，并在实际环境中展示了Atom的有用端到端吞吐量和延迟。对Atom的性能进行了全面评估，结果显示Atom大大提高了LLM服务的吞吐量，以最小化精度损失为代价，吞吐量提高了最多7.7倍。 “`

Leave a Comment

VoAGI 新闻，11 月 8 日：掌握 Python、SQL、Scikit-learn、PyTorch 和 Google Cloud 的 5 个简单步骤 • 数据可视化的 SQL

Published November 8, 2023 by 四海吧

本周在VoAGI上：深入研究VoAGI回到基础：通过5个步骤入门系列，帮助您掌握Python、SQL、Scikit-learn、PyTorch和Google Cloud Platform • 活用SQL在数据可视化中的威力：掌握为有影响力的图表和图形准备数据的艺术 • 而且…

Continue reading

Leave a Comment

亚马逊 vs 阿里巴巴：会话人工智能巨头之战

Published November 8, 2023 by 四海吧

在技术不断发展的世界中，两个全球巨头将在对话人工智能领域展开激烈竞争。电商巨头亚马逊和中国科技巨头阿里巴巴正积极改变以人工智能驱动的互动方式。在这篇博客中，我们将深入探讨这些发展的关键点以及他们主导对话人工智能市场的努力所带来的影响。亚马逊的奥林匹斯-挑战者亚马逊对创新并非陌生，在对话人工智能领域的最新尝试就是这种追求卓越的明证。他们即将发布的大型语言模型奥林匹斯，将与OpenAI和微软等行业领导者展开竞争。这不仅仅是为了增强他们的在线零售平台，奥林匹斯还将为Alexa语音助手提供动力，丰富Echo等设备的功能，并支持亚马逊网络服务(AWS)。舞台已经搭好，亚马逊已经准备好迎接挑战。巨人的挑战在亚马逊推进奥林匹斯的同时，AWS此前的产品Titan因其表现不及OpenAI的ChatGPT等语言模型技术而面临延迟。奥林匹斯的完成和部署时间表尚不确定，但亚马逊决心将强大的对话人工智能解决方案带到市场上。随着企业客户寻求先进的人工智能技术，奥林匹斯与竞争对手之间的战斗势必会异常激烈。阿里巴巴的同一千问2.0-中国竞争者为不甘示弱，云计算和电商领域的重要参与者阿里巴巴在对话人工智能领域取得了进展。他们最近推出了最新的大型语言模型同一千问2.0。在人工智能的宏大框架中，大型语言模型是生成式人工智能应用的基础，类似于OpenAI开发的著名ChatGPT。阿里巴巴的同一千问2.0被描述为较其前身的重大进展，意味着其意图与包括亚马逊和微软在内的美国技术对手竞争。全球对决随着亚马逊和阿里巴巴都力图争取人工智能霸权，对话人工智能市场正走向全球对决。这些科技巨头拥有资源、专业知识和决心，可以重新定义我们与以人工智能驱动的系统互动的方式。随着企业客户越来越需求先进的对话人工智能解决方案，这些行业巨头之间的竞争将无疑塑造这个新兴领域的未来。我们的观点亚马逊的奥林匹斯和阿里巴巴的同一千问2.0展示了对话人工智能领域的激烈竞争。随着消费者和企业从日益复杂的人工智能应用中受益，我们预测技术的未来将充满活力和令人兴奋。在这些巨人之间的竞争不断升级的过程中，可以明显看到对话人工智能的创新和进步将继续以深刻的方式塑造我们的数字互动。我们期待着见证这些卓越人工智能的演变。

Leave a Comment

在HuggingFace中的数据整理者

Published November 8, 2023 by 四海吧

当我开始学习HuggingFace时，数据收集器对我来说是最不直观的组件之一我很难理解它们，而且我找不到足够好的资源来解释它们…

Continue reading

Leave a Comment

Cohere AI发布Cohere’s Embed v3模型：根据可信的MTEB和BEIR基准提供先进的性能

Published November 8, 2023 by 四海吧

在文本嵌入模型中，寻找最相关信息一直是一个挑战，主要是在处理质量各异的现实世界数据时。这个问题可能会让寻找有价值信息的用户感到沮丧，给开发者和应用程序带来巨大的障碍。现有解决方案尝试解决这个挑战，但它们通常需要提供最相关的信息。OpenAI的ada-002模型可能会检索与您的查询相关的文档，但可能无法有效地提供最有信息量的内容。这个限制一直是搜索引擎和检索增强的生成AI(RAG)系统等应用程序的心头之患。 Cohere研究团队发布了Cohere的Embed v3模型。它不仅可以识别与您的查询相关的内容，还可以根据信息量对其进行专业排序。 Embed v3的性能指标提供了其能力的可靠证据。在包括大规模文本嵌入基准(MTEB)和信息检索评估基准(BEIR)在内的基准测试中，Embed v3始终优于许多其他模型。它在语义搜索和多跳问题等任务中表现出色，这些任务需要从各种文档中综合信息。 Embed v3的一大亮点是其高效性。它需要一个可管理的基础架构，以有效地处理数十亿个嵌入。它引入了一个名为input_type的有趣特性，为特定任务量身定制模型，进一步提高结果的质量。此外，Embed v3的适用性不仅局限于英语。它支持100多种语言，使用户能够在各种语言中进行搜索，无论是法语、中文还是芬兰语。总而言之，Cohere的Embed v3是在文本数据中筛选出最相关和信息丰富内容的有价值解决方案。它通过高效地识别和排序有价值的信息，提供了一种可靠的方法来增强搜索应用程序和RAG系统。Embed v3简化了对广阔信息世界的导航，使搜索体验更加高效和富有成效。凭借其令人印象深刻的性能、处理混乱数据的韧性和经济高效的操作，Embed v3成为文本嵌入领域的重大进步，满足了开发者和用户的需求。要尝试它，请立即访问Embed v3。

Leave a Comment

推出Prodigy-HF：与Hugging Face直接集成

Published November 8, 2023 by 四海吧

Prodigy是由Explosion制作的注释工具，这家公司作为spaCy的创作者而广为人知。这是一个完全可脚本化的产品，拥有庞大的用户社区。该产品具有很多特点，包括与spaCy的紧密集成以及主动学习能力。但产品的主要特点是它可以通过Python进行自定义编程。为了促进这种可定制性，Explosion开始发布插件。这些插件以开放的方式与第三方工具进行集成，鼓励用户开发定制的注释工作流程。然而，有一个特定的定制功能值得明确庆祝。上周，Explosion推出了Prodigy-HF，它提供了与Hugging Face堆栈直接集成的代码示例。在Prodigy支持论坛上，这是一个备受期待的功能，所以我们非常兴奋地将其推出。特点首个重要特点是这个插件允许您在已注释的数据上训练和重用Hugging Face模型。这意味着如果您一直在我们的界面上注释命名实体识别数据，您可以直接对BERT模型进行微调。 Prodigy命名实体识别界面的外观。安装该插件后，您可以从命令行调用hf.train.ner配方，直接在自己的数据上训练一个转换器模型。 python -m prodigy hf.train.ner fashion-train,eval:fashion-eval path/to/model-out –model “distilbert-base-uncased” 这将对您在Prodigy中存储的数据集对distilbert-base-uncased模型进行微调，并保存到磁盘上。同样，该插件还通过非常相似的接口支持文本分类模型。 python -m prodigy hf.train.textcat fashion-train,eval:fashion-eval path/to/model-out –model “distilbert-base-uncased”…

Continue reading

Leave a Comment

In Chinese, the translation of ‘Vision via Sound for the Blind’ would be 阳光无障碍 – 用声音看见世界.

Published November 8, 2023 by 四海吧

科学家们已经创造出了“声波触觉”技术，利用声音帮助盲人“看到”

Continue reading

Leave a Comment

贝恩吉奥因科学与工程获得格哈德·赫尔茨贝格加拿大金奖章

Published November 8, 2023 by 四海吧

该奖项每年授予在加拿大从事自然科学或工程领域的个人，以表彰其在工作中持之以恒的卓越表现和影响力

Continue reading

Leave a Comment

OpenAI宣布更大、更糟糕、更奇怪的聊天机器人

Published November 8, 2023 by 四海吧

GPTs 承诺让用户创建自己的全定制聊天机器人，无需编码经验

Continue reading

Leave a Comment

用你的笔记本电脑开启数据科学的潜能

Published November 8, 2023 by 四海吧

作为一名数据科学家，您知道拥有一台可靠且高效的笔记本电脑对于处理项目所需的所有任务和工具有多么重要无论您是在处理大型数据集还是进行复杂的数据分析，这台笔记本电脑都能轻松应对

Continue reading

Leave a Comment

将VSCode与Databricks集成以构建和运行数据工程管道和模型

Published November 8, 2023 by 四海吧

使用Databricks集群本地开发数据工程管道和机器学习模型将Databricks与VSCode集成，以实现更顺畅的开发

Continue reading

Leave a Comment

定制GPT已经来了，将影响所有人工智能领域

Published November 8, 2023 by 四海吧

OpenAI凭借最新突破——自定义GPT（通用预训练模型），位居创新前沿这项开创性发展引领着个性化数字助理的新时代，其中ChatGPT的技术威力被用于以前所未有的精确度满足个人需求和职业要求说到底，自定义GPT是ChatGPT亲切熟悉的版本或代理，[…]

Continue reading

Leave a Comment

现在，我们为什么要关心推荐系统呢？使用汤普森抽样进行轻松入门

Published November 8, 2023 by 四海吧

我今天又发现自己继续连续第100…01天拿着我的晚饭盒却没有打开，一边在浏览Netflix寻找一部节目，一边啃着食物我的推荐内容是…

Continue reading

Leave a Comment

Web Analytics