Press "Enter" to skip to content

8 search results for "Jin Ha Lee"

释放领域特定LLMs的潜力

介绍 大型语言模型(LLMs)已经改变了整个世界。特别是在人工智能社区中,这是一个巨大的飞跃。几年前,建立一个能够理解和回复任何文本的系统是不可想象的。然而,这些能力是以牺牲深度为代价的。通才型的LLMs是万能的,但却无所专精。对于需要深度和精确性的领域来说,如幻觉等缺陷可能是代价高昂的。这是否意味着医学、金融、工程、法律等领域永远无法享受到LLMs的好处?专家们已经开始构建专门针对这些领域的专用领域LLMs,利用了与自监督学习和RLHF相同的基本技术。本文探讨了专用领域LLMs及其产生更好结果的能力。 学习目标 在我们深入技术细节之前,让我们概述本文的学习目标: 了解大型语言模型(LLMs)的概念,了解它们的优势和好处。 了解流行通才型LLMs的局限性。 了解什么是专用领域LLMs以及它们如何帮助解决通才型LLMs的局限性。 探索构建专用领域语言模型的不同技术,并通过示例展示它们在法律、代码补全、金融和生物医学等领域的性能优势。 本文作为数据科学博文的一部分发表。 什么是LLMs? 大型语言模型(LLM)是一个包含数亿到数千亿个参数的人工智能系统,旨在理解和生成文本。训练过程涉及将模型暴露于来自互联网文本(包括书籍、文章、网站和其他书面材料)的许多句子,并教导它预测句子中的掩码词或后续词。通过这样做,模型学习了其训练文本中的统计模式和语言关系。它们可以用于各种任务,包括语言翻译、文本摘要、问答、内容生成等。自从Transformer被发明以来,已经构建和发布了无数个LLMs。最近流行的LLMs的一些例子包括Chat GPT、GPT-4、LLAMA和Stanford Alpaca,它们取得了突破性的性能。 LLMs的优势 LLMs已经成为语言理解、实体识别、语言生成等问题的首选解决方案。在GLUE、Super GLUE、SQuAD和BIG基准测试等标准评估数据集上取得的出色表现反映了这一成就。BERT、T5、GPT-3、PALM和GPT-4发布时都在这些标准测试中取得了最先进的结果。GPT-4在BAR和SAT等方面的得分超过了普通人。下图(图1)显示了大型语言模型出现以来在GLUE基准测试中的显著改进。 大型语言模型的另一个主要优势是其改进的多语言能力。例如,训练了104种语言的多语言BERT模型在不同语言上展现出了很好的零-shot和few-shot结果。此外,利用LLMs的成本变得相对较低。出现了一些低成本的方法,如提示设计和提示调整,可以确保工程师可以以较低的成本轻松利用现有的LLMs。因此,大型语言模型已成为基于语言的任务的默认选择,包括语言理解、实体识别、翻译等。 通才型LLMs的局限性 大多数流行的LLMs,如上述提到的那些,是训练于互联网文本、书籍、维基百科等各种文本资源的通才型LLMs。这些LLMs有多种应用,包括搜索助手(使用GPT-4的Bing Chat,使用PALM的BARD)、内容生成任务(如编写营销邮件、营销内容和销售演讲稿)以及问答任务(如个人聊天机器人、客户服务聊天机器人等)。 尽管通才型人工智能模型在理解和生成各种主题的文本方面表现出色,但它们有时需要更深入、更细致的专业领域知识。例如,“债券”是金融行业的一种借贷形式。然而,通用语言模型可能无法理解这个独特的短语,并将其与化学中的债券或两个人之间的债券混淆。相反,专门针对特定使用案例的LLMs对与特定行业相关的术语有专门的理解,能够正确解释行业特定的概念。 此外,通用语言模型(LLMs)存在多个隐私挑战。例如,在医学LLMs的情况下,患者数据非常重要,将此类机密数据暴露给通用LLMs可能会违反隐私协议,因为RLHF等技术的存在。另一方面,专业领域的LLMs采用封闭框架,以避免数据泄露。 同样,通用LLMs容易出现严重的幻觉问题,因为它们往往是为创意写作而量身定制的。而专业领域的LLMs在领域特定的基准测试中表现更加精确,并且性能显著更好,如下面的应用案例所示。 专业领域的LLMs 在特定领域的数据上训练的LLMs被称为专业领域的LLMs。领域这个术语可以涵盖从特定领域(如医学、金融等)到特定产品(如YouTube评论)的任何内容。专业领域的LLMs旨在在领域特定的基准测试上表现最佳;通用基准测试不再关键。构建专用语言模型的方法有多种。最常见的方法是将现有的LLMs进行微调以适应特定领域的数据。然而,对于追求在利基领域中达到最先进性能的用例来说,预训练才是正确的选择。…

Leave a Comment

谷歌在ICML 2023

由谷歌的程序经理Cat Armato发布 谷歌的各个团队在机器学习(ML)领域积极开展研究,涉及理论和应用等方面。我们构建ML系统来解决语言、音乐、视觉处理、算法开发等领域的深度科学和工程挑战。我们通过开源工具和数据集、发表论文以及积极参与会议,致力于与更广泛的ML研究社区建立更协作的生态系统。 谷歌很自豪成为第40届国际机器学习大会(ICML 2023)的钻石赞助商,这是一场世界一流的年度会议,本周在夏威夷檀香山举行。作为ML研究的领导者,谷歌在今年的会议上有超过120篇被接受的论文,并积极参与多个研讨会和教程。谷歌还自豪地成为拉丁裔AI和机器学习女性研讨会的白金赞助商。我们期待与更广泛的ML研究社区分享我们广泛的ML研究,并扩大我们的合作伙伴关系。 已注册ICML 2023吗?我们希望您能访问谷歌展位,了解解决该领域最有趣挑战的激动人心的工作、创造力和乐趣。请访问@GoogleAI的Twitter账号,了解谷歌展位的活动(例如演示和问答环节)。请查看Google DeepMind的博客,了解他们在ICML 2023的技术参与。 请继续阅读以下内容,了解谷歌在ICML 2023的研究成果(谷歌相关机构以粗体显示)。 委员会和组织委员会 委员会成员包括:Corinna Cortes,Hugo Larochelle。教程主席包括:Hanie Sedghi 谷歌研究展位活动 演讲者:Bryan Perozzi,Anton Tsitsulin,Brandon Mayer。题目:谷歌的无监督图嵌入(论文,EXPO研讨会)。时间:7月25日星期二上午10:30 HST 演讲者:Zheng Xu。题目:使用差分隐私的Gboard语言模型的联邦学习(论文1,论文2,博客文章)。时间:7月25日星期二下午3:30 HST…

Leave a Comment

愉快的一周年纪念日🤗,扩散器!

🤗 Diffusers很高兴庆祝其成立一周年!这是一个令人兴奋的一年,我们为自己取得的成就感到自豪和感激,这离不开我们的社区和开源贡献者们。去年,像DALL-E 2、Imagen和Stable Diffusion这样的文本到图像模型以其生成惊人逼真的图像能力吸引了世界的注意,引发了对生成式人工智能的巨大兴趣和发展。但是,使用这些强大模型的权限是有限的。 在Hugging Face,我们的使命是通过合作和互相帮助打造一个开放和道德的人工智能未来,以实现机器学习的民主化。这一使命激励我们创建了🤗 Diffusers库,以便每个人都可以通过它来进行实验、研究或者简单地玩转文本到图像模型。这就是为什么我们将该库设计为一个模块化的工具箱,让您可以自定义扩散模型的组件,或者直接使用它。 随着🤗 Diffusers迈入一岁,以下是我们与社区的帮助下为该库增加的一些最显著特性的概述。我们为能够成为一个积极参与、推动扩散模型超越仅文本到图像生成的可访问使用,并且在各方面都是一个灵感的社区而感到自豪和无比感激。 目录 追求逼真度 视频流程 文本到3D模型 图像编辑流程 更快的扩散模型 伦理和安全 对LoRA的支持 Torch 2.0优化 社区亮点 使用🤗 Diffusers构建产品 展望未来 追求逼真度 生成式人工智能模型以创建逼真的图像而闻名,但如果您仔细观察,您可能会注意到某些看起来不对劲的事情,比如在手上生成多余的手指。今年,DeepFloyd…

Leave a Comment

谷歌在ACL 2023

由Google计划经理Malaya Jules发布 本周,第61届计算语言学协会(ACL)年会正在线上举行,ACL是一个涵盖广泛研究领域的顶级会议,主要关注计算机方法在自然语言处理中的应用。 作为自然语言处理和理解领域的领导者,Google作为ACL 2023的钻石级赞助商,将展示超过50项最新的研究成果,并积极参与各种研讨会和教程。 如果您已注册ACL 2023,我们希望您能访问Google展位,了解Google为数十亿人解决有趣问题的项目。您还可以在下方了解更多有关Google的参与情况(Google相关机构以粗体显示)。 组织委员会和筹委会 主题主席包括:Dan Garrette;研讨会主席包括:Annie Louis;出版主席包括:Lei Shu;程序委员会包括:Vinodkumar Prabhakaran、Najoung Kim、Markus Freitag 重点论文 NusaCrowd: 用于印尼自然语言处理资源的开源倡议 Samuel Cahyawijaya、Holy Lovenia、Alham Fikri Aji、Genta Winata、Bryan Wilie、Fajri…

Leave a Comment

Chrome 正在监视你,部分插件有后门

在 Twitter 上看到 Chrome Web Store 中有多达 111 个扩展秘密收集用户敏感数据,而它们被总计下载了 3296 万次,Google 官方已经将其下架。这些恶意扩展被发现会收集屏幕截图、设备剪贴板内容,用户登陆网站的浏览器 Cookies,密码等按键。绝大部分扩展都是模块化的,安装之后可以用可执行文件进行更新。 各位聚聚可以按照如下步骤操作看看自己有没有中招。 1.在 Chrome 中输入 chrome://extensions/ 打开扩展程序页面 2.在该页面按下F12,在Console 控制台中运行以下代码,回车,✅为无风险,❌为风险项 // https://awakesecurity.com/wp-content/uploads/2020/06/GalComm-Malicious-Chrome-Extensions-Appendix-B.txt malicious = […

Comments closed

Can't find what you're looking for? Try refining your search: