这个AI通讯简报就是你所需要的 #58

本周AI进展——Louie的观点

本周，我们非常高兴地看到AI在自然语言处理领域之外取得了两个新的发展。Meta AI最新的进展是他们发布的开放催化剂模拟器应用程序，该应用程序刚刚发布为演示版。通过利用AI的力量，该应用程序可以以惊人的速度预测催化剂材料的反应性，比现有方法提高了近1000倍。团队认为，这项技术有潜力显著加速成本效益材料的发现。虽然我们认为相对于蛋白质（和AlphaFold）来说，材料科学对机器学习来说是一个更复杂的领域，但我们看到类似模型在帮助研究人员筛选潜在有趣材料方面有很大潜力，尤其是在太空中。在未来，我们还希望看到发布的模型为寻找超导体做出贡献，这是本周一个潜在的突破点！

另一个令人兴奋的消息是，Google推出了机器人变形器2（RT-2）模型，他们称之为世界上第一个视觉语言行动（VLA）模型。该网络使用从网络中提取的文本和图像进行训练，使其能够直接产生机器人动作作为输出，仅需少量机器人训练数据。该模型展示出了理解复杂指令的非凡能力，例如“扔掉垃圾”。它通过进行复杂的推理来实现这一点。例如，识别香蕉皮在被消耗后变成垃圾，并自主掌握丢弃垃圾的概念，即使没有对具体任务进行明确的训练。在试验过程中，RT-2模型在未知场景中表现出了显著的性能提升，效果是其上一个版本的两倍。

在被不断涌现的NLP领域的令人兴奋的新闻包围下，本周在其他AI应用领域同样取得了两个令人振奋的进展，特别是在机器人技术和材料科学领域。我们很高兴看到最近在NLP领域取得的突破和投资热潮开始加速其他领域的进展。

– Louie Peters — Towards AI联合创始人兼首席执行官

最热门新闻

认识FreeWilly，我们的大型高级指令微调模型

Stability AI及其CarperAI实验室发布了Stable Beluga 1及其后续版本Stable Beluga 2（原名FreeWilly）。Stable Beluga 1利用了原始的LLaMA 65B基础模型，并使用了监督微调（SFT）技术进行了微调。同样，Stable Beluga 2利用了LLaMA 2 70B基础模型。这两个模型均以非商业许可的形式公开发布。

2. Stability AI宣布发布Stable Diffusion XL 1.0

Stability AI宣布发布Stable Diffusion XL（SDXL）1.0，这是其旗舰文本到图像模型套件的最新和最先进版本。SDXL是一个开放获取的图像模型，具有惊人的66亿参数模型集成管道，展示出在颜色、对比度、光照和阴影方面的显著改进。

3. Stack Overflow宣布OverflowAI

Stack Overflow正在将生成式AI集成到其平台中，推出OverflowAI。这包括使用向量数据库进行语义搜索和个性化结果。此外，他们正在增强跨不同平台的搜索功能，并为Stack Overflow for Teams引入企业知识摄取功能。

4. 介绍Bittensor语言模型——面向移动和边缘设备的最先进的30亿参数模型

Opentensor基金会和Cerebras很高兴地宣布Bittensor语言模型（BTLM），这是一种新的最先进的30亿参数语言模型，可以在内存有限的移动和边缘设备上高效运行，减少对集中式云基础设施的需求。

5. OpenAI因“低准确率”而放弃AI写作文本检测器

OpenAI决定停用其AI分类器，因为它在检测AI生成的文本方面的准确率较低。大型语言模型的快速发展使得有效识别特征或模式变得具有挑战性。

五个5分钟阅读/观看内容，让您持续学习

开源LLM的历史：更好的基础模型

本文是关于开源LLM历史的三部曲系列的第二部分。它涵盖了开源LLM的早期发展、构建更好的基础模型的当前革命以及开源LLM的当前和未来趋势等主题。

2. 使用Gradio构建生成式AI应用

Hugging Face和DeepLearning.ai推出了一门关于使用Gradio构建生成式AI应用的新短期课程。该课程侧重于使用开源语言模型创建用户友好的应用程序，项目范围包括文本摘要、图像分析和图像生成。

3. 仅需50行代码，构建适应任何数据集类型的AI图表生成器

本教程介绍了开发自动图表生成器的方法。开发人员可以使用GPT-3.5或GPT-4与Langchain轻松创建AI图表生成器，仅需50行代码。

4. 自动化网络研究

本文探讨了网络研究代理的开发。该方法包括使用LLM生成搜索查询、执行搜索、抓取页面、索引文档，并为每个查询找到最相关的结果。

5. 使用Whisper和GPT-4创建自动化会议纪要生成器

本指南探讨了开发会议纪要生成工具的方法，该工具利用Whisper和GPT-4来高效总结讨论、提取重要细节和分析情感。

论文和资源库

karpathy/llama2.c：在纯C文件中推理Llama 2

Andrew Karpathy发布了一个使用纯C实现的LLaMA 2推理的教育实现。该项目使您可以在PyTorch中训练LLaMA 2 LLM架构，然后将权重加载到单个C文件中进行高效推理。

2. 对齐语言模型的通用和可迁移攻击

最近的研究探讨了对开源和闭源语言模型进行自动构建对抗性攻击的方法，使它们容易受到有害命令的影响。这些攻击也会传递给广泛使用的聊天机器人，引发对有效修补这些漏洞的担忧。

3. FLASK：基于对齐技能集的细粒度语言模型评估

本文介绍了FLASK，这是一种专门为LLM的性能评估而设计的评估协议。它将评估细分为12个不同的技能集，允许对模型的性能进行详细分析，如逻辑鲁棒性、事实性和理解力。

4. 具备规划、长期上下文理解和程序合成功能的真实网络代理

WebAgent是一个由LLM驱动的代理，利用Flan-U-PaLM和HTML-T5增强了对真实网站的自主导航和任务完成能力。通过分解指令、摘要HTML文档和生成Python程序，它的成功率比之前的模型提高了50%。

5. WebArena：用于构建自主代理的逼真网络环境

WebArena是一个逼真的网络环境，使自主代理能够在与电子商务、社交论坛、软件开发和内容管理相关的任务中培养其技能。它为评估任务完成提供了基准，并强调了改进代理的需求，因为即使像GPT-4这样的先进模型的成功率也只有10.59%。

喜欢这些论文和新闻摘要吗？在您的收件箱中获取每日摘要！

一起学习AI社区栏目！

AI4 2023：行业领先的AI大会

这个AI通讯简报就是你所需要的 #58 四海第1张

提醒大家参加AI4 2023，这是行业领先的AI大会，将于2023年8月7日至9日在拉斯维加斯的MGM Grand举行。了解更多关于AI4的增长如何反映了AI在行业中的采用，并加入2200多名AI领导者、240位演讲者和100个尖端AI展览。申请免费通行证。

日期：2023年8月7日至9日（拉斯维加斯MGM Grand）

本周的梗！

这个AI通讯简报就是你所需要的 #58 四海第2张

梗由archiesnake分享

来自Discord的特色社区帖子

Operand已经发布了其开源Python库，用于代理集成，旨在与HF Agent API和LangChain等现有库配合使用。该库通过定义操作、回调和访问策略，使您能够将代理与软件系统和人类用户连接起来，从而实现代理的易于集成、监控和控制。Agency处理通信细节，并允许在各方之间发现和调用操作。在GitHub上查看并支持社区成员。在此线程中分享您的反馈和使用情况。

本周的AI投票！

这个AI通讯简报就是你所需要的 #58 四海第3张

在Discord上加入讨论。

TAI精选部分

本周文章

LangChain 101：第1部分。通过Ivan Reznikov构建简单的问答应用程序

LangChain是一个强大的框架，用于创建生成文本、回答问题、翻译语言和执行许多其他与文本相关的任务的应用程序。本文标志着LangChain 101课程的开始。从本文开始，作者通过向您展示如何构建自己的LangChain应用程序来讨论概念、实践和经验。

我们必读的文章

现代自然语言处理：详细概述。第3部分：BERT by Abhijit Roy

忘记GPT4的32K：LongNet具有十亿令牌上下文 by Dr. Mandar Karhade, MD. Ph.D.

用插图和PyTorch实现解释图注意力网络论文 by Ebrahim Pichka

如果您有兴趣在Towards AI上发布，请查看我们的指南并注册。如果符合我们的编辑政策和标准，我们将会在我们的网络上发布您的作品。

工作机会

软件工程师III（Drupal）@Clarity Innovations, Inc.（远程工作）

分布式系统软件工程师@INSHUR（英国布莱顿）

实习生-软件工程师实习生-ACI 01@Activate Interactive Pte Ltd（新加坡）

机器学习工程师（风险）@SHIELD（新加坡）

机器学习工程师@Robotec.ai sp. z o.o.（华沙，波兰/自由职业者）

机器学习工程师，快速优化推断@Hugging Face（美国远程）

有兴趣在这里分享工作机会吗？请联系sponsors@towardsai.net。

如果您正在为下一次机器学习面试做准备，不要犹豫，查看我们领先的面试准备网站confetti！