Press "Enter" to skip to content

这个AI通讯简报就是你需要的一切 #72

本周AI动态:Louie带你速览

本周,AI新闻主要集中在OpenAI的Devday活动以及许多新模型和功能的推出上,这使得Elon Musk先前推出的Grok GPT-3级模型在LLM竞赛中声势被掩盖。OpenAI的Devday活动包括推出了新的、更好、更快、更便宜的GPT-4 Turbo模型,通过API实现了视觉能力,集成了检索引擎,并与其他几个模型(包括Dalle-3、一种新的Whisper语音转文字以及新的文字转语音模型)进行了API集成。但该事件的意外之处在于发布了“GPTs”——一种无代码解决方案和未来的“GPT Store”应用商店,供用户通过ChatGPT构建和盈利自己定制的GPT代理。

Open AI最新一系列的发行让我们想到,这是否就是GPT-4级模型的“ChatGPT”时刻?最初的ChatGPT发布涉及对GPT-3级模型的迭代改进,以及对用户界面的重大改进,使得GPT-3在聊天机器人应用领域得到了广泛采用。这次最新的发布也有类似的感觉,但这次是针对GPT-4级模型和LLM RAG代理应用的采用,提供了更易于使用的代理构建用户界面、更快速、更便宜的模型,使LLMs实现了新的潜力。

活动结束后,我们注意到讨论主要集中在以下两个方面:1)OpenAI的激进定价和增加的功能是否会对其他AI初创公司和“GPT包装”构成威胁;2)OpenAI是否将通过新的GPT产品创建一个新的应用商店生态系统?对于第一个问题,我们可以找到支持的论点两方面。例如,OpenAI已经迎头赶上了Anthropic的Claude 2,在先前的不同化更长上下文长度(并以稍低的价格)上,推出的文本转语音API的价格明显低于Eleven Labs,同时也在文档处理和检索增强生成(RAG)生态系统领域进入了诸如Langchain等参与者的领域。然而,他们也发布了一个非常强大的工具包,用于构建更强大的LLM和RAG产品,通过API提供了更好的GPT-4和许多新模型。他们也大大简化了在OpenAI模型上进行构建的过程,并显著降低了想要构建自己项目的人的准入门槛。

– Louie Peters — Towards AI联合创始人兼首席执行官

最热门新闻

  1. OpenAI首次开发者大会的所有新闻

OpenAI的Devday活动包括推出了新的、更好、更快、更便宜的GPT-4 Turbo模型,通过API实现了视觉能力,集成了检索引擎,并与其他几个模型进行了API集成。但该事件的意外之处在于发布了“GPTs”——一种无代码解决方案和未来的“GPT Store”应用商店。

2. RedPajama-Data-v2:包含300万亿令牌用于LLM训练的开放数据集

RedPajama-Data-V2是用于语言模型研究的最大公共训练数据集,它是由五种主要语言中84个CommonCrawl数据集的300万亿令牌组成的清洗数据集。它包括用于过滤和加权的预计算质量注释,并且现已可供研究和商业用途。

3. Elon Musk的首个AI产品是名为Grok的聊天机器人

Elon Musk的AI初创公司xAI推出了第一个聊天机器人Grok,它将面向X Premium+订阅者提供。Grok团队包括来自DeepMind、OpenAI、Google、Microsoft和Tesla的AI专家。马斯克强调,Grok能够在X平台上获取实时信息,使其与其他聊天机器人相比具有优势。

4. 一首由AI帮助制作的披头士新歌将在45年后发布

约翰·列侬开始写这首歌后的45年,一首全新的披头士歌曲通过人工智能的帮助发布了,这为复兴更多旧唱片甚至创作新音乐提供了可能性,但同时也引发了关于同意和艺术操纵的伦理问题。

5.窥见AlphaFold的下一代

AlphaFold是一种先进的人工智能模型,准确预测蛋白质数据库中的分子,提高了对生物分子的理解,并支持复杂蛋白质结构的研究。它在癌症药物发现、疫苗研发和污染减少等方面具有潜在的应用。

五个5分钟阅读/观看推荐

  1. huggingface/alignment-handbook:通过深度学习语言模型与人类和AI偏好进行对齐的强大方法

拥抱之拥抱公司在其《对齐手册》中发布了一套对齐指南,用于语言模型训练。这些指南涵盖了监督微调、奖励建模、拒绝抽样和直接偏好优化(DPO)等技术,以提高语言模型的性能。

2. AI检测器如何摧毁善意作家的生计

通用人工智能检测器的大量错误判断率对自由撰稿人迈克尔·伯本产生了毁灭性的影响:被错误指控作弊,失去了工作。该文章揭示了在该领域中常见的错误判断和缺乏有效机制来挑战人工智能检测器的情况。

3. AI + APIs – 12位专家对未来的看法

人工智能和API的融合正在革新技术世界。利用这些工具的初创公司可以挑战已经建立的巨头,并重塑数字经济中的权力动态。这篇文章强调了12位专家对AI和API交叉点机会的思考和观点。

4. 制作了500多个LoRA后,这就是秘诀

这篇博客强调了优质数据集和参数优化在最大化LoRA效率中的重要性。它强调了清晰数据集的重要性,并建议使用33B模型进行更好的微调。此外,它还警告了梯度积累可能对质量造成的潜在影响。

5. 什么是多模态人工智能(AI)?

指南解释了多模态人工智能(AI)的概念及其对各个领域的转型影响。它探讨了多模态AI的实际应用,讨论了融合技术,并提供了该领域的关键术语简明词汇表。

论文和资源库

  1. Zephyr:直接蒸馏的语言模型对齐

Hugging Face开发的Zephyr 7B在各种基准测试中超过了Chat Llama 70B,取得了令人印象深刻的结果。它的训练方法包括数据集构建、微调、AI反馈收集和偏好优化。

2. huggingface/distil-whisper

Distil-Whisper是一个令人印象深刻的人工智能模型,与Whisper相比,它具有更快的推理速度和更小的尺寸。它在嘈杂的环境中表现良好,并且具有较低的词重复和插入错误。该模型采用了在大规模多样化数据集上进行创新蒸馏的方法,确保在各个领域具有稳健性。

3.语言模型可能主宰信息获取:神经检索器对LLM生成的文本有偏见

该研究定量评估了不同IR模型与人类撰写和LLM生成的文本。搜索引擎倾向于优先选择LLM生成的文本。这引发了关于来源偏见的担忧,并呼吁在LLM时代进行进一步的探索和评估。

4. ChatGPT在搜索方面表现如何?研究大型语言模型作为重新排序代理

本文研究了ChatGPT和GPT-4等生成型语言模型在信息检索中的相关性排序问题。研究表明,在有效的指导下,语言模型能够在信息检索基准测试中获得比最先进的监督方法更好的结果。

5. 大型语言模型理解并能通过情感刺激提升性能

本文探索了语言模型理解情感刺激的能力的第一步。研究发现,向GPT-4 AI模型提供特定短语可以提高其性能。使用“EmotionPrompts”在指导诱导过程中提升了8%的质量,并在高风险任务上提高了115%。

喜欢这些论文和新闻摘要吗?每天在您的收件箱中获取最新回顾

一起学习AI社区板块!

每周AI播客

这个AI通讯简报就是你需要的一切 #72 四海 第1张

在本期的What’s AI中,Louis Bouchard分享了他在人工智能博士学位上的经历以及为什么他决定中途退出。这一期对于那些正在思考追求人工智能博士学位、从事应用人工智能或加入快节奏创业公司之间的选择特别有意义。Louis提供了关于博士学位的适宜性、做出这种决定时应考虑的因素等方面的见解。请关注YouTube阅读完整文章以获取有价值的指导点,为您的学习之旅提供支持。

本周的梗图!

这个AI通讯简报就是你需要的一切 #72 四海 第2张

rucha8062分享的梗图。

来自Discord的精选社区帖子

Henry刚刚推出了DearFlow进行Beta测试!这是一个全能平台,可供您创建和发现AI用例(聊天机器人和工作流程)。它 结合了FlowGPT和Notion的功能。它允许用户执行ChatGPT等聊天界面无法处理的复杂工作流程。在这里查看并支持我们的社区成员!在此帖子中分享您的想法和反馈。

本周的AI投票!

这个AI通讯简报就是你需要的一切 #72 四海 第3张

告诉我们您如何提高生产力或利用它们来完成当前工作!在Discord上参与讨论

TAI精选部分

本周文章

本周(10月23日至10月29日)重要的LLM论文,由Youssef Hosni撰写

大型语言模型(LLMs)近年来发展迅速。随着新一代模型的开发,对于研究人员和工程师来说,及时了解最新进展至关重要。本文总结了十月第四周发表的一些最重要的LLM论文。

我们必读的文章

是否可能证明模拟假设?作者:Lee Vaughan

用时间序列分析增强回归模型的鲁棒性——第1部分作者:Mirza Anandita

创建用于总结YouTube视频的AI助手的完整指南——第2部分作者:Amin Kamali

如果您有兴趣在Towards AI上发表文章,请查看我们的指南并注册。如果符合我们的编辑政策和标准,我们将会将您的作品刊登在我们的平台上。

工作机会

Data Engineer @Pearl Technologies (Remote)

Robotics Software Intern 2024 @Rapyuta Robotics (Japan)

Mobile Engineer, Full Stack (LLM/GenAI) @Mercari, inc. (Remote)

Data Analytics Manager @Humanforce (Sydney, Australia)

Quantitative Developer — Temporary @Twine (Remote)

QA Engineer @CRISP (London, UK)

Python Interns (Mumbai) @Docsumo (Mumbai, India)

有兴趣在此分享工作机会吗?请联系

如果您正在准备下一次机器学习面试,不要犹豫,可以查看我们领先的面试准备网站confetti

https://www.confetti.ai/
Leave a Reply

Your email address will not be published. Required fields are marked *