Press "Enter" to skip to content

阿里巴巴AI开源了包括Qwen-1.8B、Qwen-7B、Qwen-14B和Qwen-72B在内的Qwen系列,还有Qwen-Chat系列

阿里巴巴云计算最新的开源AI模型系列Qwen,将人工智能技术的边界推向了新的高度。阿里巴巴通过发布Qwen-1.8B和Qwen-72B以及专门的聊天和音频模型,进一步扩展了其AI解决方案。阿里巴巴通过这些模型展示了其对开发AI能力的承诺,这些模型在语言和音频处理方面提供了改进的性能和多功能性。

Qwen系列已经得到显著增强,通过发布Qwen-1.8B及其更大的版本Qwen-72B。Qwen系列已包括Qwen-7B和Qwen-14B。Qwen-1.8B基于1.8亿个参数的Transformer模型,预训练语料库超过2.2万亿个令牌。该模型在中文和英文的各种语言任务中胜过许多相同规模甚至更大的模型。该模型还支持8192个令牌的长上下文。

值得注意的是,Qwen-1.8B及其量化变体int4和int8提供了一种经济实惠的部署解决方案。这些特性使其成为各种应用的明智选择,通过大幅降低内存需求。超过150K个标记的广泛词汇进一步提高了其语言能力。

更大规模的模型Qwen-72B训练了3万亿个令牌。该模型在大多数任务中优于GPT-3.5,并在所有测试任务中优于LLaMA2-70B。尽管参数较大,阿里巴巴已经设计了这些模型以实现低成本部署;量化版本仅需大约3GB的最小内存使用。这一突破显著降低了使用以前在云计算上成本高达数百万美元的大规模模型所面临的障碍。

除了Qwen基础模型,阿里巴巴还推出了针对AI支持和对话能力进行优化的Qwen-Chat版本。Qwen-Chat除了生成材料和促进自然对话外,还能执行代码解释和摘要任务。

阿里巴巴的Qwen-Audio在多模态AI中能够处理各种音频输入,并生成文本输出,这代表了一项值得注意的进步。值得注意的是,Qwen-Audio在语音识别和各种音频理解标准上取得了最先进的性能,而无需进行精细调整。

在音频领域,Qwen-Audio作为基础音频语言模型树立了新的基准。它使用多任务学习框架处理多种音频格式。在多个基准测试中取得了令人瞩目的结果,包括在AISHELL-1和VocalSound等任务上的最先进得分。

Qwen-Audio的适应性包括从文本和音频输入操作多个聊天会话的能力,功能从语音编辑工具到音乐欣赏和声音解释等方面。

Leave a Reply

Your email address will not be published. Required fields are marked *