Press "Enter" to skip to content

稳定AI发布日语StableLM Alpha:日语语言模型的跃进

稳定AI发布日语StableLM Alpha:日语语言模型的跃进 四海 第1张稳定AI发布日语StableLM Alpha:日语语言模型的跃进 四海 第2张

在增强日本生成式人工智能领域迈出重要一步的同时,Stability AI,即稳定AI,是稳定扩散背后的开创性生成式AI公司,推出了其首个日语语言模型(LM),名为日语StableLM Alpha。这一重要发布引起了广泛关注,因为该公司声称其LM是面向日本说话者的最精通的公开可用模型。这一主张通过与其他四个日语LM进行全面基准评估得到了证实。

这个新推出的日语StableLM Alpha,拥有70亿参数的令人印象深刻的架构,是Stability AI在技术进步方面的承诺的明证。该模型是一种多功能高性能工具,适用于各种语言任务。它在多个分类中胜过了同行,成为行业领导者。

日语StableLM Base Alpha 7B商业版本计划在广泛认可的Apache License 2.0下发布。这个专门的模型是通过对包括7500亿个日语和英语文本令牌在内的庞大数据集进行广泛训练而精心打造的,这些数据集是从在线资源库中精心挑选的。

这一成就的基础还得归功于协作努力。Stability AI利用了EleutherAI Polyglot项目的日本团队的专业知识,最终形成了由Stability AI的日本社区创造的数据集。这一集体努力还得益于使用了EleutherAI的GPT-NeoX软件的扩展版本,这是Stability AI开发过程的基石。

作为一项并行创新,日语StableLM Instruct Alpha 7B又是一个显著的里程碑。这个模型主要用于研究目的,专门用于研究应用。它通过一种称为有监督微调(SFT)的方法,利用多个开放数据集,展示了遵循用户指令的独特能力。

这些模型通过EleutherAI的语言模型评估工具进行了严格的评估。这些模型在句子分类、句对分类、问答和句子摘要等各个领域经受了审查,并取得了令人印象深刻的平均得分54.71%。Stability AI认为,这一性能指标无疑将日语StableLM Instruct Alpha 7B置于同行之上,突显了其实力和优越性。

有趣的是,Stability AI的日语LM的发布由于与SoftBank最近的公告时间的关系,还有着另一层的引人注目。上周,SoftBank宣布进军本土大型语言模型(LLM)领域,专门为日本市场设计。该公司的承诺进一步得到了巨额资金的支持,约为200亿日元(超过1.4亿美元),用于其生成式AI计算平台,该平台将于今年晚些时候首次亮相。

随着领域的不断展开,我们将拭目以待,看看哪个日语语言模型最终能在生成式人工智能这个充满活力和不断演变的领域中确立其优势。

Leave a Reply

Your email address will not be published. Required fields are marked *