Press "Enter" to skip to content

Snorkel AI x Hugging Face:为企业解锁基础模型

本文是2023年4月6日在Snorkel博客上由Friea Berg发布的文章的转载。

随着OpenAI发布GPT-4和Google推出测试版的Bard,全球企业都对利用基础模型的强大能力感到兴奋。随着这种兴奋情绪的增加,人们也逐渐意识到大多数公司和组织并没有足够的能力来充分利用基础模型。

对企业来说,基础模型带来了一系列独特的挑战。它们比以往任何时候都要大,这使得公司自行托管这些模型变得困难且昂贵,而使用现成的基础模型进行生产可能会导致性能不佳或存在重大的治理和合规风险。

Snorkel AI弥合了基础模型和实际企业应用之间的差距,并为像Pixability这样的AI创新者带来了令人印象深刻的结果。我们正在与Hugging Face合作,Hugging Face以其庞大的开源模型库而闻名,为企业提供更灵活、更多选择的AI应用开发。

Snorkel Flow中的基础模型

Snorkel Flow开发平台使用户能够根据其特定的用例来调整基础模型。应用程序开发始于对所选基础模型在其数据上的“开箱即用”预测的检查。这些预测成为这些数据点的初始版本的训练标签。Snorkel Flow帮助用户通过编程标注高效地识别模型中的错误模式并进行修正,这可以包括使用启发式或提示来更新训练标签。然后可以在更新的标签上微调基础模型,并再次进行评估,这个迭代的“检测和修正”过程会继续,直到调整后的基础模型达到足够高的质量以进行部署。

Hugging Face通过从单一来源提供超过15万个开源模型,帮助实现了这个强大的开发流程。其中许多模型专门用于特定领域的数据,例如BioBERT和SciBERT模型用于演示如何使用机器学习来发现不良药物事件。一个或者更好的是,多个专门的基础模型可以为用户提供初步预测、改进标签的提示,或者微调最终的部署模型。

Hugging Face如何帮助?

Snorkel AI与Hugging Face的合作为Snorkel Flow的基础模型功能提供了强大的支持。最初,我们只提供了少量的基础模型。每个模型都需要一个专用的服务,这使得我们无法为企业提供灵活利用日益增长的各种模型的可能性,因为成本太高和难以实现。采用Hugging Face的推理终端服务使我们能够扩展我们的用户可以利用的基础模型数量,同时保持成本可控。

Hugging Face的服务允许用户通过几个点击创建一个模型API并立即开始使用。关键的是,这项新服务具有“暂停和恢复”的功能,使我们能够在客户需要时激活模型API,并在不需要时将其休眠。

“我们惊喜地发现Hugging Face推理终端服务的设置非常简单。所有的配置选项都很清晰明了,而且我们还可以获得所需的所有选项,例如在哪个云上运行、需要什么安全级别等。”

– Snorkel CTO兼联合创始人Braden Hancock

这如何帮助Snorkel的客户?

很少有企业有能力从零开始训练自己的基础模型。虽然许多企业可能拥有内部专业知识来微调自己版本的基础模型,但他们可能难以收集到完成此任务所需的数据量。Snorkel的以数据为中心的基础模型开发平台与Hugging Face等领先行业创新者的配合,帮助我们的用户轻松掌握基础模型的强大能力。

“使用Snorkel AI和Hugging Face推理终端,企业将加速其以数据为中心的AI应用,将开源作为核心。机器学习正在成为构建技术的默认方式,而从开源项目构建可以使公司为其用例构建合适的解决方案并掌控他们向客户提供的体验。我们非常期待看到Snorkel AI通过基于开源Hugging Face模型和推理终端构建,为企业实现自动化数据标注。”

Clement Delangue,共同创始人兼首席执行官,Hugging Face

结论

通过Snorkel和Hugging Face的共同努力,大型公司、政府机构和人工智能创新者可以更轻松地从基础模型中获得价值。能够使用Hugging Face全面的基础模型库意味着用户可以选择与其商业需求最符合的模型,而无需投入训练所需的资源。这种集成是在使基础模型更易于企业全球范围内使用方面迈出的重要一步。

如果您对Hugging Face推理终端点(Inference Endpoints)对您的公司感兴趣,请在这里联系我们 – 我们的团队将与您联系以讨论您的需求!

Leave a Reply

Your email address will not be published. Required fields are marked *