Press "Enter" to skip to content

7 search results for "Yelp"

特雷·杜瓦格,Pathlight的首席技术官兼联合创始人–访谈系列

Trey Doig是Pathlight的联合创始人和首席技术官Trey在科技行业拥有超过十年的经验,在IBM、Creative Commons和Yelp公司担任工程师Trey是Yelp预订的首席工程师,负责将SeatMe功能整合到Yelp.com上Trey还领导了SeatMe网页应用程序的开发[…]

Leave a Comment

前20个数据工程项目创意[附源代码]

数据工程在广阔的数据生态系统中扮演着关键角色,通过收集、转换和传递数据,为分析、报告和机器学习提供必要的数据。有志于成为数据工程师的人常常寻求真实世界的项目,以获得实践经验并展示他们的专业知识。本文介绍了前 20 个数据工程项目创意及其源代码。无论您是初学者、中级工程师还是高级从业者,这些项目都为您提供了一个优秀的机会来提升您的数据工程技能。 初学者的数据工程项目 1. 智能物联网基础设施 目标 该项目的主要目标是建立一个可靠的数据管道,用于收集和分析物联网设备的数据。网络摄像头、温度传感器、运动探测器和其他物联网设备都会产生大量数据。您希望设计一个系统,能够有效地消耗、存储、处理和分析这些数据。通过这样做,基于物联网数据的实时监控和决策成为可能。 解决方案 利用 Apache Kafka 或 MQTT 等技术,从物联网设备高效地摄取数据。这些技术支持高吞吐量的数据流。 使用 Apache Cassandra 或 MongoDB 等可扩展数据库来存储传入的物联网数据。这些 NoSQL 数据库能够处理大量和多样化的物联网数据。 使用 Apache…

Leave a Comment

2023年9月社交媒体最佳ChatGPT提示

在社交媒体的世界中导航可能会让人感到不知所措,尤其是在你想要实现特定的商业目标时无论你是初创公司、中型企业还是大型企业,拥有一个聪明的社交媒体策略是必不可少的ChatGPT不仅可以帮助你自动化任务,还可以创建与你品牌相关的引人入胜、富有洞察力的内容

Leave a Comment

使用机器学习提升客户服务效能

在这篇博客文章中,我们将模拟一个真实的客户服务用例,并使用Hugging Face生态系统的机器学习工具来解决它。 我们强烈推荐将这个笔记本作为一个模板/示例来解决你的真实用例。 定义任务、数据集和模型 在开始实际编码之前,重要的是清楚地定义您想要自动化或部分自动化的用例。清晰地定义用例有助于确定最适合您用例的任务、数据集和模型。 定义你的自然语言处理任务 好的,让我们深入探讨一个我们希望使用自然语言处理模型解决的假设性问题。假设我们正在销售一种产品,我们的客户支持团队收到成千上万条包括反馈、投诉和问题的消息,理想情况下应该都得到回复。 很快就变得明显,客户支持绝对无法回复每一条消息。因此,我们决定只回复最不满意的客户,并致力于回答100%的这些消息,因为与其他中性和积极的消息相比,这些消息很可能是最紧急的。 假设a)非常不满意的客户的消息只占所有消息的一小部分,并且b)我们可以以自动化的方式过滤出不满意的消息,那么客户支持应该能够达到这个目标。 为了以自动化的方式过滤出不满意的消息,我们计划应用自然语言处理技术。 第一步是将我们的用例-过滤出不满意的消息-映射到一个机器学习任务上。 Hugging Face Hub的任务页面是一个很好的起点,可以看到哪个任务最适合给定的场景。每个任务都有详细的描述和潜在的用例。 找到最不满意的客户消息的任务可以建模为一个文本分类任务:将一条消息分类为以下5个类别之一:非常不满意,不满意,中立,满意,或非常满意。 寻找合适的数据集 在确定任务之后,接下来,我们应该找到模型将要训练的数据。对于您的用例的性能来说,这通常比选择正确的模型架构更重要。记住,一个模型的好坏取决于它所训练的数据。因此,在策划和/或选择数据集时,我们应该非常谨慎。 由于我们考虑的是过滤出不满意的消息的假设用例,请查看可用的数据集。 对于您的真实用例,您很可能有最能代表您的NLP系统所处理实际数据的内部数据。因此,您应该使用这些内部数据来训练您的NLP系统。然而,包含公开可用的数据也可以提高模型的泛化能力。 让我们看一下Hugging Face Hub上所有可用的数据集。在左侧,您可以根据任务类别和更具体的任务进行过滤。我们的用例对应于文本分类-情感分析,所以让我们选择这些筛选器。在编写本笔记的时候,我们还剩下大约80个数据集。在选择数据集时,应该评估两个方面: 质量:数据集的质量如何?更具体地说:数据是否符合您在用例中预期要处理的数据?数据是否多样、公正等。 大小:数据集有多大?通常可以说,数据集越大,越好。 高效评估数据集是否具有高质量是相当棘手的,了解数据集是否存在偏见更具挑战性。高质量的有效合理的启发法则是查看下载统计信息。下载次数越多,使用次数越多,数据集的质量就越高。大小很容易评估,因为通常可以快速阅读。让我们来看一下下载次数最多的数据集:…

Leave a Comment

Can't find what you're looking for? Try refining your search: