Press "Enter" to skip to content

在ODSC West 2023更好地进行机器学习的11种方法

在ODSC West 2023更好地进行机器学习的11种方法 四海 第1张

很多公司现在正在利用数据科学和机器学习,但在回报率方面仍有很大的改进空间。2021年VentureBeat的一项分析表明,87%的AI模型从未投入生产环境,而麻省理工学院斯隆管理评论的一篇文章发现,70%的公司报告称AI项目的影响很小。尽管面临这些困难,但根纳咨询公司预测,2022年人工智能投资将达到前所未有的625亿美元,较2021年增长了21.3%。

然而,我们仍然面临一个问题:我们如何更好地进行机器学习?为了找到答案,我们参考了来自ODSC West 2023的一些即将举行的教程和研讨会,并让专家根据他们的主题指导我们构建更好的机器学习。

数据标注简介

Chris Hoge | 社区负责人 | Heartex

在机器学习的现代时代,高质量、准确标注的数据的重要性不言而喻。本演示介绍了如何创建高质量的、带有注释的数据集来训练机器学习模型。在本教程中,我们将使用Label Studio,一个开源的多类型数据标注工具,探索常用的用于对原始数据集进行注释的方法,包括人工和自动化标注技术。

不确定性量化:方法和途径

Brian Lucena | 首席 | Numeristical

我们将首先概述为什么量化模型预测的不确定性很重要。我们将讨论在分类问题和回归问题中UQ的区别,并介绍各种方法。本研讨会将为这些方法提供理论背景,然后通过使用Jupyter笔记本来展示它们在实际应用中的例子。

数据变形:摘要统计的警示故事

Stefanie Molin | 软件工程师、数据科学家、首席信息安全官,Pandas Hands-On Data Analysis的作者 | Bloomberg

在这次演讲中,Stefanie将讨论Data Morph,这是一个开源软件包,它基于Autodesk以前的研究,使用模拟退火来将任意输入数据集变形成各种形状,同时保留均值、标准差和相关性到多个小数点。她将展示它的工作原理,讨论开发过程中面临的挑战,并探讨这种方法的局限性。

活动 – ODSC West 2023

现场和虚拟会议

10月30日至11月2日

加入我们,深入探索最新的数据科学和人工智能趋势、工具和技术,从LLMs到数据分析,从机器学习到负责任的AI。

 

因果AI: 从数据到行动

Dr. Andre Franca | 首席技术官 | connectedFlow

在这个演讲中,我们将探索和解密因果AI的世界,以帮助数据科学从业人员理解数据内的因果关系,从而推动最佳决策。在这个演讲中,我们将专注于Shapley值、有向无环图、发现因果关系和最优决策。

利用AI快速高质量完成知识发现

Alex 刘 博士 | 创始人兼主任 | RMDS Lab

在本演示中,我们的演讲者将对一系列常见的失败因素进行综合审查。此外,他们还将介绍一种基于AI驱动的知识发现生态系统方法,并讨论一个涉及14个知识发现项目的该方法的实际测试。通过这些,参与者将深入了解数据驱动的知识发现项目的成功与AI技术的进步之间的重要联系。参与者还将了解到这种生态系统方法如何为知识发现项目带来显著的速度提升、质量提升和有效的风险缓解。

弥合客户分割的可解释性差距

Evie Fowler | 高级数据科学家 | Fulcrum Analytics

历史上,分割有两种主要方法:基于规则和基于机器学习。在这个演讲中,Evie将介绍一种新的混合方法,将这两种方法的优势结合起来。该过程从对客户数据的仔细观察和评估是否存在自然形成的数据聚类开始。然后选择一个聚类算法,并对模型进行微调以创建聚类。之后,进行额外的探索性数据分析,以了解每个聚类与其他群集的不同之处。最后,使用线性逼近来创建机器学习聚类算法的简单表示。

人类中心的人工智能

Peter Norvig, 博士 | 工程总监,教育研究员 | Google,斯坦福人类中心人工智能研究所(HAI)

近年来,我们在人工智能应用方面取得了惊人的技术进步。这个演讲关注的是人性的一面,而不是技术的一面:我们如何确信我们的应用程序对用户、其他利益相关者和整个社会都是公平、公正、真实、有益且被搅拌得很好的。

图和网络上的表示学习

Dr. Petar Veličković,研究员 | DeepMind,剑桥大学附属讲师

在这个演讲中,Petar将尝试提供一些关于GNN的“鸟瞰”视角。他将从置换不变性和等变性的第一原则上推导出GNN。我们将讨论如何构建不仅仅依赖于输入图结构的GNN。这个演讲将面向一个通用的计算机科学受众,尽管对于具备神经网络机器学习的基本知识将是一个有用的先决条件。

机器学习已成为巫术

Mark Saroufim | 作者 | Breaking Stagnation

机器学习经历了从只能进行天真曲线拟合的技术到可能终结人类统治的技术的深刻转变。在2017年,Ali Rahimi宣称机器学习是新的炼金术,我们希望更进一步,声称机器学习是新的巫术。一门被天主教会最终摧毁的、怀有强烈开源情怀的被遗忘的科学。

CRM生产数据的异常检测

Geeta Shankar,软件工程师,Tuli Nivas,软件工程架构师 | Salesforce

在我们的技术演讲中,我们将展示机器学习和分析可视化在解决现实数据分析挑战方面的价值。我们将展示我们的数据驱动生产系统如何应对这些挑战,强调数据分析在确保可靠系统和建立客户信任方面的重要性。

缺失数据:缺失数据插补的合成数据方法

Fabiana Clemente | 联合创始人和首席数据官 | YData

在这个演讲中,我们将介绍使用生成模型(如LLMs和GANs)来生成智能合成数据以填补缺失数据的用途。通过使用生成模型来填补缺失数据,我们可以生成符合潜在数据分布的新样本,可以帮助减少缺失数据对我们模型的影响。此外,这些模型可以针对特定数据集进行微调,允许我们生成适合我们特定用例的合成数据。

在ODSC West 2023学习更好的机器学习方法

要深入了解这些主题,请于10月30日至11月2日加入我们的ODSC West 2023线上或线下会议。该会议还将提供关注领域的实践培训课程,如机器学习、深度学习、MLOps和数据工程、负责任人工智能等。此外,您还可以通过购买一张bootcamp pass将您的深入培训时间延长到4天。在这里查看所有票种的信息here

Leave a Reply

Your email address will not be published. Required fields are marked *