Press "Enter" to skip to content

机器学习洞察总监【第四部分】

如果您有兴趣更快地构建ML解决方案,请访问:hf.co/support 今天!

👋 欢迎回到我们的ML洞察系列的总监!如果您错过了之前的版本,您可以在这里找到它们:

  • 机器学习洞察总监[第1部分]
  • 机器学习洞察总监[第2部分:SaaS版]
  • 机器学习洞察总监[第3部分:金融版]

🚀 在这第四部分中,您将听到以下顶级机器学习总监对机器学习对各自行业的影响的看法:Javier Mansilla,Shaun Gittens,Samuel Franklin和Evan Castle。所有这些人目前都是拥有丰富领域洞察的机器学习总监。

免责声明:所有观点均来自个人,与任何过去或现在的雇主无关。

机器学习洞察总监【第四部分】 四海 第1张

Javier Mansilla – Mercado Libre的机器学习市场科学总监

背景:经验丰富的企业家和领导者,Javier是Machinalis的联合创始人和首席技术官,自2010年以来一直致力于构建机器学习(是的,在神经网络突破之前)。当Machinalis被Mercado Libre收购时,这个小团队发展成为一个拥有超过10,000名开发人员、影响近1亿直接用户的技术巨头,使机器学习成为其能力。每天,Javier不仅领导他们的机器学习平台(NASDAQ MELI)的技术和产品路线图,还领导他们的用户追踪系统、AB测试框架和开放源代码办公室。Javier是Python-Argentina非营利性组织PyAr的积极成员和贡献者,他喜欢与家人和朋友一起度过时间,喜欢Python、骑自行车、足球、木工和慢节奏的自然假期!

趣闻:我喜欢阅读科幻小说,我的退休计划包括重新开始写短篇小说的少年梦想。📚

Mercado Libre:拉美最大的公司,也是该大陆的电子商务和金融科技无处不在的解决方案

1. 机器学习如何对电子商务产生积极影响?

我认为在特定情况下,机器学习使不可能成为可能,例如在欺诈预防和优化流程方面,它以一种我们在绝大多数其他领域无法想象的方式发挥作用。

在中间,还有一些应用,机器学习使用户体验达到了一个新的水平,否则将非常昂贵(但也许是可能的)。例如,增加了用户在列表和报价之间导航时的发现和巧合。

我们使用机器学习来运行搜索、推荐、广告、信用评分、管理、预测等多个核心单元,以优化至少其中一个基本指标。

我们甚至使用机器学习来优化我们预留和使用基础设施的方式。

2. 电子商务中的最大机器学习挑战是什么?

除了所有技术上的挑战(例如,越来越实时和个性化),最大的挑战是始终关注最终用户。

电子商务正在逐年扩大其市场份额,而机器学习始终是一种概率方法,无法提供100%的完美。我们需要小心地在持续优化产品的同时,关注长尾和每个个体的体验。

最后,一个不断增长的挑战是在多渠道和多业务世界中协调和促进数据(输入和输出)的共存 – 市场、物流、信用、保险、实体店的付款等。

3. 您看到人们在尝试将机器学习整合到电子商务中时常见的错误是什么?

最常见的错误与在错误问题上使用错误的工具有关。

例如,从复杂开始,而不是从可能的最简单基线开始。例如,不测量有无机器学习的影响。例如,在没有明确了解预期收益边界的情况下投资技术。

最后但并非最不重要的:只考虑短期,忽视隐藏的影响、技术债务、维护等。

4. 什么让你对机器学习的未来最感兴奋?

从我们十年前亲手打造技术的角度来看,我最喜欢的当然是看到我们作为一个行业正在解决大部分缓慢、重复和乏味的挑战。

当然,这是一个不断变化的目标,会出现新的困难。但是我们正在更好地融入成熟的工具和实践,这将导致更短的模型构建周期,从而减少上市时间。

机器学习洞察总监【第四部分】 四海 第2张

Shaun Gittens – MasterPeace Solutions的机器学习总监

背景:Shaun Gittens博士是MasterPeace Solutions公司机器学习能力总监,该公司专门为客户提供先进技术和关键任务的网络安全服务。在这个角色中,他:

  1. 在公司内部培养机器学习专家和从业人员。
  2. 提高现有员工对尖端机器学习实践的了解。
  3. 确保提供有效的机器学习解决方案和咨询支持,不仅适用于公司的客户,还适用于MasterPeace内部的初创公司。在加入MasterPeace之前,Gittens博士担任Applied Technology Group公司的首席数据科学家。他以在Apache Hadoop、Apache Spark和Apache Storm等分布式大数据和流式处理平台上训练和部署机器学习解决方案为基础建立了自己的职业生涯。作为奥本大学的博士后研究员,他研究了从训练的非线性机器学习模型获取的知识的有效可视化方法。

趣闻:热衷于打网球和动漫迷。🎾

MasterPeace Solutions:MasterPeace Solutions已成为美国中大西洋地区增长最快的先进技术公司之一。该公司设计和开发软件、系统、解决方案和产品,以解决情报界面临的一些最紧迫的挑战。

1. 机器学习如何对工程产生积极影响?

工程应用广泛,涵盖了许多领域。然而,最近,我们看到机器学习影响了各种工程领域,包括机器人技术、汽车工程、化学工程和土木工程等明显的领域。机器学习在应用上非常广泛,仅需要具有先前记录的劳动过程的训练数据,就可以尝试让机器学习影响您的最终利润。从本质上讲,我们正处于一个机器学习显著影响以前仅由人类操作的各种工程流程自动化的时代。

2. 工程领域内最大的机器学习挑战是什么?

  1. 最大的挑战在于以一种使人类操作可以被最小程度替代的方式实现训练好的机器学习解决方案的操作化和部署。我们现在正在看到完全自动驾驶汽车的例子。要自动化那些涉及到人类或人类依赖的流程而不会造成损害是具有挑战性的。我最担心的是这种现象中最重要的例子之一是机器学习和偏见。事实上,机器学习模型在进行操作时可能会重现数据中存在的偏见。偏见需要在将机器学习纳入工程中的过程中引起重视,以防止系统性的种族主义传播到未来的技术进步中,从而给弱势人群带来伤害。如果那些训练机器学习解决方案的人对过程中的所有形式的数据都没有敏锐的意识,那么那些受偏见流程数据训练的机器学习系统注定会重复这些偏见。
  2. 另一个关键的机器学习在工程领域的挑战是该领域主要以问题解决为特点,这通常需要创造力。目前,在工程领域,很少有真正“有创造力”、“能够“跳出框架”的机器学习代理的例子。因为目前的机器学习解决方案往往仅仅是通过搜索所有可能的解决方案来得出的。在我看来,虽然通过这种方法可以找到许多解决方案,但在各种问题领域中,机器学习要想持续展示创造力仍然面临一定的限制。尽管如此,机器学习在工程应用中的发展仍然非常高,还有许多工作需要完成。

3. 试图将机器学习(ML)融入工程中时,你看到人们常犯的一个错误是什么?

一个常见的错误是在将机器学习融入工程中时,使用过于强大的ML技术来处理一个小问题数据集。例如,深度学习将人工智能和机器学习推向了前所未有的高度,但它可能不是解决问题的最佳方法,这取决于你的问题空间。在处理小型训练数据集和有限硬件时,通常更简单的方法同样有效甚至更好。

此外,没有为您的ML解决方案建立一个有效的CI/CD(持续集成/持续部署)结构是另一个错误。经常情况下,一次训练的模型是不够的,不仅因为数据随时间变化,而且资源和人员也会发生变化。今天的ML从业者需要:

  1. 确保数据的持续流动,并随着数据的变化不断重新训练新模型以保持准确性和有用性。
  2. 确保建立合适的结构,以便能够无缝地用新训练的模型替换旧模型,同时
  3. 尽量减少对ML模型输出的消费者造成的干扰。

4. 你对机器学习的未来最感兴奋的是什么?

机器学习的未来仍然令人兴奋,似乎每个月都有该领域的进展报道,甚至让专家们感到惊讶。随着1)机器学习技术的改进和对已经建立的从业者和新手的更易用性,2)每天的硬件变得更快,3)功耗对小型边缘设备的影响减小,以及4)随着时间推移,内存限制减小,机器学习在工程领域的发展前景将会继续光明。

机器学习洞察总监【第四部分】 四海 第3张

Samuel Franklin – Pluralsight的高级数据科学和机器学习工程总监

背景:Samuel是Pluralsight的高级数据科学和机器学习工程领导者,拥有认知科学博士学位。他领导着一支才华横溢的数据科学家和机器学习工程师团队,构建了支持Pluralsight技能平台的智能服务。

在虚拟办公室之外,Franklin博士还为Emory大学教授数据科学和机器学习研讨会。他还担任亚特兰大动物保护协会董事会主席。

趣闻:我住在阿巴拉契亚山脉的山顶上的一间小木屋里。

Pluralsight:我们是一家技术人员培训公司,我们的技能平台被70%的财富500强公司用于帮助员工建立关键的技术能力。

1. 机器学习在教育中产生了哪些积极影响?

在线、随需可及的教育内容使数十亿人群的终身学习变得比以往任何时候都更易于接触。数十年的认知研究表明,教育内容的相关性、格式和顺序对学生的学习成功产生重要影响。深度学习内容搜索和推荐算法的进步极大地提高了我们在规模上创建定制、高效的学习路径的能力,这些路径能够随着个体学生的需求随时间而调整。

2. 教育领域面临的最大机器学习挑战是什么?

我认为MLOps技术是改善各行业机器学习的一个重要机会领域。目前的MLOps技术状况让我想起了2015-2016年的容器编排之战。有多种不同的ML训练-部署-监控技术方案,每个方案都得到热情社区的推崇,并得到大型组织的支持。如果最终出现主导方案,那么在MLOps工程模式上可能会形成共识,减少当前给ML团队带来摩擦的决策复杂性。

3. 试图将机器学习融入现有产品时,你看到人们常犯的一个错误是什么?

我看到各种规模的组织在开始使用ML时都犯了两个关键错误。第一个错误是低估了拥有丰富实际ML经验的高级领导者的重要性。ML战略和运营领导需要具备超出BI/分析领域常见的技术专业知识,或者提供有限介绍该领域的教育计划所能提供的。第二个错误是等待太久才设计、测试和实施生产部署流程。有效的原型模型可能在存储库中闲置数月甚至数年,而等待ML流程的开发。这可能给组织带来重大的机会成本,并使ML团队感到沮丧,增加离职风险。

4. 机器学习的未来最让您激动的是什么?

我对教导下一代机器学习领导者的机会感到兴奋。我的职业生涯始于云计算平台刚刚起步的时候,而且机器学习工具相比现在要不成熟得多。当时探索不同的机器学习实验和部署工程模式是令人兴奋的,因为成熟的最佳实践很少。但是,这种探索包括通过困难的方式学习太多的技术和领导力教训。与下一代机器学习领导者分享这些教训将帮助他们推动这个领域比过去的10多年更远、更快的发展。

机器学习洞察总监【第四部分】 四海 第4张

Evan Castle – Elastic Stack 的 ML 产品营销总监,Elastic

背景:在数据科学、产品和战略的交叉领域拥有十余年的领导经验。Evan 在各个行业工作过,从在像 Capital One 这样的财富100强公司构建风险模型,到在 Sisense 和 Elastic 推出机器学习产品。

趣闻:见过 Paul McCarthy。🎤

MasterPeace Solutions:MasterPeace Solutions 已成为中大西洋地区增长最快的先进技术公司之一。该公司设计和开发软件、系统、解决方案和产品,以解决情报界面临的一些最紧迫的挑战。

1. 机器学习如何对 SaaS 产生积极影响?

机器学习在SaaS中真正发挥了作用,为个性化、语义和图像搜索、推荐、异常检测和许多其他业务场景提供动力。真正的影响是越来越多的应用程序中都内置了机器学习。它正在成为一种期望,往往对终端用户来说是看不见的。例如,在 Elastic,我们投资于用于异常检测的机器学习,针对终端安全和安全信息与事件管理(SIEM)进行了优化。它通过时间序列分解、聚类、相关性分析和贝叶斯分布建模等不同技术的融合,提供了一些强大的功能。对于安全分析师来说,最大的好处是威胁检测在许多不同的方式下都是自动化的。因此,与时间偏差、异常地理位置、统计罕见性和许多其他因素相关的异常情况会被迅速提取出来。这就是将机器学习集成起来的巨大积极影响。

2. SaaS 面临的最大机器学习挑战是什么?

为了最大程度地发挥机器学习的好处,需要同时为新接触机器学习的用户和经验丰富的数据科学家提供价值。这两类人的需求显然有很大的差异。如果一个机器学习能力完全是一个黑匣子,那么它很可能过于死板或简单,无法产生真正的影响。另一方面,如果你只提供开发者工具包,只有拥有数据科学团队的公司才能从中受益。找到正确的平衡点是确保机器学习足够开放,以便数据科学团队对模型有透明度和控制,并且打包了经过实战检验的易于配置和部署的模型,而无需成为专家。

3. 您看到的将机器学习集成到SaaS中的常见错误是什么?

要做到正确,任何集成模型都必须能够在规模上工作,这意味着支持大规模数据集的同时确保结果仍然高效准确。让我们通过一个真实的例子来说明这一点。向量搜索引起了人们的浓厚兴趣。文本、图像和事件等各种事物都可以用向量表示。向量可以用于捕捉内容之间的相似性,并且非常适用于搜索相关性和推荐等任务。挑战在于开发能够考虑到速度、复杂性和成本之间的权衡的算法来比较向量。在 Elastic,我们花了很多时间评估和基准测试用于向量搜索的模型的性能。我们选择了一种称为 Hierarchical Navigable Small World graphs (HNSW) 的近似最近邻(ANN)算法,该算法基于向量之间的相似性将其映射到图中。HNSW 在各种 ANN 基准测试中提供了数量级的速度和准确性提升。这只是一个例子,越来越多的产品和工程团队需要做出非平凡的决策,以成功地将机器学习集成到他们的产品中。

4. 机器学习的未来最让你兴奋的是什么?

机器学习将变得像在线订购一样简单。尤其是在自然语言处理方面的重大突破使得机器学习更加人性化,能够理解上下文、意图和含义。我认为我们正处在一种基础模型的时代,这些模型将开花结果,发展出许多有趣的方向。在 Elastic,我们对与 Hugging Face 的整合感到非常兴奋,并且已经看到我们的客户如何利用自然语言处理技术来实现可观察性、安全性和搜索方面的应用。


🤗 感谢您参与我们的第四期 ML 主管见解。

特别感谢 Javier Mansilla、Shaun Gittens、Samuel Franklin 和 Evan Castle 对于这篇文章的精彩见解和参与。我们期待着见证您不断的成功,并将为您每一步加油助威。🎉

如果您有兴趣通过 Hugging Face 专家加速您的机器学习路线图,请访问 hf.co/support 了解更多详情。

Leave a Reply

Your email address will not be published. Required fields are marked *