在AI开发中不要犯这些错误

准备工作就是证明

训练一个AI模型听起来可能很简单：给神经网络一些数据，然后你就有了一个AI。但事实远非如此，开发适合特定工作的正确模型涉及到许多因素。

开发高质量的AI部署90%依赖于准备工作，同时还需要不断迭代和持续监控。成功开发和实施AI系统是一个复杂的过程，充满了潜在的风险。这些缺点可能导致次优的结果、资源的低效使用，甚至带来重大挑战。

以下是你应该了解的10个AI开发错误，以确保你开发出最好的AI模型：

数据预处理不足和数据质量差
模型评估不充分
对齐不准确
忽视数据隐私
未准备好实时扩展
训练过多或过少
在不现实的数据集上训练
未解决或未考虑偏见问题
忽视AI模型可理解性的需求
忽视监控

数据预处理不足

没有比给模型提供的数据质量更重要的事情了。想想看；如果一家电子商务公司试图根据购买历史和行为开发一个推荐系统来向客户推荐产品。如果数据的质量杂乱无章、不利于推荐，事情可能很快就会出错。

缺失用户数据、嘈杂和错误的数据，以及未更新的数据可能会产生错误的结果。客户可能会开始收到与产品无关的推荐，导致用户体验差，潜在的销售额损失，更不用说在推荐系统开发上的投资了。

以高质量和组织性为目标准备数据可以获得更好的结果。你的模型性能将反映出你提供给它的数据质量。

模型评估不准确

不言而喻，除了数据之外，选择正确的模型也是很重要的。你可以准备好数据模型，但确保使用正确的模型并理解哪种模型最适合哪种目的对于成为一个优秀的AI开发者来说是必要的。

例如，如果一家银行使用机器学习模型来预测客户账户申请的贷款违约情况，训练基于历史客户的准确性。如果银行只使用准确性作为性能度量，那么未来违约者的重要缺陷将被掩盖，接受一定数量的潜在违约者而不知情。

银行的模型应该使用其他性能度量，如精确率、召回率和F1分数。他们还可以使用交叉验证和AUC-ROC分析等技术，以确定模型在区分类别（违约者、非违约者）方面的能力。

模型对齐不准确

开发人员通常根据准确性、精确率、召回率或F1分数等技术指标来优化模型。虽然这些指标提供了模型性能的重要度量，但它们并不总是直接与业务指标（如收入生成、成本节约、客户满意度或风险缓解）相关。因此，将技术AI指标与业务指标对齐对于实现期望的业务结果至关重要。

例如，让我们考虑一个信用卡欺诈检测模型：提高模型的准确性或F1分数可能会导致更多的被标记的交易。这可能导致误报的数量增加，将合法交易错误地标记为欺诈。这对业务有严重的影响，比如由于过多的被阻止的交易而导致应用程序或平台的可用性降低。

忽视数据隐私

数据隐私就像AI世界中的无名英雄。它可能不像设计酷炫的算法或创建尖端模型那样令人兴奋，但忽视它可能会让你陷入麻烦。

想象一下，你正在经营一家健康科技初创公司，有一个很棒的想法，开发一个基于用户个人数据（如年龄、生活习惯和过往病史）预测潜在健康风险的AI系统。

虽然这一开始听起来是个好主意，但问题在于这种类型的数据非常敏感。这是人们不希望让任何人随意接触的信息。如果不按照正确的程序收集、存储和使用数据，模型可能会违反许多数据隐私法律。这反过来可能导致严重后果，比如巨额罚款甚至法律诉讼。更不用说，这可能会严重损害公司的声誉。

关于生成式人工智能在未引用原始来源的情况下窃取互联网信息的讨论已经有所耳闻。这可能发生在像Midjourney和Stable Diffusion这样的AI艺术作品中，其中艺术家的风格被AI“复制”了。关于使用公共数据的当前政策是一个持续讨论的话题。私下获取的数据则是另一回事。但是用户数据应始终得到用户的同意。

未做实时扩展准备

我们正在为一个令人兴奋的新应用程序构建一个AI模型。它使用人工智能为每个用户创建个性化的输出。我们已经测试了我们的模型，但只针对了有限数量的人。因此，我们推出我们的应用程序，认为一切都准备就绪。但是突然之间它一夜之间传播开来，现在我们有成千上万，甚至可能有数百万的用户同时访问系统。

如果我们没有为这种规模做计划，AI模型可能无法跟上并超负荷使用资源。这就是为什么从一开始就计划实时扩展非常重要。考虑模型如何处理大量用户，然后设计它以高效地扩展（和缩减）。确保基础设施能够处理数据处理的激增，并计划如何管理增加的存储需求。

您可以设定用户上限以确保服务器不会超载，但可能会失去潜在用户。想想ChatGPT刚推出时的情况。它是一个快速增长的互联网应用程序，在短短两个月内就拥有了1亿用户。在某个时期，用户无法访问该网站，而只会看到“我们已达到容量上限”的消息。由于没有预料到用户的巨大增加，OpenAI在页面的页眉中告诉用户正在升级基础设施。

当然，不要过度准备，避免产生无法承担的巨大创业成本。

过多或过少的训练

当模型对训练数据学习得太好，却在测试和实际数据上表现不佳时，就会出现过拟合的情况，就像仅仅是记忆而不是应用推理一样。过拟合的模型缺乏泛化能力。当模型在训练数据集上过度训练时，就会导致过拟合。

使用正则化技术，如L1（Lasso）和L2（Ridge），向损失函数添加惩罚项，约束模型的系数，防止它们变得过大。

但是训练过少可能会导致欠拟合，即模型对数据的理解过于简单，无法捕捉数据的潜在属性。模型对训练数据的了解不足，使其在实际数据上表现同样糟糕。

为了解决欠拟合问题，您可能需要一个更复杂的模型、更多的特征、更多的数据，甚至使用合成数据。您可以增加神经网络中的参数数量或增加决策树的最大深度。

在不真实数据上训练AI模型

当研究人员训练和测试模型时，他们通常使用干净、标记良好且通常不反映实际数据分布的数据集。因此，结果在纸上看起来很令人印象深刻，因为模型在与训练数据相同分布的测试数据上表现良好。这被称为“内分布”性能。

然而，在实际情况下，模型遇到的数据（“外分布”数据）往往具有不同于它所训练的数据分布。数据可能嘈杂，标签不够清晰，或包含训练数据中未见的类别和特征。因此，当模型在真实世界中部署时，其性能可能会显著下降。这被称为“外分布”性能。

这个挑战导致对“强健人工智能”的日益关注，其中包括开发能够在面对“外分布”数据时仍然保持性能的模型。解决这个问题的一种方法是使用诸如域适应之类的技术，试图调整模型的预测结果以更好地适应新的数据分布。

不解决或不考虑偏见

AI模型中的偏见发生在算法由于训练数据或模型设计方式中的潜在偏见而产生系统性错误或不公平决策。因为AI模型是由人类训练的，所以它们会继承人类的偏见。

如果AI模型没有经过偏见检查，它可能会学习并复制不公平的模式，从而对某些数据点造成系统性的不利影响。要避免数据集中的偏见很困难，因此解决偏见的一个好方法是制定准则和规则，监视和审查，以及共享如何选择和清理数据的方式，确保了解和解决偏见的影响。

忽视模型可理解性

很容易设置模型、运行它，然后离开，希望它能够正常工作。为了使人工智能得到采用和信任，必须使其决策透明、可理解和可解释，以负责任的人工智能和维护人工智能伦理。

神经网络被称为黑盒子，因为它们的内部运作很难揭示和理解，这使得发现模型输出错误正例的原因变得困难。

科学家一直在努力使复杂的人工智能模型，如深度神经网络，更加透明和可理解。他们提出了一些技术来帮助解释为什么这些模型会做出某些决策。

其中一种方法是使用注意机制或显著性地图，这些机制或地图可以突出显示影响模型决策的输入的重要部分。这使用户可以看到哪些方面产生了最大的影响。

话虽如此，保持透明度和确保人工智能模型易于理解的最佳方法是保持全面的文档记录。这份文档应包括有关用于训练人工智能模型的数据的详细信息，包括数据的来源、质量以及应用的任何预处理步骤。

通过保持全面的文档记录，我们提供了关于模型基础和数据优化步骤的透明度。这份详细的文档记录有助于更清晰地理解人工智能模型，并增强对其决策过程的信心。

忽视持续监控

由于每天数据的变化和基础模式的变动，模型可能变得过时或不够准确。这些变化可能源于各种因素，如消费者行为的演变、市场趋势的出现、竞争环境的变化、政策修改，甚至是像大流行病这样的全球事件。这种现象通常被称为概念漂移。

因此，对于持续预测产品需求的公司来说，监控模型在时间上的性能是至关重要的。即使模型最初可能提供准确的预测，随着时间的推移，由于现实数据中的上述变化，其准确性可能会下降。为了解决这个问题，公司需要通过持续跟踪模型的输出与实际需求，并实时监控性能指标来进行定期的实时监控。

此外，应用增量学习技术至关重要。这种方法使模型能够从新数据中学习，同时保留先前观察到的有价值的知识。

通过采用这些策略，公司可以有效应对概念漂移，不会忽视宝贵的先前信息，并确保对产品需求进行准确预测。

开发最佳的人工智能模型

成功地在人工智能开发领域航行并不是一件轻而易举的事情。这是一段充满了许多考虑因素、一点不确定性和潜在陷阱的旅程。但是，凭借对细节的敏锐观察力、对伦理实践的承诺以及对强大方法的牢固掌握，我们可以创建出不仅有效和高效，而且负责任和伦理的人工智能解决方案。