公司使用时间序列预测来进行核心计划决策,帮助他们在不确定的未来中导航。本文旨在解决供应链利益相关者的需求,他们需要确定在各种计划时间范围内需要多少完成品。除了需要知道需要多少单位的商品外,企业常常需要知道它们将在哪里需要,以创建地理上最优的库存。
过剩与供不应求的微妙平衡
如果制造商生产的零部件或成品太少,导致供不应求,他们将不得不在其贸易伙伴或业务部门之间分配有限的资源。结果,采购订单的接受率可能较低,利润较少。在供应链的下游,如果零售商的产品供应不足,无法满足需求,可能会让购物者感到失望。当零售购物者有紧急需求时,这些缺货问题可能导致转向其他零售商或可替代品牌购买。如果替代品成为新的默认选择,这种替代可能会造成客户迁移的风险。
在供应摆动的另一端,商品过剩也会带来惩罚。多余的商品必须在库存中保存,直到售出。一定程度上的安全库存有助于处理预期的需求不确定性;然而,过剩库存会导致效率低下,削弱组织的利润。特别是当产品具有时效性时,过剩可能导致对获取可销售成品的初始投资的全部或部分损失。
即使产品是不易腐烂的,在存储过程中,它们实际上成为了一种闲置资源,可能应该作为自由现金出现在资产负债表上,或用于追求其他投资。抛开资产负债表不谈,存储和运输成本并不是免费的。组织通常只拥有有限数量的仓储和物流能力。他们必须在这些限制下高效利用现有资源。
面对过剩与供不应求的选择,大多数组织通常更愿意选择过剩。供不应求的可衡量成本通常较高,有时可能是过剩成本的数倍,我们将在接下来的部分讨论这种成本。
偏向过剩的主要原因是避免产品缺货时与客户失去的无形成本。制造商和零售商考虑的是长期的客户价值,并希望培养品牌忠诚度,这有助于制定供应链战略。
在本节中,我们对在需求规划过程中分配过多或过少资源导致的不公平进行了调查。接下来,我们将探讨时间序列预测以及如何将需求预测与物品级别的供应策略进行最优匹配。
经典的销售和运营计划周期方法
从历史上看,预测是通过统计方法实现的,其结果是点预测,为未来提供最可能的值。这种方法通常基于移动平均或线性回归的方式,以普通最小二乘法拟合模型。点预测由单个均值预测值组成。由于点预测值集中在均值上,预计真实值将有大约50%的时间高于均值。这意味着剩下的50%的时间真实数值将低于点预测。
点预测可能很有趣,但如果不进行专家评审,导致零售商在50%的时间里无法供应必需品。为了避免对顾客的不足服务,供应和需求规划者会应用手动判断修正或通过安全库存公式调整点预测。公司可能会根据自己的解释来使用安全库存公式,但其目的是帮助确保通过不确定的短期范围内提供产品供应。最终,规划者需要根据他们的规则、解释和对未来的主观看法决定是增加还是减少均值点预测预测。
现代的最先进时间序列预测提供了选择
为了满足现实世界的预测需求,AWS提供了一套广泛而深入的功能,为时间序列预测提供了现代化的方法。我们提供包括但不限于Amazon SageMaker Canvas(有关详细信息,请参阅Train a time series forecasting model faster with Amazon SageMaker Canvas Quick build)、Amazon Forecast(有关时间序列预测的成功开始,请参阅Start your successful journey with time series forecasting with Amazon Forecast)和Amazon SageMaker内置算法(使用Amazon SageMaker实现深度需求预测的详细信息,请参阅Deep demand forecasting with Amazon SageMaker)的机器学习(ML)服务。此外,AWS开发了一个开源软件包AutoGluon,支持包括时间序列领域在内的各种ML任务。更多信息,请参阅Easy and accurate forecasting with AutoGluon-TimeSeries。
考虑前一节讨论的点预测。现实世界的数据比平均数或直线回归估计更复杂。此外,由于供过于求的不平衡,您需要不止一个单点估计。 AWS服务通过使用与分位数回归相结合的机器学习模型来解决这个需求。分位数回归使您能够从一系列规划场景中进行选择,这些场景用分位数表示,而不是依赖单点预测。正是这些分位数提供了选择,我们在下一节中将详细介绍。
为客户服务和促进业务增长而设计的预测
下图提供了通过分位数回归实现的多结果时间序列预测的视觉效果。红线代表p05,它表示真实数字(无论是什么)有约5%的可能性预计低于p05线。相反,意味着真实数字有95%的可能性会超过p05线。
接下来,请注意绿线,标有p70。真实值大约70%的时间会低于p70线,剩余30%的时间可能会超过p70。 p50线提供了关于未来的中间观点,平均而言,值有50%的可能低于或高于p50。这些只是示例,但任何分位数都可以以相同的方式解释。
在以下部分中,我们将讨论如何使用历史数据来衡量分位数预测是否存在过度供应或不足供应。
通过历史数据衡量过度供应和不足供应
前一节演示了观察预测的图形方式;另一种查看它们的方式是以表格方式呈现,如下表所示。在创建时间序列模型时,部分数据被保留以进行训练操作,这使得可以生成准确性度量。尽管未来是不确定的,但主要思想是在保留期间的准确性是明天预测表现的最佳近似,其他条件相同。
该表格不显示准确性度量;相反,它显示了过去已知的真实值和多个分位数预测,从p50到p90,步长为10。在最近的5个历史时间段内,真实需求量为218个单位。分位数预测提供了一系列值,从189个单位的最低值到314个单位的最高值。通过以下表格,很容易看出p50和p60会导致供应不足,而最后三个分位数会导致供应过剩。
我们之前指出过供应过剩和供应不足之间存在不对称性。大多数有意过剩供应的企业都是为了避免让客户失望。关键问题是:“对于未来,企业应该根据哪个分位数预测数字进行计划?”考虑到存在的不对称性,需要做出权衡决策。下一节将介绍将预测数量(以单位)转换为其各自的财务含义的方法。
根据最大化利润或客户服务目标自动选择正确的分位数点
要将分位值转换为业务值,我们必须找到与每单位积压量和每单位缺货量相关的惩罚,因为它们很少是相等的。满足这种需求的解决方案在运营研究领域有详细的文档和研究,被称为新闻供应商问题。 Whitin(1955)是第一个提出包含定价效应的需求模型的人。新闻供应商问题得名于过去新闻销售者必须决定购买多少份报纸的时期。如果他们选择的数字太低,他们会早早卖完,无法达到当天的收入潜力。如果他们选择的数字太高,他们就会被困在“昨天的新闻”中,并冒着失去早间投资的一部分的风险。
为计算每单位的过量和不足惩罚,每个您想要预测的物品都需要一些必要的数据。根据业务需求,您还可以通过指定数据为物品位置对、物品客户对或其他组合来增加复杂性。
- 物品的预期销售价值。
- 购买或制造物品的全部成本。
- 若未售出,与库存持有物品相关的预计持有成本。
- 若未售出,物品的残值。如果易变质,则残值可能接近零,导致原始成本投资完全损失。当货架稳定时,残值可以在物品的预期销售价值以下的任何位置,取决于储存和潜在陈旧物品的性质。
以下表格演示了如何从已知历史周期的可用预测点中自我选择分位点。以物品3为例,先前周期的真实需求为1,578个单位。一个p50估计值1,288个单位会导致供应不足,而一个p90值2,578个单位会产生剩余。在观察到的分位数中,p70值产生了最大利润$7,301。从中我们可以知道,与p70值相比,p50选择将导致近$1,300的惩罚。这只是一个例子,但表格中的每个物品都有一个独特的故事。
解决方案概述
下图说明了一个拟议的工作流程。首先,Amazon SageMaker数据整理器使用由时间序列预测器产生的回测预测。接下来,将回测预测和已知实际数据基于物品进行连接,并使用财务元数据。此时,使用回测预测,SageMaker数据整理器进行转换,计算每个物品的过量和不足预测单位成本。
SageMaker数据整理器将单位预测转换为财务环境,并自动选择提供在检查的分位数中获得最高利润的物品特定分位数。输出是一组存储在Amazon S3上的表格数据,概念上类似于上一节中的表格。
最后,使用时间序列预测器为未来周期生成未来日期的预测。在这里,您还可以选择根据选择的分位数驱动推理操作或对推理数据进行操作。这可以让您降低计算成本,同时消除手动审核每个物品的负担。您公司的专家可以有更多时间专注于高价值的物品,而您的目录中的数千个物品可以自动调整。需要考虑的一点是,未来具有一定程度的不确定性。然而,其他条件相同的情况下,混合选择分位数应该优化时间序列的结果。在AWS,我们建议您使用两个保留回测周期来量化混合分位数选择带来的改进程度。
加速实施的解决方案指南
如果您希望重新创建本文讨论的分位数选择解决方案并将其适应于您自己的数据集,我们提供了一个合成样本数据集和一个示例SageMaker数据整理器流程文件的样本,以帮助您在GitHub上开始工作。整个实践经验应该能在一个小时内完成。
我们提供本文和示例解决方案指南来帮助您加快上市时间。推荐特定分位数的主要助推因素是SageMaker数据整理器,这是一个专为减少为ML应用程序准备数据所需的时间而构建的AWS专用服务。SageMaker数据整理器提供了一个可视化界面,用于设计数据转换、分析数据和执行特征工程。
如果您是SageMaker数据整理器的新用户,请参考入门数据整理器,了解如何通过Amazon SageMaker Studio启动该服务。此外,我们还有超过150篇博文,帮助了解该服务所处理的各种样本数据转换。
结论
在本文中,我们讨论了分位数回归如何在时间序列预测中实现多个业务决策点。我们还讨论了与过度预测和欠预测相关的不平衡成本惩罚——通常而言,欠供应的惩罚是过供应的几倍,更不用说欠供应可能会导致与客户的商誉损失。
本文讨论了组织如何评估多个分位数预测点,考虑到每个项目的过供应和欠供应成本,以自动选择在未来时期能够提供最大利润的分位数。在必要时,业务规则可以重写选择,选择固定的分位数而不是动态的分位数。
该过程旨在帮助实现业务和财务目标,同时消除手动对每个预测项目应用判断的摩擦。SageMaker数据整理器有助于该过程的持续运行,因为分位数选择必须随着不断变化的实际数据而动态进行。
值得注意的是,分位数选择不是一次性事件。在每个预测周期中,应该进行评估,以考虑包括物品成本增加、通胀、季节性调整、新产品引入、消费者需求变化等变化。所提议的优化过程位于时间序列模型生成之后,被称为模型训练步骤。分位数选择是在未来预测生成步骤中进行的,并且有时被称为推断步骤。
如果您对本文有任何问题,或希望深入了解您独特的组织需求,请与您的AWS账户团队、AWS解决方案架构师联系,或在我们的支持中心中开启一个新的案例。
参考资料
- DeYong, G. D. (2020). The price-setting newsvendor: review and extensions. International Journal of Production Research, 58(6), 1776–1804.
- Liu, C., Letchford, A. N., & Svetunkov, I. (2022). Newsvendor problems: An integrated method for estimation and optimisation. European Journal of Operational Research, 300(2), 590–601.
- Punia, S., Singh, S. P., & Madaan, J. K. (2020). From predictive to prescriptive analytics: A data-driven multi-item newsvendor model. Decision Support Systems, 136.
- Trapero, J. R., Cardós, M., & Kourentzes, N. (2019). Quantile forecast optimal combination to enhance safety stock estimation. International Journal of Forecasting, 35(1), 239–250.
- Whitin, T. M. (1955). Inventory control and price theory. Management Sci. 2 61–68.