“Skoltech和AIRI的研究人员开发了一种新的算法，利用神经网络在不同领域之间进行最优数据传输”

“Skoltech和AIRI的研究人员开发了一种新的算法，利用神经网络在不同领域之间进行最优数据传输” 四海第1张

自从大规模的OT和Wasserstein GANs出现以来，机器学习越来越倾向于使用神经网络来解决最优传输（OT）问题。最近，OT计划被证明可作为具有可比实际任务性能的生成模型使用。OT成本通常被计算并用作生成模型中生成器更新的损失函数。

人工智能研究所（AIRI）和斯科尔科技学院合作开发了一种利用神经网络优化跨学科信息共享的新算法。该算法的理论基础使其输出更易于理解，而不像竞争方法那样需要耦合训练数据集，如输入-输出示例，这种新方法可以在输入和输出领域的不同数据集上进行训练。

大规模训练数据集很难获得，但对于面部或语音识别以及医学图像分析等应用构建的现代机器学习模型来说是必要的。这就是为什么科学家和工程师经常通过人工手段模拟真实世界数据集的原因。生成模型的最新进展大大提高了生成文本和图像的质量，因此这项工作变得更加容易。

神经网络被教导从配对的训练样本和输入-输出图像集泛化和扩展到新的输入图像；这对于需要处理许多质量不同的相同照片的工作非常有用。换句话说，生成模型通过合成来自不同数据的数据，促进了从一个领域到另一个领域的过渡。例如，神经网络可以将手绘图转换为数字图像，或者改善卫星照片的清晰度。

将概率分布与确定性和随机传输映射对齐是该技术的独特应用，它是一种通用工具。该方法将增强非配对翻译（图像恢复，域适应性等）以外的现有模型。与基于GAN或扩散模型的常见方法相比，该方法允许更好地控制生成样本的多样性水平，并提高了学习映射的可解释性。研究人员可能需要修改所获得的OT映射以适应非配对活动。研究人员强调了某些任务的运输成本设计作为一个潜在的研究领域。

最优传输和生成学习的交集是所选择方法的核心。娱乐、设计、计算机图形学、渲染等领域广泛使用生成模型和高效的传输。上述领域中的几个问题可能适用于该方法。可能的缺点是，一些图形业务中的职业可能会受到先前工具的使用的影响，这些工具使图像处理技术公开可用。

由于成本过高或获取困难，研究人员通常不得不使用不相关的数据集，而不是理想的匹配数据集。团队回顾了苏联数学家和经济学家列昂尼德·坎托罗维奇的著作，借鉴了他关于有效货物运输（最优传输理论）的思想，以开发一种在领域之间规划最优数据传输的新方法。神经最优传输是一种使用深度神经网络和分开的数据集的新方法。

在非配对领域转换评估中，该算法在图片风格化和其他任务上实现了比现有方法更好的结果。此外，它需要较少的超参数，通常很难调整，具有更可解释的结果，并且基于坚实的数学基础而不是竞争方法。