Press "Enter" to skip to content

使用符号回归向Elo著名的评级系统添加不确定性

创建一个意外有用的评级算法

Photo by JESHOOTS.COM on Unsplash

通用评级系统

Elo评级系统在一些领域里变得非常有名。最著名的可能是自1960年以来一直是国际象棋评级的基础。此外,网站538成功地对其进行了修改,并用于大多数其著名的体育评级。而在不太为人知的情况下,许多视频游戏开发者在其匹配系统的幕后使用Elo系统的变体。如果您正在阅读本文,我将假设您对该系统有一定的了解。为什么它在如此多的情境中如此使用?我认为这是因为它的计算扩展性、多功能性和简单性。然而,它也有一些缺点。在本文中,我们将解决一个非常关键的问题,同时保持上述优势。

符号回归

尽管当前所有的注意力都集中在大型语言模型上(有意思的双关语),但还有其他令人兴奋的模型在单独开发,用途完全不同。符号回归通常适用于发现封闭形式的分析规则,而不是攻击深度学习任务,如对图像进行分类或翻译音频记录。例如,如果您想重新发现牛顿冷却定律,您可以构建一个资源密集型的密集神经网络。它在有足够数据的情况下表现良好,但无法推广到它没有见过的情况。然而,符号回归将是完成任务的正确工具。它可以在有限的数据情况下找到精确的公式,因此不仅可以推广,还可以节省相当多的计算资源。Cranmer等人的一篇我最喜欢的论文进一步探讨了这个问题,甚至提出了一个以前未被发现的关于暗物质过密度的方程。

问题

经典的Elo评级系统将每个评级都视为同等的确定性。这通常是大规模评级系统的一个错误假设。简单来说,评级系统的新手几乎总是应该具有比已经存在一段时间的人更大的方差。同样,评级系统长时间没有见到的玩家…

Leave a Reply

Your email address will not be published. Required fields are marked *