Press "Enter" to skip to content

Tag: Policy Gradient

从零开始构建交叉熵，理解策略梯度

Published June 13, 2023 by 四海吧

很难掌握策略梯度的直觉本文通过从头开始构建监督学习中熟悉的交叉熵，为策略梯度提供了直觉，从而更深入地理解强化学习和监督学习的本质

Continue reading

Leave a Comment

Web Analytics