噪声网络 (noisy net) 是 DeepMind 在 2017 年提出的一种方法,发表在 2018 年的 ICLR 会议上。它的基本思想是在神经网络的权重中引入噪声,以增加探索性。噪声网络可以用于增加探索性,也可以用于增加随机性,从而增加鲁棒性。它可以用于 DQN, A3C 等几乎所有深度强化学习算法。

具体来说,噪声网络把神经网络中的参数 替换成 ,其中 是权重的均值, 是权重的标准差, 是一个服从标准正态分布的随机变量, 表示逐项乘积。这样,神经网络的权重就变成了随机变量。在训练时,噪声网络使用包含噪声的权重进行计算,而测试时则使用均值 进行计算。