batch_norm

paddle.static.nn. batch_norm ( input, act=None, is_test=False, momentum=0.9, epsilon=1e-05, param_attr=None, bias_attr=None, data_layout='NCHW', in_place=False, name=None, moving_mean_name=None, moving_variance_name=None, do_model_average_for_mean_and_var=False, use_global_stats=False ) [源代码] 

批正则化层（Batch Normalization Layer）

可用作卷积和全连接操作的批正则化函数，根据当前批次数据按通道计算的均值和方差进行正则化。该层需要的数据格式如下：

1.NHWC[batch,in_height,in_width,in_channels]
2.NCHW[batch,in_channels,in_height,in_width]

input 是 mini-batch 的输入。

\[ \begin{align}\begin{aligned}\begin{split}\mu_{\beta} &\gets \frac{1}{m} \sum_{i=1}^{m} x_i \qquad &//\ \ mini-batch\ mean \\ \sigma_{\beta}^{2} &\gets \frac{1}{m} \sum_{i=1}^{m}(x_i - \mu_{\beta})^2 \qquad &//\ \ mini-batch\ variance \\ \hat{x_i} &\gets \frac{x_i - \mu_\beta} {\sqrt{\sigma_{\beta}^{2} + \epsilon}} \qquad &//\ normalize \\ y_i &\gets \gamma \hat{x_i} + \beta \qquad &//\ scale\ and\ shift\end{split}\\\begin{split}moving\_mean = moving\_mean * momentum + mini\_batch\_mean * (1. - momentum) \\ moving\_variance = moving\_variance * momentum + mini\_batch\_var * (1. - momentum)\end{split}\end{aligned}\end{align} \]

moving_mean 和 moving_var 是训练过程中统计得到的全局均值和方差，在预测或者评估中使用。 is_test 参数只能用于测试或者评估阶段，如果想在训练阶段使用预训练模型的全局均值和方差的话，可以设置 use_global_stats=True。

当 use_global_stats = True 时，\(\mu_{\beta}\) 和 \(\sigma_{\beta}^{2}\) 不是一个 minibatch 的统计数据。它们是全局（或运行）统计数据（moving_mean 和 moving_variance），通常来自预先训练好的模型。训练和测试（或预测）具有相同的行为：

\[\begin{split}\hat{x_i} &\gets \frac{x_i - \mu_\beta} {\sqrt{\ \sigma_{\beta}^{2} + \epsilon}} \\ y_i &\gets \gamma \hat{x_i} + \beta\end{split}\]

参数

input (Tensor) - batch_norm 算子的输入特征，是一个 Tensor 类型，输入维度可以是 2, 3, 4, 5。数据类型：flaot16, float32, float64。

act （string）- 激活函数类型，可以是 leaky_realu、relu、prelu 等。默认：None。

is_test （bool） - 指示它是否在测试阶段，非训练阶段使用训练过程中统计到的全局均值和全局方差。默认：False。

momentum （float|Tensor）- 此值用于计算 moving_mean 和 moving_var，是一个 float 类型或者一个 shape 为[1]，数据类型为 float32 的 Tensor 类型。更新公式为：\(moving\_mean = moving\_mean * momentum + new\_mean * (1. - momentum)\) ， \(moving\_var = moving\_var * momentum + new\_var * (1. - momentum)\)，默认：0.9。

epsilon （float）- 加在分母上为了数值稳定的值。默认：1e-5。

param_attr (ParamAttr|None)：指定权重参数属性的对象。默认值为 None，表示使用默认的权重参数属性。具体用法请参见 ParamAttr 。batch_norm 算子默认的权重初始化是 1.0。

bias_attr （ParamAttr|None）- 指定偏置参数属性的对象。默认值为 None，表示使用默认的偏置参数属性。具体用法请参见 ParamAttr 。batch_norm 算子默认的偏置初始化是 0.0。

data_layout （string) - 指定输入的数据格式，输出的数据格式将与输入保持一致，可以是"NCHW"和"NHWC"。N 是批尺寸，C 是通道数，H 是特征高度，W 是特征宽度。默认值："NCHW"。

in_place （bool）- batch_norm 的输出复用输入的 tensor，可以节省显存。默认：False。

name (str，可选) - 具体用法请参见 api_guide_Name，一般无需设置，默认值为 None。

moving_mean_name （string）- moving_mean 的名称，存储全局均值。如果将其设置为 None, batch_norm 将随机命名全局均值；否则，batch_norm 将命名全局均值为 moving_mean_name。默认：None。

moving_variance_name （string）- moving_variance 的名称，存储全局变量。如果将其设置为 None, batch_norm 将随机命名全局方差；否则，batch_norm 将命名全局方差为 moving_variance_name。默认：None。

do_model_average_for_mean_and_var （bool，默认 False）- 是否为 mean 和 variance 做模型均值。

use_global_stats （bool） – 是否使用全局均值和方差。在预测或测试模式下，将 use_global_stats 设置为 true 或将 is_test 设置为 true，并且行为是等效的。在训练模式中，当设置 use_global_stats 为 True 时，在训练期间也使用全局均值和方差。默认：False。

返回

维度和输入相同的 Tensor，在输入中运用批正则后的结果。

代码示例

          >>> import paddle

>>> paddle.enable_static()
>>> x = paddle.static.data(name='x', shape=[3, 7, 3, 7], dtype='float32')
>>> hidden1 = paddle.static.nn.fc(x=x, size=200)
>>> print(hidden1.shape)
(3, 200)
>>> hidden2 = paddle.static.nn.batch_norm(input=hidden1)
>>> print(hidden2.shape)
(3, 200)