data_norm¶

paddle.static.nn. data_norm ( input, act=None, epsilon=1e-05, param_attr=None, data_layout='NCHW', in_place=False, name=None, moving_mean_name=None, moving_variance_name=None, do_model_average_for_mean_and_var=False, slot_dim=- 1, sync_stats=False, summary_decay_rate=0.9999999, enable_scale_and_shift=False ) [源代码] ¶

数据正则化层

可用作 conv2d 和 fully_connected 操作的正则化函数。此层所需的数据格式为以下之一：

NHWC [batch, in_height, in_width, in_channels]
NCHW [batch, in_channels, in_height, in_width]

\(input\) 为一个 mini-batch 上的特征：

\[\begin{split}\mu_{\beta} &\gets \frac{1}{m} \sum_{i=1}^{m} x_i \qquad &//\ \ mini-batch\ mean \\ \sigma_{\beta}^{2} &\gets \frac{1}{m} \sum_{i=1}^{m}(x_i - \ \mu_{\beta})^2 \qquad &//\ mini-batch\ variance \\ \hat{x_i} &\gets \frac{x_i - \mu_\beta} {\sqrt{\ \sigma_{\beta}^{2} + \epsilon}} \qquad &//\ normalize \\ y_i &\gets \gamma \hat{x_i} + \beta \qquad &//\ scale\ and\ shift\end{split}\]

参数¶

input (Tensor) - 输入变量。

act (str，可选) - 激活函数类型，线性| relu | prelu | ...，默认值为 None。

epsilon (float，可选) - 指明在计算过程中是否添加较小的值到方差中以防止除零。默认值：1e-05。

param_attr (ParamAttr，可选) - 参数比例的参数属性。默认值为 None。

data_layout (str，可选) - 指定输入的数据格式，输出的数据格式将与输入保持一致，可以是"NCHW"和"NHWC"。N 是批尺寸，C 是通道数，H 是特征高度，W 是特征宽度。默认值："NCHW"。

in_place (bool，可选) - 是否使 data_norm 的输入和输出复用同一块内存，默认值为 False。

name (str，可选) - 具体用法请参见 Name，一般无需设置，默认值为 None。

moving_mean_name (str，可选) - 存储全局 Mean 的 moving_mean 的名称。默认值为 None。

moving_variance_name (str，可选) - 存储全局 Variance 的 moving_variance 的名称。默认值为 None。

do_model_average_for_mean_and_var (bool，可选) - 是否为 mean 和 variance 进行模型平均。默认值为 False。

slot_dim (int，可选) - 一个 slot 的 embedding 维度，slot 用来表征一类特征的集合，在 pslib 模式下，通常我们通过 slot 区分特征 id，并从参数服务器 (pslib) 中提取它们的 embedding。embedding 的第一维是历史上这个 embedding 展示的次数。如果本 op 的输入是由这样的 embedding 连接而来，那么当这个特征 id 是新的或空的，则正则化结果可能不实际。为了避免这种情况，我们添加了 slot_dim 来定位并判断这一维是否为零。如果是的话，我们选择跳过正则化。默认值为 -1。

sync_stats (bool，可选) - 在多 GPU 卡的场景下可以使用，用来同步多卡间的 summary 信息。默认值为 False。

summary_decay_rate (float，可选) - 更新 summary 信息时的衰减率。默认值为 0.9999999。

enable_scale_and_shift (bool，可选) - 在分布式全局正则化后是否做像 batchnorm 一样做 scale&shift 的操作。默认值为 False。

返回¶

Tensor，是对输入数据进行正则化后的结果。

代码示例¶

          >>> import paddle
>>> paddle.enable_static()

>>> x = paddle.randn(shape=[32, 100])
>>> hidden2 = paddle.static.nn.data_norm(input=x)