[ 参数不一致 ]torch.nn.SyncBatchNorm

torch.nn.SyncBatchNorm

torch.nn.SyncBatchNorm(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True, process_group=None, device=None, dtype=None)

paddle.nn.SyncBatchNorm

paddle.nn.SyncBatchNorm(num_features, epsilon=1e-5, momentum=0.9, weight_attr=None, bias_attr=None, data_format='NCHW', name=None)

两者功能一致但参数不一致,部分参数名不同,具体如下:

参数映射

| PyTorch | PaddlePaddle | 备注 | | ————- | ———— | —————————————————— | | num_features | num_features | 表示输入 Tensor 通道数。 | | eps | epsilon | 为了数值稳定加在分母上的值。 | | momentum | momentum | 表示归一化函数中的超参数, PyTorch 和 Paddle 公式实现细节不一致,两者正好是相反的,需要转写。 | | - | weight_attr | 指定权重参数属性的对象。如果为 False, 则表示每个通道的伸缩固定为 1,不可改变。默认值为 None,表示使用默认的权重参数属性。 | | - | bias_attr | 指定偏置参数属性的对象。如果为 False, 则表示每一个通道的偏移固定为 0,不可改变。默认值为 None,表示使用默认的偏置参数属性。 | | - | data_format | 指定输入数据格式, Pytorch 无此参数,Paddle 保持默认即可。 | | affine | - | 是否进行反射变换, Paddle 无此参数,需要转写。 | | track_running_stats | use_global_stats | 表示是否已加载的全局均值和方差。 | | process_group | - | 统计信息的同步分别在每个进程组内发生, Paddle 无此参数,暂无转写方式。 | | device | - | 设备类型,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 | | dtype | - | 参数类型,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |

转写示例

affine:是否进行反射变换

affine=False 时,表示不更新:

# PyTorch 写法
m = torch.nn.SyncBatchNorm(24, affine=False)

# Paddle 写法
m = paddle.nn.SyncBatchNorm(24, weight_attr=False, bias_attr=False)

affine=True 时,表示更新:

# PyTorch 写法
m = torch.nn.SyncBatchNorm(24)

# Paddle 写法
m = paddle.nn.SyncBatchNorm(24)

momentum:

# PyTorch 写法
m = torch.nn.SyncBatchNorm(24, momentum=0.2)

# Paddle 写法
m = paddle.nn.SyncBatchNorm(24, momentum=0.8)