[paddle 参数更多]flash_attn.ops.rms_norm.rms_norm¶
flash_attn.ops.rms_norm.rms_norm¶
flash_attn.ops.rms_norm.rms_norm(x, weight, epsilon)
paddle.incubate.nn.functional.fused_rms_norm¶
paddle.incubate.nn.functional.fused_rms_norm(x, norm_weight, norm_bias, epsilon, begin_norm_axis, bias=None, residual=None, quant_scale=- 1, quant_round_type=0, quant_max_bound=0, quant_min_bound=0)
其中 Paddle 相比 PyTorch 支持更多其他参数,具体如下:
参数映射¶
flash_attn | PaddlePaddle | 备注 |
---|---|---|
x | x | 输入 Tensor。 |
weight | norm_weight | 用于仿射输出的权重张量。 |
epsilon | epsilon | 用于仿射输出的偏置张量。 |
- | norm_bias | 用于仿射输出的偏置张量,PyTorch 无此参数,Paddle 保持默认即可。 |
- | begin_norm_axis | 归一化的起始轴,PyTorch 无此参数,Paddle 保持默认即可。 |
- | bias | 前一层的偏置,PyTorch 无此参数,Paddle 保持默认即可。 |
- | residual | 输入的残差,PyTorch 无此参数,Paddle 保持默认即可。 |
- | quant_scale | 量化缩放因子,PyTorch 无此参数,Paddle 保持默认即可。 |
- | quant_round_type | 量化四舍五入类型,PyTorch 无此参数,Paddle 保持默认即可。 |
- | quant_max_bound | 量化裁剪的最大边界值,PyTorch 无此参数,Paddle 保持默认即可。 |
- | quant_min_bound | 量化裁剪的最小边界值,PyTorch 无此参数,Paddle 保持默认即可。 |