[paddle 参数更多]flash_attn.ops.rms_norm.rms_norm

flash_attn.ops.rms_norm.rms_norm

flash_attn.ops.rms_norm.rms_norm(x, weight, epsilon)

paddle.incubate.nn.functional.fused_rms_norm

paddle.incubate.nn.functional.fused_rms_norm(x, norm_weight, norm_bias, epsilon, begin_norm_axis, bias=None, residual=None, quant_scale=- 1, quant_round_type=0, quant_max_bound=0, quant_min_bound=0)

其中 Paddle 相比 PyTorch 支持更多其他参数,具体如下:

参数映射

flash_attn PaddlePaddle 备注
x x 输入 Tensor。
weight norm_weight 用于仿射输出的权重张量。
epsilon epsilon 用于仿射输出的偏置张量。
- norm_bias 用于仿射输出的偏置张量,PyTorch 无此参数,Paddle 保持默认即可。
- begin_norm_axis 归一化的起始轴,PyTorch 无此参数,Paddle 保持默认即可。
- bias 前一层的偏置,PyTorch 无此参数,Paddle 保持默认即可。
- residual 输入的残差,PyTorch 无此参数,Paddle 保持默认即可。
- quant_scale 量化缩放因子,PyTorch 无此参数,Paddle 保持默认即可。
- quant_round_type 量化四舍五入类型,PyTorch 无此参数,Paddle 保持默认即可。
- quant_max_bound 量化裁剪的最大边界值,PyTorch 无此参数,Paddle 保持默认即可。
- quant_min_bound 量化裁剪的最小边界值,PyTorch 无此参数,Paddle 保持默认即可。