[paddle 参数更多]flash_attn.ops.rms_norm.rms_norm¶

flash_attn.ops.rms_norm.rms_norm ¶

flash_attn.ops.rms_norm.rms_norm(x, weight, epsilon)

paddle.incubate.nn.functional.fused_rms_norm ¶

paddle.incubate.nn.functional.fused_rms_norm(x, norm_weight, norm_bias, epsilon, begin_norm_axis, bias=None, residual=None, quant_scale=- 1, quant_round_type=0, quant_max_bound=0, quant_min_bound=0)

其中 Paddle 相比 PyTorch 支持更多其他参数，具体如下：

参数映射¶

flash_attn	PaddlePaddle	备注
x	x	输入 Tensor。
weight	norm_weight	用于仿射输出的权重张量。
epsilon	epsilon	用于仿射输出的偏置张量。
-	norm_bias	用于仿射输出的偏置张量，PyTorch 无此参数，Paddle 保持默认即可。
-	begin_norm_axis	归一化的起始轴，PyTorch 无此参数，Paddle 保持默认即可。
-	bias	前一层的偏置，PyTorch 无此参数，Paddle 保持默认即可。
-	residual	输入的残差，PyTorch 无此参数，Paddle 保持默认即可。
-	quant_scale	量化缩放因子，PyTorch 无此参数，Paddle 保持默认即可。
-	quant_round_type	量化四舍五入类型，PyTorch 无此参数，Paddle 保持默认即可。
-	quant_max_bound	量化裁剪的最大边界值，PyTorch 无此参数，Paddle 保持默认即可。
-	quant_min_bound	量化裁剪的最小边界值，PyTorch 无此参数，Paddle 保持默认即可。

[paddle 参数更多]flash_attn.ops.rms_norm.rms_norm¶

flash_attn.ops.rms_norm.rms_norm¶

paddle.incubate.nn.functional.fused_rms_norm¶

参数映射¶

flash_attn.ops.rms_norm.rms_norm ¶

paddle.incubate.nn.functional.fused_rms_norm ¶