add_position_encoding

paddle.fluid.layers.add_position_encoding(input, alpha, beta, name=None)[源代码]

该OP将输入inpu中每个位置(序列中的位置)的特征与对应的位置编码加权求和,位置编码可参考论文: Attention Is All You Need

输出的计算公式如下:

\[\begin{split}PE(pos, 2i) &= \sin{(pos / 10000^{2i / P})}\\ PE(pos, 2i + 1) &= \cos{(pos / 10000^{2i / P})}\\ Out(:, pos, i) &= \alpha * input(:, pos, i) + \beta * PE(pos, i)\end{split}\]
其中:
  • PE(pos, 2i): pos位置对应的编码中偶数特征位上的值
  • PE(pos, 2i + 1): pos位置对应的编码中奇数特征位上的值
参数:
  • input (Variable) – Tensor或LoD level为1的LoDTensor。Tensor时,其形状为 \([N, M, P]\) ,其中 \(N\) 表示batch size, \(M\) 表示序列长度, \(P\) 为特征维度大小;LoDTensor时,其形状为 \([N, P]\) ,其中 \(N\) 表示所有序列长度之和, \(P\) 为特征维度大小。数据类型为float32或float64。
  • alpha (float) – 加权求和时输入input的权重系数
  • beta (float) – 加权求和时位置编码的权重系数
  • name (str,可选) – 具体用法请参见 Name ,一般无需设置,默认值为None。

返回: 加上位置编码后的Tensor或LoDTensor,和输入(input)具有相同数据类型和形状及LoD信息。

返回类型: Variable

代码示例:

import paddle.fluid as fluid

tensor = fluid.layers.data(
      name='tensor',
      shape=[32, 64, 512],
      dtype='float32',
      append_batch_size=False)
position_tensor = fluid.layers.add_position_encoding(
      input=tensor, alpha=1.0, beta=1.0)