affine_grid

paddle.nn.functional. affine_grid ( theta, out_shape, align_corners=True, name=None ) [源代码]

用于生成仿射变换前后的 feature maps 的坐标映射关系。在视觉应用中,根据得到的映射关系,将输入 feature map 的像素点变换到对应的坐标,就得到了经过仿射变换的 feature map。

参数

  • theta (Tensor) - Shape 为 [batch_size, 2, 3][batch_size, 3, 4] 的 Tensor,表示 batch_size 个 2X33X4 的变换矩阵。数据类型支持 float32,float64。

  • out_shape (Tensor | list | tuple) - 类型可以是 1-D Tensor、list 或 tuple。用于表示在仿射变换中的输出的 shape,其格式为 [N, C, H, W][N, C, D, H, W] ,格式 [N, C, H, W] 分别表示输出 feature map 的 batch size、channel 数量、高和宽,格式 [N, C, D, H, W] 分别表示输出 feature map 的 batch size、channel 数量、深度、高和宽。数据类型支持 int32。

  • align_corners (bool,可选) - 一个可选的 bool 型参数,如果为 True,则将输入和输出 Tensor 的 4(4D) 或 8(5D) 个角落像素的中心对齐,并保留角点像素的值。默认值:True。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

返回

Tensor。Shape 为 [N, H, W, 2] 的 4-D Tensor 或``[N, D, H, W, 3]``的 5-D Tensor,表示仿射变换前后的坐标的映射关系。输出为 4-D Tensor 时,N、H、W 分别为仿射变换中输出 feature map 的 batch size、高和宽,输出为 5D Tensor 时,N、D、H、W 分别为仿射变换中输出 feature map 的 batch size、深度、高和宽。数据类型与 theta 一致。

代码示例

>>> import paddle
>>> import paddle.nn.functional as F
>>> # theta.shape = [1, 2, 3]
>>> theta = paddle.to_tensor([[[-0.7, -0.4, 0.3],
...                            [ 0.6,  0.5, 1.5]]], dtype="float32")
>>> y_t = F.affine_grid(
...     theta,
...     [1, 2, 3, 3],
...     align_corners=False
... )
>>> print(y_t)
Tensor(shape=[1, 3, 3, 2], dtype=float32, place=Place(cpu), stop_gradient=True,
[[[[ 1.03333330,  0.76666665],
   [ 0.56666672,  1.16666663],
   [ 0.10000002,  1.56666672]],
  [[ 0.76666665,  1.09999990],
   [ 0.30000001,  1.50000000],
   [-0.16666666,  1.90000010]],
  [[ 0.50000000,  1.43333328],
   [ 0.03333333,  1.83333337],
   [-0.43333334,  2.23333335]]]])