roi_pool¶

paddle.vision.ops. roi_pool ( x, boxes, boxes_num, output_size, spatial_scale=1.0, name=None ) [源代码] ¶

位置敏感的兴趣区域池化（也称为 ROIPooling），是在指定输入的感兴趣区域上执行位置敏感的平均池化，并获得固定大小的特征图。

参数¶

x (Tensor) - 输入的特征图，形状为(N, C, H, W)。

boxes (Tensor) - 待执行池化的ROIs(Regions of Interest, 感兴趣区域)的框坐标。它应当是一个形状为(num_rois, 4)的2-D Tensor，以[[x1, y1, x2, y2], ...]的形式给出。其中(x1, y1)是左上角的坐标值，(x2, y2)是右下角的坐标值。

boxes_num (Tensor) - 该batch中每一张图所包含的框数量。

output_size (int|Tuple(int, int)) - 池化后输出的尺寸(H, W), 数据类型为int32. 如果output_size是int类型，H和W都与其相等。

spatial_scale (float, 可选) - 空间比例因子，用于将boxes中的坐标从其输入尺寸按比例映射到input特征图的尺寸，默认值1.0。

name (str, 可选）- 默认值为None。一般用户无需设置，具体用法请参见 Name 。

返回¶

Tensor，为池化后的ROIs，为一个形状是(Roi数量，输出通道数，池化后高度，池化后宽度）的4-D Tensor。输出通道数等于输入通道数/（池化后高度 * 池化后宽度）。

代码示例¶

          import paddle
from paddle.vision.ops import roi_pool

data = paddle.rand([1, 256, 32, 32])
boxes = paddle.rand([3, 4])
boxes[:, 2] += boxes[:, 0] + 3
boxes[:, 3] += boxes[:, 1] + 4
boxes_num = paddle.to_tensor([3]).astype('int32')
pool_out = roi_pool(data, boxes, boxes_num=boxes_num, output_size=3)
assert pool_out.shape == [3, 256, 3, 3], ''