nms¶

paddle.vision.ops. nms ( boxes, iou_threshold=0.3, scores=None, category_idxs=None, categories=None, top_k=None ) [源代码] ¶

非极大抑制(non-maximum suppression, NMS)用于在目标检测应用对检测边界框(bounding box)中搜索局部最大值，即只保留处于同一检测目标位置处重叠的框中分数最大的一个框。IoU(Intersection Over Union) 被用于判断两个框是否重叠，该值大于门限值(iou_threshold)则被认为两个框重叠。其计算公式如下：

$IoU = \frac{intersection\_area(box1, box2)}{union\_area(box1, box2)}$

如果参数 scores 不为 None，输入的 boxes 会首先按照它们对应的 score 降序排序，否则将默认输入的 boxes 为排好序的。

如果 category_idxs 和 categories 不为 None，分类 NMS 将会被执行，也就是说，nms 过程会在每一个类别的框当中分别进行计算，计算结果会被组合起来然后按照得分倒序排列。

如果 top_k 不为 None 的话，排序的计算结果中仅有前 k 个元素会被返回，否则会返回所有的元素。

参数¶

boxes (Tensor) - 待进行计算的框坐标，它应当是一个形状为[num_boxes, 4]的 2-D Tensor，以[[x1, y1, x2, y2], ...]的形式给出，数据类型可以是 float32 或 float64，其中(x1, y1)是左上角的坐标值，(x2, y2)是右下角的坐标值，其关系应符合 0 <= x1 < x2 && 0 <= y1 < y2。

iou_threshold (float32，可选) - 用于判断两个框是否重叠的 IoU 门限值。如果 IoU(box1, box2) > threshold， box1 和 box2 将被认为是重叠框。默认为：0.3。

scores (Tensor，可选) - 与 boxes 参数对应的 score，它应当是一个形状为[num_boxes]的 1-D Tensor。数据类型可以是 float32 或 float64。默认为：None。

category_idxs (Tensor，可选) - 与 boxes 参数对应的类别编号，它应当是一个形状为[num_boxes]的 1-D Tensor。数据类型为 int64。默认为：None。

categories (List，可选) - 类别列表，它的每个元素应该是唯一的，满足 categories == paddle.unique(class_idxs)。默认为：None。

top_k (int64，可选) - 需要返回的分数最高的 boxes 索引数量。该值须小于等于 num_boxes。默认为：None。

返回¶

Tensor，被 NMS 保留的检测边界框的索引，它应当是一个形状为[num_boxes]的 1-D Tensor。

代码示例¶

>>> import paddle
>>> paddle.seed(2023)

>>> boxes = paddle.rand([4, 4]).astype('float32')
>>> boxes[:, 2] = boxes[:, 0] + boxes[:, 2]
>>> boxes[:, 3] = boxes[:, 1] + boxes[:, 3]
>>> print(boxes)
Tensor(shape=[4, 4], dtype=float32, place=Place(cpu), stop_gradient=True,
[[0.86583614, 0.52014720, 1.12544549, 1.42540050],
 [0.42400089, 0.40641287, 1.39420986, 1.15078652],
 [0.51785129, 0.73292869, 1.49571705, 0.77608776],
 [0.42639419, 0.71958369, 0.63450879, 0.91689879]])

>>> out = paddle.vision.ops.nms(boxes, 0.1)
>>> print(out)
Tensor(shape=[3], dtype=int64, place=Place(cpu), stop_gradient=True,
[0, 2, 3])

>>> scores = paddle.to_tensor([0.6, 0.7, 0.4, 0.233])
>>> categories = [0, 1, 2, 3]
>>> category_idxs = paddle.to_tensor([2, 0, 0, 3], dtype="int64")
>>> out = paddle.vision.ops.nms(boxes,
...                             0.1,
...                             paddle.to_tensor(scores),
...                             paddle.to_tensor(category_idxs),
...                             categories,
...                             4)
>>> print(out)
Tensor(shape=[4], dtype=int64, place=Place(cpu), stop_gradient=True,
[1, 0, 2, 3])