MultiMarginLoss

class paddle.nn. MultiMarginLoss ( p: int = 1, margin: float = 1.0, weight=None, reduction: str = 'mean', name: str = None ) [源代码]

创建一个 MultiMarginLoss 的可调用类。通过计算输入 inputlabel 间的多分类问题的 hinge loss (margin-based loss) 损失。

损失函数如果在没有权重下计算每一个 mini-batch 的 loss 按照下列公式计算

\[\text{loss}(input_i, label_i) = \frac{\sum_{j} \max(0, \text{margin} - input_i[label_i] + input_i[j])^p}{\text{C}}\]

其中 \(0 \leq j \leq \text{C}-1\), 且 \(j \neq label_i\)\(0 \leq i \leq \text{N}-1\) N 为 batch 数量, C 为类别数量。

如果含有权重 weight 则损失函数按以下公式计算

\[\text{loss}(input_i, label_i) = \frac{\sum_{j} \max(0, weight[label_i] * (\text{margin} - input_i[label_i] + input_i[j]))^p}{\text{C}}\]

参数

  • p (int,可选) - 手动指定幂次方指数大小,默认为 1。

  • margin (float,可选) - 手动指定间距,默认为 1。

  • weight (Tensor,可选) - 权重值,默认为 None。 如果给定权重则形状为 \([C, ]\)

  • reduction (str,可选) - 指定应用于输出结果的计算方式,可选值有:'none''mean''sum'。默认为 'mean',计算 Loss 的均值;设置为 'sum' 时,计算 Loss 的总和;设置为 'none' 时,则返回原始 Loss。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

调用参数

  • input (Tensor) - 数据类型是 float32、float64。

  • label (Tensor) - 标签的数据类型为 int32、int64。

形状

  • input (Tensor) - \([N, C]\),其中 N 是 batch_size, C 是类别数量。

  • label (Tensor) - \([N, ]\)

  • output (Tensor) - 输出的 Tensor。如果 reduction'none',则输出的维度为 \([N, ]\)。如果 reduction'mean''sum',则输出的维度为 \([]\)

返回

返回计算 MultiMarginLoss 的可调用对象。

代码示例

>>> import paddle
>>> import paddle.nn as nn

>>> input = paddle.to_tensor([[1, -2, 3], [0, -1, 2], [1, 0, 1]], dtype=paddle.float32)
>>> label = paddle.to_tensor([0, 1, 2], dtype=paddle.int32)

>>> multi_margin_loss = nn.MultiMarginLoss(reduction='mean')
>>> loss = multi_margin_loss(input, label)
>>> print(loss)
Tensor(shape=[], dtype=float32, place=Place(cpu), stop_gradient=True,
1.11111104)