cross_entropy

paddle.fluid.layers.cross_entropy(input, label, soft_label=False, ignore_index=-100)[源代码]

该OP计算输入input和标签label间的交叉熵,可用于计算硬标签或软标签的交叉熵。

  1. 硬标签交叉熵算法:若soft_label = False, \(label[i_1, i_2, ..., i_k]\) 表示每个样本的硬标签值:

    \[\begin{split}\\output[i_1, i_2, ..., i_k]=-log(input[i_1, i_2, ..., i_k, j]), label[i_1, i_2, ..., i_k] = j, j != ignore\_index\\\end{split}\]
  2. 软标签交叉熵算法:若soft_label = True, \(label[i_1, i_2, ..., i_k, j]\) 表明每个样本对应类别j的软标签值:

    \[\begin{split}\\output[i_1, i_2, ..., i_k]= -\sum_{j}label[i_1,i_2,...,i_k,j]*log(input[i_1, i_2, ..., i_k,j])\\\end{split}\]
参数:
  • input (Variable) – 维度为 \([N_1, N_2, ..., N_k, D]\) 的多维Tensor,其中最后一维D是类别数目。数据类型为float32或float64。
  • label (Variable) – 输入input对应的标签值。若soft_label=False,要求label维度为 \([N_1, N_2, ..., N_k]\)\([N_1, N_2, ..., N_k, 1]\) ,数据类型为int64,且值必须大于等于0且小于D;若soft_label=True,要求label的维度、数据类型与input相同,且每个样本各软标签的总和为1。
  • soft_label (bool) – 指明label是否为软标签。默认为False,表示label为硬标签;若soft_label=True则表示软标签。
  • ignore_index (int) – 指定一个忽略的标签值,此标签值不参与计算,负值表示无需忽略任何标签值。仅在soft_label=False时有效。 默认值为-100。

返回: 表示交叉熵结果的Tensor,数据类型与input相同。若soft_label=False,则返回值维度与label维度相同;若soft_label=True,则返回值维度为 \([N_1, N_2, ..., N_k, 1]\)

返回类型:Variable

代码示例

import paddle.fluid as fluid
class_num = 7
x = fluid.layers.data(name='x', shape=[3, 10], dtype='float32')
label = fluid.layers.data(name='label', shape=[1], dtype='int64')
predict = fluid.layers.fc(input=x, size=class_num, act='softmax')
cost = fluid.layers.cross_entropy(input=predict, label=label)