Normal

class paddle.distribution. Normal ( loc, scale, name=None ) [源代码]

正态分布

数学公式:

\[ \begin{align}\begin{aligned}pdf(x; \mu, \sigma) = \frac{1}{Z}e^{\frac {-0.5 (x - \mu)^2} {\sigma^2} }\\Z = (2 \pi \sigma^2)^{0.5}\end{aligned}\end{align} \]

上面的数学公式中:

  • \(loc = \mu\):平均值;

  • \(scale = \sigma\):标准差;

  • \(Z\):正态分布常量。

参数

  • loc (int|float|list|tuple|numpy.ndarray|Tensor) - 正态分布平均值。数据类型为 float32 或 float64。

  • scale (int|float|list|tuple|numpy.ndarray|Tensor) - 正态分布标准差。数据类型为 float32 或 float64。

  • name (str,可选) - 具体用法请参见 Name,一般无需设置,默认值为 None。

代码示例

>>> import paddle
>>> from paddle.distribution import Normal

>>> # Define a single scalar Normal distribution.
>>> dist = Normal(loc=0., scale=3.)
>>> # Define a batch of two scalar valued Normals.
>>> # The first has mean 1 and standard deviation 11, the second 2 and 22.
>>> dist = Normal(loc=[1., 2.], scale=[11., 22.])
>>> # Get 3 samples, returning a 3 x 2 tensor.
>>> dist.sample([3])

>>> # Define a batch of two scalar valued Normals.
>>> # Both have mean 1, but different standard deviations.
>>> dist = Normal(loc=1., scale=[11., 22.])

>>> # Complete example
>>> value_tensor = paddle.to_tensor([0.8], dtype="float32")

>>> normal_a = Normal([0.], [1.])
>>> normal_b = Normal([0.5], [2.])
>>> sample = normal_a.sample([2])
>>> # a random tensor created by normal distribution with shape: [2, 1]
>>> entropy = normal_a.entropy()
>>> print(entropy)
Tensor(shape=[1], dtype=float32, place=Place(cpu), stop_gradient=True,
    [1.41893852])
>>> lp = normal_a.log_prob(value_tensor)
>>> print(lp)
Tensor(shape=[1], dtype=float32, place=Place(cpu), stop_gradient=True,
    [-1.23893857])
>>> p = normal_a.probs(value_tensor)
>>> print(p)
Tensor(shape=[1], dtype=float32, place=Place(cpu), stop_gradient=True,
    [0.28969154])
>>> kl = normal_a.kl_divergence(normal_b)
>>> print(kl)
Tensor(shape=[1], dtype=float32, place=Place(cpu), stop_gradient=True,
    [0.34939718])

属性

mean

正态分布的均值

variance

正态分布的方差

方法

sample(shape, seed=0)

生成指定维度的样本。

参数

  • shape ((Sequence[int], 可选) - 指定生成样本的维度。

  • seed (int) - 长整型数。

返回

Tensor,预先设计好维度的 Tensor,数据类型为 float32。

rsample(shape)

重参数化采样,生成指定维度的样本。

参数

  • shape ((Sequence[int], 可选) - 指定生成样本的维度。

返回

Tensor,预先设计好维度的 Tensor,数据类型为 float32。

entropy()

信息熵

数学公式:

\[entropy(\sigma) = 0.5 \log (2 \pi e \sigma^2)\]

上面的数学公式中:

\(scale = \sigma\):标准差。

返回

Tensor,正态分布的信息熵,数据类型为 float32。

log_prob(value)

对数概率密度函数

参数

  • value (Tensor) - 输入 Tensor。数据类型为 float32 或 float64。

返回

Tensor,对数概率,数据类型与 value 相同。

probs(value)

概率密度函数

参数

  • value (Tensor) - 输入 Tensor。数据类型为 float32 或 float64。

返回

Tensor,概率,数据类型与 value 相同。

kl_divergence(other)

两个正态分布之间的 KL 散度。

数学公式:

\[ \begin{align}\begin{aligned}KL\_divergence(\mu_0, \sigma_0; \mu_1, \sigma_1) = 0.5 (ratio^2 + (\frac{diff}{\sigma_1})^2 - 1 - 2 \ln {ratio})\\ratio = \frac{\sigma_0}{\sigma_1}\\diff = \mu_1 - \mu_0\end{aligned}\end{align} \]

上面的数学公式中:

  • \(loc = \mu_0\):当前正态分布的平均值;

  • \(scale = \sigma_0\):当前正态分布的标准差;

  • \(loc = \mu_1\):另一个正态分布的平均值;

  • \(scale = \sigma_1\):另一个正态分布的标准差;

  • \(ratio\):两个标准差之间的比例;

  • \(diff\):两个平均值之间的差值。

参数

  • other (Normal) - Normal 的实例。

返回

Tensor,两个正态分布之间的 KL 散度,数据类型为 float32。