ExecutionStrategy¶

class paddle.static. ExecutionStrategy ¶

通过设置 ExecutionStrategy 中的选项，用户可以对执行器的执行配置进行调整，比如设置执行器中线程池的大小等。

返回¶

ExecutionStrategy，一个ExecutionStrategy的实例

代码示例¶

          import paddle
import paddle.static as static
import paddle.nn.functional as F

paddle.enable_static()

x = static.data(name='x', shape=[None, 13], dtype='float32')
y = static.data(name='y', shape=[None, 1], dtype='float32')
y_predict = static.nn.fc(x=x, size=1, activation=None)

cost = F.square_error_cost(input=y_predict, label=y)
avg_loss = paddle.mean(cost)

sgd_optimizer = paddle.optimizer.SGD(learning_rate=0.001)
sgd_optimizer.minimize(avg_loss)

exec_strategy = static.ExecutionStrategy()
exec_strategy.num_threads = 4

train_exe = static.ParallelExecutor(use_cuda=False,
                                    loss_name=avg_loss.name,
                                    exec_strategy=exec_strategy)

         

num_threads ¶

int型成员。该选项表示当前 Executor 的线程池(thread pool)的大小, 此线程池可用来并发执行program中的operator（算子，运算）。如果 \(num\_threads=1\) ，则所有的operator将一个接一个地执行，但在不同的program重复周期(iterations)中执行顺序可能不同。如果该选项没有被设置，则在 Executor 中，它会依据设备类型(device type)、设备数目(device count)而设置为相应值。对GPU，\(num\_threads=device\_count∗4\) ；对CPU， \(num\_threads=CPU\_NUM∗4\) 。在 Executor 中有关于 \(CPU\_NUM\) 的详细解释。如果没有设置 \(CPU\_NUM\) ，则设置默认值为1，并提示用户进行 \(CPU\_NUM\) 的设置。

代码示例¶

          import paddle
import paddle.static as static

paddle.enable_static()

exec_strategy = static.ExecutionStrategy()
exec_strategy.num_threads = 4

num_iteration_per_drop_scope ¶

int型成员。该选项表示间隔多少次迭代之后清理一次临时变量。模型运行过程中，生成的中间临时变量将被放到local execution scope中，为了避免对临时变量频繁的申请与释放，通常将其设为较大的值（比如10或者100）。默认值为100。

注解

如果你调用run的时候fetch了数据，ParallelExecutor将会在本轮迭代结束时清理临时变量。
在一些NLP模型中，这个策略可能会造成的GPU显存不足，此时需要减少num_iteration_per_drop_scope的值。

代码示例¶

          import paddle
import paddle.static as static

paddle.enable_static()

exec_strategy = static.ExecutionStrategy()
exec_strategy.num_iteration_per_drop_scope = 10

num_iteration_per_run ¶

int型成员。它配置了当用户在python脚本中调用pe.run()时执行器会执行的迭代次数。Executor每次调用，会进行num_iteration_per_run次训练，它会使整体执行过程更快。默认值为1。

代码示例¶

          import paddle
import paddle.static as static

paddle.enable_static()

exec_strategy = static.ExecutionStrategy()
exec_strategy.num_iteration_per_run = 10