19行关键代码，带你轻松入门PaddlePaddle单机训练

发布日期：2019-05-30T16:00:00.000+0000 浏览量：2499次

刚接触深度学习框架的同学可能会说

新入手一个框架是不是会很难?

NO，NO，NO

PaddlePaddle的宗旨就是“easy to use！”

PaddlePaddle是百度自研的集深度学习框架、工具组件和服务平台为一体的技术领先、功能完备的开源深度学习平台，有全面的官方支持的工业级应用模型，涵盖自然语言处理、计算机视觉、推荐引擎等多个领域，并开放多个领先的预训练中文模型。

下面，就让作者带你

打开一扇深度学习的新大门

19行代码入门PaddlePaddle单机训练！

第1行

在Python环境下安装PaddlePaddle框架，万里征程开头难，输完这行指令，你已经成功了一大半！

pip install paddlepaddle

第2-3行

进入代码环境，导入数据包，没啥可说的

import paddle as paddle

import paddle.fluid as fluid

第4-7行

定义模型，定义输入输出，轻松搞定

image = fluid.layers.data(name='image', shape=[1, 28, 28], dtype='float32')

label = fluid.layers.data(name='label', shape=[1], dtype='int64')

hidden = fluid.layers.fc(input=image, size=100, act='relu')

prediction = fluid.layers.fc(input=hidden, size=10, act='softmax')

第8-10行

定义损失函数(交叉熵)和准确率函数

cost = fluid.layers.cross_entropy(input=prediction, label=label)

avgcost = fluid.layers.mean(cost)

acc = fluid.layers.accuracy(input=prediction, label=label)

第11-12行

定义优化方法，使用Adam算法进行优化，其实随便什么优化方法都可以，随你喜欢啦

optimizer = fluid.optimizer.AdamOptimizer(learning_rate=0.001)

opts = optimizer.minimize(avg_cost)

第13-14行

在模型结构搭建完之后，我们需要对参数进行初始化。

注：我们这里采用CPU单机单卡训练，如果使用多GPU训练，参数需要先在GPU0上初始化，再经由fluid.ParallelExecutor 分发到多张显卡（详细内容可以此链接）

exe = fluid.Executor(fluid.CPUPlace())

exe.run(fluid.default_startup_program())

第15-16行

准备输入训练数据，使用框架自带MNIST数据集

train_reader = paddle.batch(paddle.dataset.mnist.train(), batch_size=128)

feeder = fluid.DataFeeder(place=fluid.CPUPlace(), feed_list=[image, label])

第17-18行

啦啦啦，开始训练，2行代码轻松搞定

for batch_id, data in enumerate(train_reader()):

train_cost,train_acc = exe.run(program=fluid.default_main_program(), feed=feeder.feed(data), fetch_list=[avg_cost, acc])

有兴趣的同学也可以通过增加代码print('Batch:%d, Cost:%0.5f, Accuracy:%0.5f' %(batch_id, train_cost[0], train_acc[0]))自行把训练过程打印出来看一下

Batch:0, Cost:3.17834, Accuracy:0.04688

Batch:50, Cost:0.53703, Accuracy:0.82031

Batch:100, Cost:0.47778, Accuracy:0.83594

Batch:150, Cost:0.34092, Accuracy:0.90625

Batch:200, Cost:0.25703, Accuracy:0.92188

Batch:250, Cost:0.37539, Accuracy:0.86719

Batch:300, Cost:0.24384, Accuracy:0.94531

Batch:350, Cost:0.51838, Accuracy:0.84375

Batch:400, Cost:0.40187, Accuracy:0.85938

Batch:450, Cost:0.36615, Accuracy:0.89062

第19行

训练完成，保存模型，任务完成！

fluid.io.save_inference_model("model", ['image'], [prediction], exe)

好吧，看到这里你说，

是19行代码就完成单机训练

没错，

但是完全没感觉啊，

训练好了该怎么用呢？

不着急，我们试试拿一个实例

来测试一下!

预测实例

继续导入2个基础数据包，备用

import numpy as np

import pickle

加载预测数据，需要下载源项目文件

链接：https://pan.baidu.com/s/1axSjJ9XVTI7MYY25WpqZtg

提取码：rkhg

对，我们需要对付的，

就是这样歪歪扭扭的家伙！

源项目中已经把图片处理好了保存在bin文件里面，可以直接读取

load_file=open("save.bin","rb")

img=pickle.load(load_file)

act_label=pickle.load(load_file)

load_file.close()

导入训练好的模型，开始预测

with fluid.scope_guard(fluid.core.Scope()):

[infer_prog,feed_names,targets]=

fluid.io.load_inference_model("model", exe)

results = exe.run(program=infer_prog, feed={feed_names[0]: img}, fetch_list=targets)

打印输出，搞定！

print("实际数字为: %d" % act_label)

print("预测结果为: %d" % np.argsort(results)[0][0][-1])

最终结果

实际数字为: 3

预测结果为: 3

DuangDuangDuang！！

除去数据准备和打印输出，

真正的核心预测代码也只有3行而已，

惊不惊喜，意不意外？

是的，没错

PaddlePaddle就是这样

一个易学易用的深度学习框架

你学会了么？

想了解更多内容，请点击查看以下链接：

http://paddlepaddle.org/documentation/docs/zh/1.4/user_guides/howto/training/single_node.html

上一篇：寻求合作 | 飞桨深度学习企业应用合作伙伴计划

下一篇：飞桨实战 | DCGAN生成手写数字图片全解析