飞桨框架昆仑XPU版训练示例

使用XPU训练与cpu/gpu相同,只需要加上-o use_xpu=True, 表示执行在昆仑设备上。

ResNet50下载并运行示例:

模型文件下载命令:

cd path_to_clone_PaddleClas
git clone -b release/static https://github.com/PaddlePaddle/PaddleClas.git

也可以访问PaddleClas的github repo直接下载源码。

配置XPU进行训练的命令非常简单:

#FLAGS指定单卡或多卡训练,此示例运行2个卡
export FLAGS_selected_xpus=0,1
#启动训练
python3.7 tools/static/train.py -c configs/quick_start/ResNet50_vd_finetune_kunlun.yaml -o use_gpu=False -o use_xpu=True -o is_distributed=False

如果需要指定更多的卡(比如8卡),需要配置合适的训练参数,可使用如下命令自动修改:

export FLAGS_selected_xpus=0,1,2,3,4,5,6,7
python3.7 -m paddle.distributed.launch \
        --ips=${ips} \
        --xpus=${FLAGS_selected_xpus} \
        --log_dir log \
        tools/static/train.py \
        -c ${config_yaml} \
        -o is_distributed=False \
        -o epochs=${epochs} \
        -o TRAIN.batch_size=${total_batch_size} \
        -o LEARNING_RATE.params.lr=${lr} \
        -o use_gpu=False \
        -o use_xpu=True

其他模型的训练示例可在飞桨对昆仑XPU芯片的支持中支持模型列表下的模型链接中找到。