PaddleDetection

PaddleDetection的目的是为工业界和学术界提供大量易使用的目标检测模型。PaddleDetection不仅性能完善，易于部署，同时能够灵活的满足算法研发需求。

目前检测库下模型均要求使用PaddlePaddle 1.7及以上版本或适当的develop版本。

简介

特性：

易部署:
PaddleDetection的模型中使用的主要算子均通过C++和CUDA实现，配合PaddlePaddle的高性能预测引擎，使得在服务器环境下易于部署。
高灵活度：
PaddleDetection各个组件均为功能单元。例如，模型结构，数据预处理流程，用户能够通过修改配置文件轻松实现可定制化。
高性能：
在PaddlePaddle底层框架的帮助下，实现了更快的模型训练及更少的显存占用量。值得注意的是，Yolo v3的训练速度远快于其他框架。另外，Mask-RCNN(ResNet50)可以在Tesla V100 16GB环境下以每个GPU4张图片输入实现多卡训练。

支持的模型结构：

	ResNet	ResNet-vd ¹	ResNeXt-vd	SENet	MobileNet	DarkNet	VGG
Faster R-CNN	✓	✓	x	✓	✗	✗	✗
Faster R-CNN + FPN	✓	✓	✓	✓	✗	✗	✗
Mask R-CNN	✓	✓	x	✓	✗	✗	✗
Mask R-CNN + FPN	✓	✓	✓	✓	✗	✗	✗
Cascade R-CNN	✓	✗	✗	✗	✗	✗	✗
RetinaNet	✓	✗	✗	✗	✗	✗	✗
Yolov3	✓	✗	✗	✗	✓	✓	✗
SSD	✗	✗	✗	✗	✓	✗	✓

[1] ResNet-vd 模型提供了较大的精度提高和较少的性能损失。

扩展特性：

Synchronized Batch Norm: 目前在Yolo v3中使用。
Group Norm: 预训练模型待发布。
Modulated Deformable Convolution: 预训练模型待发布。
Deformable PSRoI Pooling: 预训练模型待发布。

注意: Synchronized batch normalization 只能在多GPU环境下使用，不能在CPU环境或者单GPU环境下使用。

模型库

基于PaddlePaddle训练的目标检测模型可参考PaddleDetection模型库.

安装

请参考安装说明文档.

开始

在预测阶段，可以通过运行以下指令得到可视化结果并保存在output目录下。

export PYTHONPATH=`pwd`:$PYTHONPATH
python tools/infer.py -c configs/mask_rcnn_r50_1x.yml \
    -o weights=https://paddlemodels.bj.bcebos.com/object_detection/mask_rcnn_r50_1x.tar \
    --infer_img=demo/000000570688.jpg

更多训练及评估流程，请参考GETTING_STARTED_cn.md.

详细的配置信息和参数说明，请参考示例配置文件.

同时推荐用户参考IPython Notebook demo

其他更多信息可参考以下文档内容：

未来规划

目前PaddleDetection处在持续更新的状态，接下来将会推出一系列的更新，包括如下特性：

混合精度训练
分布式训练
Int8模式预测
用户自定义算子
进一步丰富模型库

版本更新

7/22/2019

增加检测库中文文档
修复R-CNN系列模型训练同时进行评估的问题
新增ResNext101-vd + Mask R-CNN + FPN模型
新增基于VOC数据集的Yolo v3模型

7/3/2019

发布PaddleDetection检测库和检测模型库
模型包括：Faster R-CNN, Mask R-CNN, Faster R-CNN+FPN, Mask R-CNN+FPN, Cascade-Faster-RCNN+FPN, RetinaNet, Yolo v3, 和SSD.

如何贡献代码

我们非常欢迎你可以为PaddleDetection提供代码，也十分感谢你的反馈。

# PaddleDetection PaddleDetection的目的是为工业界和学术界提供大量易使用的目标检测模型。PaddleDetection不仅性能完善，易于部署，同时能够灵活的满足算法研发需求。 **目前检测库下模型均要求使用PaddlePaddle 1.7及以上版本或适当的develop版本。**

## 简介特性： - 易部署: PaddleDetection的模型中使用的主要算子均通过C++和CUDA实现，配合PaddlePaddle的高性能预测引擎，使得在服务器环境下易于部署。 - 高灵活度： PaddleDetection各个组件均为功能单元。例如，模型结构，数据预处理流程，用户能够通过修改配置文件轻松实现可定制化。 - 高性能：在PaddlePaddle底层框架的帮助下，实现了更快的模型训练及更少的显存占用量。值得注意的是，Yolo v3的训练速度远快于其他框架。另外，Mask-RCNN(ResNet50)可以在Tesla V100 16GB环境下以每个GPU4张图片输入实现多卡训练。支持的模型结构： | | ResNet | ResNet-vd ^[1](#vd) | ResNeXt-vd | SENet | MobileNet | DarkNet | VGG | |--------------------|:------:|------------------------------:|:----------:|:-----:|:---------:|:-------:|:---:| | Faster R-CNN | ✓ | ✓ | x | ✓ | ✗ | ✗ | ✗ | | Faster R-CNN + FPN | ✓ | ✓ | ✓ | ✓ | ✗ | ✗ | ✗ | | Mask R-CNN | ✓ | ✓ | x | ✓ | ✗ | ✗ | ✗ | | Mask R-CNN + FPN | ✓ | ✓ | ✓ | ✓ | ✗ | ✗ | ✗ | | Cascade R-CNN | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | | RetinaNet | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | | Yolov3 | ✓ | ✗ | ✗ | ✗ | ✓ | ✓ | ✗ | | SSD | ✗ | ✗ | ✗ | ✗ | ✓ | ✗ | ✓ | [1] [ResNet-vd](https://arxiv.org/pdf/1812.01187) 模型提供了较大的精度提高和较少的性能损失。扩展特性： - [x] **Synchronized Batch Norm**: 目前在Yolo v3中使用。 - [x] **Group Norm**: 预训练模型待发布。 - [x] **Modulated Deformable Convolution**: 预训练模型待发布。 - [x] **Deformable PSRoI Pooling**: 预训练模型待发布。 **注意:** Synchronized batch normalization 只能在多GPU环境下使用，不能在CPU环境或者单GPU环境下使用。 ## 模型库基于PaddlePaddle训练的目标检测模型可参考[PaddleDetection模型库](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/docs/MODEL_ZOO_cn.md). ## 安装请参考[安装说明文档](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/docs/INSTALL_cn.md). ## 开始在预测阶段，可以通过运行以下指令得到可视化结果并保存在`output`目录下。 ```bash export PYTHONPATH=`pwd`:$PYTHONPATH python tools/infer.py -c configs/mask_rcnn_r50_1x.yml \ -o weights=https://paddlemodels.bj.bcebos.com/object_detection/mask_rcnn_r50_1x.tar \ --infer_img=demo/000000570688.jpg ``` 更多训练及评估流程，请参考[GETTING_STARTED_cn.md](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/docs/GETTING_STARTED_cn.md). 详细的配置信息和参数说明，请参考[示例配置文件](https://github.com/PaddlePaddle/models/tree/develop/PaddleCV/PaddleDetection/docs/config_example). 同时推荐用户参考[IPython Notebook demo](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/demo/mask_rcnn_demo.ipynb) 其他更多信息可参考以下文档内容： - [配置流程介绍](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/docs/CONFIG_cn.md) - [自定义数据集和预处理流程介绍](https://github.com/PaddlePaddle/models/blob/develop/PaddleCV/PaddleDetection/docs/DATA_cn.md) ## 未来规划目前PaddleDetection处在持续更新的状态，接下来将会推出一系列的更新，包括如下特性： - [ ] 混合精度训练 - [ ] 分布式训练 - [ ] Int8模式预测 - [ ] 用户自定义算子 - [ ] 进一步丰富模型库 ## 版本更新 #### 7/22/2019 - 增加检测库中文文档 - 修复R-CNN系列模型训练同时进行评估的问题 - 新增ResNext101-vd + Mask R-CNN + FPN模型 - 新增基于VOC数据集的Yolo v3模型 #### 7/3/2019 - 发布PaddleDetection检测库和检测模型库 - 模型包括：Faster R-CNN, Mask R-CNN, Faster R-CNN+FPN, Mask R-CNN+FPN, Cascade-Faster-RCNN+FPN, RetinaNet, Yolo v3, 和SSD. ## 如何贡献代码我们非常欢迎你可以为PaddleDetection提供代码，也十分感谢你的反馈。