(瑞芯微/晶晨/恩智浦) 芯原 TIM-VX

Paddle Lite 已支持通过 TIM-VX 的方式调用芯原 NPU 算力的预测部署。 其接入原理是与其他接入 Paddle Lite 的新硬件类似,即加载并分析 Paddle 模型,首先将 Paddle 算子转成 NNAdapter 标准算子,其次再通过 TIM-VX 的组网 API 进行网络构建,在线编译模型并执行模型。

需要注意的是,芯原(verisilicon)作为 IP 设计厂商,本身并不提供实体SoC产品,而是授权其 IP 给芯片厂商,如:晶晨(Amlogic),瑞芯微(Rockchip)等。因此本文是适用于被芯原授权了 NPU IP 的芯片产品。只要芯片产品没有大副修改芯原的底层库,则该芯片就可以使用本文档作为 Paddle Lite 推理部署的参考和教程。在本文中,晶晨 SoC 中的 NPU 和 瑞芯微 SoC 中的 NPU 统称为芯原 NPU。

支持现状

已支持的芯片

  • Amlogic A311D

  • Amlogic S905D3

  • Amlogic C308X

  • Rockchip RV1109

  • Rockchip RV1126

  • Rockchip RK1808

  • NXP i.MX 8M Plus

    注意:理论上支持所有经过芯原授权了 NPU IP 的 SoC(须有匹配版本的 NPU 驱动,下文描述),上述为经过测试的部分芯片型号。

已支持的 Paddle 模型

性能

  • 测试环境

    • 编译环境

      • Ubuntu 16.04,GCC 5.4 for ARMLinux armhf and aarch64

    • 硬件环境

      • Amlogic A311D

        • CPU:4 x ARM Cortex-A73 + 2 x ARM Cortex-A53

        • NPU:5 TOPs for INT8

      • Amlogic S905D3

        • CPU:2 x ARM Cortex-55

        • NPU:1.2 TOPs for INT8

      • Amlogic C308X

        • CPU:2 x ARM Cortex-55

        • NPU:4 TOPs for INT8

      • Rockchip RK1808

        • CPU:2 x ARM Cortex-35

        • NPU:3 TOPs for INT8

      • Rockchip RV1109

        • CPU:2 x ARM Cortex-A7

        • NPU:1.2 TOPs for INT8

      • Rockchip RV1126

        • CPU:4 x ARM Cortex-A7

        • NPU:2 TOPs for INT8

      • NXP i.MX 8M Plus

        • CPU:4 x ARM Cortex-53

        • NPU:5 TOPs for INT8

  • 测试方法

    • warmup=1, repeats=5,统计平均时间,单位是 ms

    • 线程数为1,paddle::lite_api::PowerMode CPU_POWER_MODE设置为paddle::lite_api::PowerMode::LITE_POWER_HIGH

    • 分类模型的输入图像维度是{1, 3, 224, 224}

  • 测试结果

模型 A311D S905D3 C308X RK1808 RV1109 RV1126 i.MX 8M Plus
CPU(ms) NPU(ms) CPU(ms) NPU(ms) CPU(ms) NPU(ms) CPU(ms) NPU(ms) CPU(ms) NPU(ms) CPU(ms) NPU(ms) CPU(ms) NPU(ms)
mobilenet_v1_int8_224_per_layer 81.6321 5.1125 280.4659 12.8081 167.623 6.9828 264.6235 6.139 335.0399 15.1995 281.63 10.2766 106.656 3.21236
mobilenet_v2_int8_224_per_layer 124.5915 7.2110 350.2003 17.4572 257.223 14.9003 357.0515 17.5205 335.0399 21.7522 350.893 19.5102 146.658 5.546
mobilenet_v3_int8_224_per_channel 145.3235 11.7315 408.2256 25.5506 296.603 15.5162 286.9802 13.998 335.0399 16.0502 401.090 14.7521 160.114
shufflenet_v2_int8_224_per_layer 65.4983 3.6092 221.8125 9.3139 134.2521 5.8354 79.6334 6.6051 1660.2725 7.1952 402.225 6.2400 59.959 12.6551
resnet50_int8_224_per_layer 390.4983 17.5832 787.5323 41.3139 949.5 32.354 1188.3469 18.1784 1660.2725 24.8895 590.8854 47.792 409.325 12.6551
ssd_mobilenet_v1_relu_voc_int8_300_per_layer 134.9915 15.2167 295.4891 40.1089 196.377 26.8084 542.56 16.84 512.101 22.187 261.5986 20.12287 159.3365 14.2235
yolov5s_int8_640_per_channel 455.5805 92.2132 1619.3089 198.3684 906.377 167.8554 542.56 179.0228 1712.101 214.187 1513.390 200.235 459.2507
picodet_relu6_int8_416_per_channel 246.0785 35.2960 686.2054 79.1789 496.377 69.1412 542.56 74.8410 706.560 139.6872 661.6818 122.3293 261.9874

已支持(或部分支持)NNAdapter 的 Paddle 算子

您可以查阅 NNAdapter 算子支持列表获得各算子在不同新硬件上的最新支持信息。

参考示例演示

准备设备环境

  • 确定开发板 NPU 驱动版本

    • 由于晶晨 SoC、瑞芯微1代 Soc、恩智浦 i.MX 8M Plus 等 使用芯原 NPU IP,因此,部署前要保证芯原 Linux Kernel NPU 驱动—— galcore.so 版本及所适用的芯片型号与依赖库保持一致。

    • 请登录开发板,并通过命令行输入 dmesg | grep Galcore 查询 NPU 驱动版本。

      • 请务必注意,建议 NPU 驱动版本为:

SoC 厂家 驱动板本
Amlogic 6.4.4.3
Rockchip 6.4.6.5
NXP 6.4.3.p1
- 举个例子,以晶晨 Amlogic A311D 为例,需要为 6.4.4.3(其他搭载了芯原 NPU 的 SoC 驱动版本要求参照上表):
  ```shell
  $ dmesg | grep Galcore
  [   24.140820] Galcore version 6.4.4.3.310723AAA
  ```
- 如果当前版本就符合上述 ,直接跳过本环节。
  • 如果当前版本不符合上述,请用户仔细阅读以下内容,以保证底层 NPU 驱动环境正确。

  • 前提科普:由于使用芯原 NPU 的 SoC 众多,且同一 SoC 芯片、不同开发板之间存在 linux kernel 版本的差异,该差异直接影响 NPU 驱动的通用性。用户可以如此理解:1)芯原提供 NPU IP、2)芯片商(晶晨、瑞芯微、恩智浦)提供 SoC 芯片、3)开发板商(产品商)提供实际开发板产品,这三方共同形成了芯片产业生态。

  • 芯原 NPU 的开发板主要有两个关键环境因素务必对齐:1)galcore.ko(既 NPU 驱动文件);2)NPU 依赖库。上述两者需要版本对齐,缺一不可。

  • 有两种方式可以修改当前的 NPU 驱动版本及其依赖库:

    • 『方法 1』:手动替换 NPU 驱动版本及其依赖库。(推荐

    • 『方法 2』:刷机,刷取 NPU 驱动版本符合要求的固件。

  • 我们首先描述『方法 1』手动替换驱动文件和依赖库,先行下载并解压PaddleLite-generic-demo.tar.gz,其中包含不同版本、不同芯片型号的 galcore.ko(既 NPU 驱动文件)和 NPU 依赖库。

    • 下表会罗列部分市面常见开发板的情况,以及我们在 PaddleLite-generic-demo.tar.gz 中提供的现成的驱动文件和依赖库。请照着下表格,找到自己手中对应设备的芯片、开发板、Linux Kernel 版本(可命令行输入 uname -a 查看),从而获取到真正需要的 1)galcore.ko(既 NPU 驱动文件);2)NPU 依赖库。并且分别将 galcore.ko 上传至开发板后,insmod galcore.ko,以及输入表格中的命令刷取正确的NPU 依赖库(软链接)。更加详细易懂的使用步骤会在下表格后描述。

SoC 型号 开发板厂家 开发板型号 OS 推荐Linux Kernl 版本 推荐NPU驱动版本 是否提供galcore.ko驱动文件 galcore.ko驱动文件路径 是否提供 NPU 依赖库 刷取 NPU 依赖库软链接命令
Amlogic A311D 世野科技 Khadas VIM3 购买链接 android 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/a311d/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 a311d
Amlogic A311D 世野科技 Khadas VIM3 购买链接 linux 4.9.241 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/a311d/4.9.241 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 a311d
Amlogic A311D 荣品 PR-A311D 购买链接 linux 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/a311d/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 a311d
Amlogic A311D 其他 linux 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/a311d/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 a311d
Amlogic 905D3 世野科技 Khadas VIM3L 购买链接 android 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/s905d3/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 s905d3
Amlogic 905D3 世野科技 Khadas VIM3L 购买链接 linux 4.9.241 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/s905d3/4.9.241 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 s905d3
Amlogic 905D3 荣品 RP-S905 购买链接 linux 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/s905d3/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 s905d3
Amlogic 905D3 其他 linux 4.9.113 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/s905d3/4.9.113 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_4_3 s905d3
Amlogic C308X 其他 linux 4.19.81 6.4.4.3 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_4_3/lib/c308x/4.19.81 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon__timvx && ./switch_viv_sdk.sh 6_4_4_3 c308x
Rockchip RV1109 瑞芯微 RV1109 DDR3 EVB linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1109/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1109
Rockchip RV1109 荣品 RP-RV1109 购买链接 linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1109/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1109
Rockchip RV1109 其他 linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1109/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1109
Rockchip RV1126 瑞芯微 RV1126 DDR3 EVB linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1126/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1126
Rockchip RV1126 荣品 RP-RV1126 购买链接 linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1126/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1126
Rockchip RV1126 其他 linux 4.19.111 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/viv_sdk_6_4_6_5/1126/4.19.111 cd PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1126
Rockchip RK1808 瑞芯微 RK1808 DDR3 EVB linux 4.4.194 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_6_5/lib/1808/4.4.194 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1808
Rockchip RK1808 荣品 RP-RK1808 购买链接 linux 4.4.194 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_6_5/lib/1808/4.4.194 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1808
Rockchip RK1808 其他 linux 4.4.194 6.4.6.5 PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/viv_sdk_6_4_6_5/lib/1808/4.4.194 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_6_5 1808
NPX i.MX 8M Plus 其他 linux 5.4.70 6.4.3.p1 目前常见的 NPX i.MX 8M Plus 开发板的系统较为特殊,其驱动文件是 buildin 在系统中的 cd PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx && ./switch_viv_sdk.sh 6_4_3_p1 imx8mp
- 详细步骤:
  - 第一步:在上表格中,根据芯片型号、开发板商,找到对应自己的开发板那一行。
  - 第二步:登录开发板,命令行输入 uname -a 来确定自己开发板的 Linux Kernel 是否和表格中一致,如果不一致,请跳转至『方法 2』.
  - 第三步:在表格里找到对应行中 galcore.ko 文件的路径,将 galcore.ko 其上传至开发板。
  - 第四步:登录开发板,命令行输入 `sudo rmmod galcore` 来卸载原始驱动,输入 `sudo insmod galcore.ko` 来加载传上设备的驱动。(是否需要 sudo 根据开发板实际情况,部分 adb 链接的设备请提前 adb root)。此步骤如果操作失败,请跳转至『方法 2』.
  - 第五步:在开发板中输入 `dmesg | grep Galcore` 查询 NPU 驱动版本,确定为:晶晨6.4.4.3,瑞芯微6.4.6.5,NXP 6.4.3.p1。
  - 第六步:在表格里找到对应设备行的最后一列,在下载了[PaddleLite-generic-demo](https://paddlelite-demo.bj.bcebos.com/devices/generic/PaddleLite-generic-demo_v2_12_0.tar.gz)的PC目录下输入表中命令,切换成对应的 NPU 依赖库软链接。
  - 至此,前期的环境准备就已经完成,恭喜您,可以完美复现我们需要的环境。
  - 最后,所有开发板都有开机默认加载路径,建议用户把之前上传的 galcore.ko 文件放在开发板的系统默认加载目录下(一般情况为 XXX/lib/modules/ 下,用户可以在开发板的 / 目录下 `find -name galcore.ko` 来得知应该放在哪里),如此下次开机便能自动加载我们需要的 NPU 驱动。
  • 如果上述方法在过程中失败,那我们使用『方法 2』刷机:

    • 根据具体的开发板型号,向开发板卖家或官网客服索要对应上表中版本 NPU 驱动对应的固件和刷机方法。

      • 在此额外提供 khadas 开发板 VIM3|VIM3L 的 6.4.4.3 固件以及官方教程链接:

      • 其余开发板用户可向开发板卖家或官网客服索要 晶晨6.4.4.3,瑞芯微6.4.6.5,NXP 6.4.3.p1 版本的 NPU 驱动对应的固件和刷机方法。

  • 示例程序和 Paddle Lite 库的编译建议采用交叉编译方式,通过 adbssh 进行设备的交互和示例程序的运行。

准备交叉编译环境

  • 为了保证编译环境一致,建议参考 Docker 统一编译环境搭建 中的 Docker 开发环境进行配置;

  • 由于有些设备只提供网络访问方式(根据开发版的实际情况),需要通过 scpssh 命令将交叉编译生成的Paddle Lite 库和示例程序传输到设备上执行,因此,在进入 Docker 容器后还需要安装如下软件:

    $ apt-get install openssh-client sshpass
    

运行图像分类示例程序

  • 下载 Paddle Lite 通用示例程序PaddleLite-generic-demo.tar.gz,解压后目录主体结构如下(注意其中软链接为 switch_viv_sdk.sh 根据芯片型号和 NPU 驱动版本创建依赖库的软链接):

      - PaddleLite-generic-demo
        - image_classification_demo
          - assets
            - configs
              - imagenet_224.txt # config 文件
              - synset_words.txt # 1000 分类 label 文件
            - datasets
              - test # dataset
                - inputs
                  - tabby_cat.jpg # 输入图片
                - outputs
                  - tabby_cat.jpg # 输出图片
                - list.txt # 图片清单
            - models
              - mobilenet_v1_int8_224_per_layer
                - __model__ # Paddle fluid 模型组网文件,可使用 netron 查看网络结构
                — conv1_weights # Paddle fluid 模型参数文件
                - batch_norm_0.tmp_2.quant_dequant.scale # Paddle fluid 模型量化参数文件
                — subgraph_partition_config_file.txt # 自定义子图分割配置文件
                ...
          - shell
            - CMakeLists.txt # 示例程序 CMake 脚本
            - build.linux.arm64 # arm64 编译工作目录
              - demo # 已编译好的,适用于 arm64 的示例程序
            - build.linux.armhf # armhf编译工作目录
              - demo # 已编译好的,适用于 armhf 的示例程序
            - build.android.armeabi-v7a # Android armv7编译工作目录
              - demo # 已编译好的,适用于 Android armv7 的示例程序
            ...
            - demo.cc # 示例程序源码
            - build.sh # 示例程序编译脚本
            - run.sh # 示例程序本地运行脚本
            - run_with_ssh.sh # 示例程序ssh运行脚本
            - run_with_adb.sh # 示例程序adb运行脚本
        - libs
          - PaddleLite
            - linux
              - arm64 # Linux 64 位系统
                - include # Paddle Lite 头文件
                - lib # Paddle Lite 库文件
                  - verisilicon_timvx # 芯原 DDK、NNAdapter 运行时库、device HAL 库
                    - libArchModelSw.so -> ./viv_sdk_6_4_4_3/lib/libArchModelSw.so
                    - libCLC.so -> ./viv_sdk_6_4_4_3/lib/libCLC.so
                    - libGAL.so -> ./viv_sdk_6_4_4_3/lib/libGAL.so
                    - libNNArchPerf.so -> ./viv_sdk_6_4_4_3/lib/libNNArchPerf.so
                    - libNNGPUBinary.so -> ./viv_sdk_6_4_4_3/lib/a311d/libNNGPUBinary.so
                    - libNNVXCBinary.so -> ./viv_sdk_6_4_4_3/lib/a311d/libNNVXCBinary.so
                    - libOpenCL.so -> ./viv_sdk_6_4_4_3/lib/libOpenCL.so
                    - libOpenVX.so -> ./viv_sdk_6_4_4_3/lib/libOpenVX.so
                    - libOpenVXU.so -> ./viv_sdk_6_4_4_3/lib/libOpenVXU.so
                    - libOvx12VXCBinary.so -> ./viv_sdk_6_4_4_3/lib/a311d/libOvx12VXCBinary.so
                    - libVSC.so -> ./viv_sdk_6_4_4_3/lib/libVSC.so
                    - libverisilicon_timvx.so # NNAdapter device HAL 库
                    - libnnadapter.so  # NNAdapter 运行时库
                    - libtim-vx.so -> ./viv_sdk_6_4_4_3/lib/libtim-vx.so # 芯原 TIM-VX 库
                    - switch_viv_sdk.sh # 根据芯片型号和 NPU 驱动版本创建依赖库的软链接
                    - viv_sdk_6_4_4_3
                      - include
                      - lib
                        - a311d # 针对 a311d 平台
                          - 4.9.241
                            - galcore.ko # NPU 驱动文件
                          - libNNGPUBinary.so # 芯原 DDK
                          - libNNVXCBinary.so # 芯原 DDK
                          - libOvx12VXCBinary.so # 芯原 DDK
                        - libArchModelSw.so # 芯原 DDK
                        - libCLC.so # 芯原 DDK
                        - libGAL.so # 芯原 DDK
                        - libNNArchPerf.so # 芯原 DDK
                        - libOpenCL.so # 芯原 DDK
                        - libOpenVX.so # 芯原 DDK
                        - libOpenVXU.so # 芯原 DDK
                        - libVSC.so # 芯原 DDK
                        - libovxlib.so
                        - libtim-vx.so # 芯原 TIM-VX 库
                        - s905d3 # 针对 s905d3 平台
                          - 4.9.241
                            - galcore.ko
                          ...
                        - c308x # 针对 c308x 平台
                          - 4.19.81
                            - galcore.ko
                          ...
                    - viv_sdk_6_4_6_5
                      - lib
                        - 1808 # 针对 rk1808 平台
                          - 4.4.194
                            - galcore.ko
                          ...
                    - viv_sdk_6_4_3_p1
                      - include
                      - lib
                        - imx8mp # 针对 nxp i.MX 8M Plus 平台
                        ...
                    ...
                  - libpaddle_full_api_shared.so # 预编译 PaddleLite full api 库
                  - libpaddle_light_api_shared.so # 预编译 PaddleLite light api 库
              - armhf # Linux 32 位系统
                - include # Paddle Lite 头文件
                - lib # Paddle Lite 库文件
                  - verisilicon_timvx # 芯原 DDK、NNAdapter 运行时库、device HAL 库
                    - viv_sdk_6_4_6_5
                      - 1109 # 针对 rv1109 平台
                        - 4.19.111
                          - galcore.ko
                        ...
                      - 1126 # 针对 rv1126平台
                        - 4.19.111
                          - galcore.ko
                        ...
                    ...
                  ...
              ...
            - android
             - armeabi-v7a # Android 32 位系统
                - include # Paddle Lite 头文件
                - lib # Paddle Lite 库文件
                  - verisilicon_timvx # 芯原 DDK、NNAdapter 运行时库、device HAL 库
                    - libCLC.so -> ./viv_sdk_6_4_4_3/lib/libCLC.so
                    - libGAL.so -> ./viv_sdk_6_4_4_3/lib/libGAL.so
                    - libNNArchPerf.so -> ./viv_sdk_6_4_4_3/lib/libNNArchPerf.so
                    - libNNGPUBinary.so -> ./viv_sdk_6_4_4_3/lib/s905d3/libNNGPUBinary.so
                    - libNNVXCBinary.so -> ./viv_sdk_6_4_4_3/lib/s905d3/libNNVXCBinary.so
                    - libOpenCL.so -> ./viv_sdk_6_4_4_3/lib/libOpenCL.so
                    - libOpenVX.so -> ./viv_sdk_6_4_4_3/lib/libOpenVX.so
                    - libOpenVXU.so -> ./viv_sdk_6_4_4_3/lib/libOpenVXU.so
                    - libOvx12VXCBinary.so -> ./viv_sdk_6_4_4_3/lib/s905d3/libOvx12VXCBinary.so
                    - libVSC.so -> ./viv_sdk_6_4_4_3/lib/libVSC.so
                    - libverisilicon_timvx.so # NNAdapter device HAL 库
                    - libarchmodelSw.so -> ./viv_sdk_6_4_4_3/lib/libarchmodelSw.so
                    - libnnadapter.so # NNAdapter 运行时库
                    - libtim-vx.so # 芯原 TIM-VX 库
                    - switch_viv_sdk.sh # 根据芯片型号和 NPU 驱动版本创建依赖库的软链接
                    - viv_sdk_6_4_4_3
                      - include
                      - lib
                        - a311d # 针对 a311d 平台
                          - 4.9.113
                            - VERSION
                            - galcore.ko # NPU驱动
                          - libNNGPUBinary.so
                          - libNNVXCBinary.so
                          - libOvx12VXCBinary.so
                        - s905d3 # 针对 s905d3 平台
                          - 4.9.113
                              - VERSION
                              - galcore.ko # NPU驱动
                          - libNNGPUBinary.so # 芯原 DDK
                          - libNNVXCBinary.so # 芯原 DDK
                          - libOvx12VXCBinary.so # 芯原 DDK
                        - libCLC.so # 芯原 DDK
                        - libGAL.so # 芯原 DDK
                        - libNNArchPerf.so # 芯原 DDK
                        - libOpenCL.so 
                        - libOpenVX.so # 芯原 DDK
                        - libOpenVXU.so # 芯原 DDK
                        - libVSC.so # 芯原 DDK
                        - libarchmodelSw.so # 芯原 DDK
                        - libovxlib.so
                        ...
                  - libpaddle_full_api_shared.so # 预编译 Paddle Lite full api 库
                  - libpaddle_light_api_shared.so # 预编译 Paddle Lite light api 库
          - OpenCV # OpenCV 预编译库
        - object_detection_demo # 目标检测示例程序
    
  • 按照以下命令分别运行转换后的ARM CPU模型和 芯原 TIM-VX 模型,比较它们的性能和结果;

    注意:
    1`run_with_adb.sh` 不能在 Docker 环境执行,否则可能无法找到设备,也不能在设备上运行。
    2`run_with_ssh.sh` 不能在设备上运行,且执行前需要配置目标设备的 IP 地址、SSH 账号和密码。
    3`build.sh` 根据入参生成针对不同操作系统、体系结构的二进制程序,需查阅注释信息配置正确的参数值。
    4`run_with_adb.sh` 入参包括模型名称、操作系统、体系结构、目标设备、设备序列号等,需查阅注释信息配置正确的参数值。
    5`run_with_ssh.sh` 入参包括模型名称、操作系统、体系结构、目标设备、ip地址、用户名、用户密码等,需查阅注释信息配置正确的参数值。
    6)下述命令行示例中涉及的具体IP、SSH账号密码、设备序列号等均为示例环境,请用户根据自身实际设备环境修改。
    
    在 ARM CPU 上运行 mobilenet_v1_int8_224_per_layer 全量化模型
    $ cd PaddleLite-generic-demo/image_classification_demo/shell
    
    For SSH 连接开发板的使用场景
    
    Linux arm64 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux arm64 cpu IP地址 22 用户名 密码
    
    Linux arm32 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux armhf cpu IP地址 22 用户名 密码
    
    Android armeabi-v7a 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test android armeabi-v7a cpu IP地址 22 用户名 密码
      (如下以 A311D(Linux 版) 为例,其他 SoC 也一样,仅性能有区别)
    
      Top1 Egyptian cat - 0.503239
      Top2 tabby, tabby cat - 0.419854
      Top3 tiger cat - 0.065506
      Top4 lynx, catamount - 0.007992
      Top5 cougar, puma, catamount, mountain lion, painter, panther, Felis concolor - 0.000494
      Preprocess time: 8.881000 ms, avg 8.881000 ms, max 8.881000 ms, min 8.881000 ms
      Prediction time: 62.890000 ms, avg 62.890000 ms, max 62.890000 ms, min 62.890000 ms
      Postprocess time: 9.080000 ms, avg 9.080000 ms, max 9.080000 ms, min 9.080000 ms
    
    For ADB 连接开发板的使用场景
    
    Linux arm64 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux arm64 cpu adb设备号
    
    Linux arm32 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux armhf cpu adb设备号
    
    Android armeabi-v7a 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test android armeabi-v7a cpu adb设备号
      (如下以 S905D3(Android版) 为例,其他 SoC 也一样,仅性能有区别)
    
      Top1 Egyptian cat - 0.502124
      Top2 tabby, tabby cat - 0.413927
      Top3 tiger cat - 0.071703
      Top4 lynx, catamount - 0.008436
      Top5 cougar, puma, catamount, mountain lion, painter, panther, Felis concolor - 0.000563
      Preprocess time: 22.465000 ms, avg 22.465000 ms, max 22.465000 ms, min 22.465000 ms
      Prediction time: 135.449000 ms, avg 135.449000 ms, max 135.449000 ms, min 135.449000 ms
      Postprocess time: 16.956000 ms, avg 16.956000 ms, max 16.956000 ms, min 16.956000 ms
    
    ------------------------------
    
    在 芯原 NPU 上运行 mobilenet_v1_int8_224_per_layer 全量化模型
    $ cd PaddleLite-generic-demo/image_classification_demo/shell
    
    For SSH 连接开发板的使用场景
    
    Linux arm64 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux arm64 verisilicon_timvx IP地址 22 用户名 密码
    
    Linux arm32 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux armhf verisilicon_timvx IP地址 22 用户名 密码
    
    Android armeabi-v7a 命令:
    $ ./run_with_ssh.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test android armeabi-v7a verisilicon_timvx IP地址 22 用户名 密码
      (如下以 A311D(Linux 版) 为例,其他 SoC 也一样,仅性能有区别,精度可能有细微差异)
    
      Top1 Egyptian cat - 0.497230
      Top2 tabby, tabby cat - 0.403634
      Top3 tiger cat - 0.081897
      Top4 lynx, catamount - 0.011700
      Top5 tiger shark, Galeocerdo cuvieri - 0.000000
      Preprocess time: 13.014000 ms, avg 13.014000 ms, max 13.014000 ms, min 13.014000 ms
      Prediction time: 5.480000 ms, avg 5.480000 ms, max 5.480000 ms, min 5.480000 ms
      Postprocess time: 10.099000 ms, avg 10.099000 ms, max 10.099000 ms, min 10.099000 ms
    
    For ADB 连接开发板的使用场景
    
    Linux arm64 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux arm64 verisilicon_timvx adb设备号
    
    Linux arm32 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test linux armhf verisilicon_timvx adb设备号
    
    Android armeabi-v7a 命令:
    $ ./run_with_adb.sh mobilenet_v1_int8_224_per_layer imagenet_224.txt test android armeabi-v7a verisilicon_timvx adb设备号
      (如下以 S905D3(Android版) 为例,其他 SoC 也一样,仅性能有区别,精度可能有细微差异)
    
      Top1 Egyptian cat - 0.497230
      Top2 tabby, tabby cat - 0.403634
      Top3 tiger cat - 0.081897
      Top4 lynx, catamount - 0.011700
      Top5 great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias - 0.000000
      Preprocess time: 22.539000 ms, avg 22.539000 ms, max 22.539000 ms, min 22.539000 ms
      Prediction time: 11.470000 ms, avg 11.470000 ms, max 11.470000 ms, min 11.470000 ms
      Postprocess time: 17.884000 ms, avg 17.884000 ms, max 17.884000 ms, min 17.884000 ms
    
  • 如果需要更改测试图片,可将图片拷贝到 PaddleLite-generic-demo/image_classification_demo/assets/datasets/test/inputs 目录下,同时将图片文件名添加到 PaddleLite-generic-demo/image_classification_demo/assets/datasets/test/list.txt 中;

  • 重新编译示例程序:

    注意:
    1)请根据 `buid.sh` 配置正确的参数值。
    2)需在 Docker 环境中编译。
    
    For Linux 64
    $ ./build.sh linux arm64
    
    For Linux 32
    $ ./build.sh linux armhf
    
    For Android armeabi-v7a
    $ ./build.sh android armeabi-v7a
    

更新模型

  • 通过 Paddle 训练或 X2Paddle 转换得到 MobileNetv1 foat32 模型 mobilenet_v1_fp32_224

  • 通过 Paddle+PaddleSlim 后量化方式,生成 mobilenet_v1_int8_224_per_layer 量化模型

  • 下载 PaddleSlim-quant-demo.tar.gz ,解压后清单如下:

    - PaddleSlim-quant-demo
      - image_classification_demo
        - quant_post # 后量化
          - quant_post_rockchip_npu.sh # 一键量化脚本,Amlogic 和瑞芯微底层都使用芯原的 NPU,所以通用
          - README.md # 环境配置说明,涉及 PaddlePaddle、PaddleSlim 的版本选择、编译和安装步骤
          - datasets # 量化所需要的校准数据集合
            - ILSVRC2012_val_100 # 从 ImageNet2012 验证集挑选的 100 张图片
          - inputs # 待量化的 fp32 模型
            - mobilenet_v1
            - resnet50
          - outputs # 产出的全量化模型
          - scripts # 后量化内置脚本
    
  • 查看 README.md 完成 PaddlePaddle 和 PaddleSlim 的安装

  • 直接执行 ./quant_post_rockchip_npu.sh 即可在 outputs 目录下生成mobilenet_v1_int8_224_per_layer 量化模型

    -----------  Configuration Arguments -----------
    activation_bits: 8
    activation_quantize_type: moving_average_abs_max
    algo: KL
    batch_nums: 10
    batch_size: 10
    data_dir: ../dataset/ILSVRC2012_val_100
    is_full_quantize: 1
    is_use_cache_file: 0
    model_path: ../models/mobilenet_v1
    optimize_model: 1
    output_path: ../outputs/mobilenet_v1
    quantizable_op_type: conv2d,depthwise_conv2d,mul
    use_gpu: 0
    use_slim: 1
    weight_bits: 8
    weight_quantize_type: abs_max
    ------------------------------------------------
    quantizable_op_type:['conv2d', 'depthwise_conv2d', 'mul']
    2021-08-30 05:52:10,048-INFO: Load model and set data loader ...
    2021-08-30 05:52:10,129-INFO: Optimize FP32 model ...
    I0830 05:52:10.139564 14447 graph_pattern_detector.cc:91] ---  detected 14 subgraphs
    I0830 05:52:10.148236 14447 graph_pattern_detector.cc:91] ---  detected 13 subgraphs
    2021-08-30 05:52:10,167-INFO: Collect quantized variable names ...
    2021-08-30 05:52:10,168-WARNING: feed is not supported for quantization.
    2021-08-30 05:52:10,169-WARNING: fetch is not supported for quantization.
    2021-08-30 05:52:10,170-INFO: Preparation stage ...
    2021-08-30 05:52:11,853-INFO: Run batch: 0
    2021-08-30 05:52:16,963-INFO: Run batch: 5
    2021-08-30 05:52:21,037-INFO: Finish preparation stage, all batch:10
    2021-08-30 05:52:21,048-INFO: Sampling stage ...
    2021-08-30 05:52:31,800-INFO: Run batch: 0
    2021-08-30 05:53:23,443-INFO: Run batch: 5
    2021-08-30 05:54:03,773-INFO: Finish sampling stage, all batch: 10
    2021-08-30 05:54:03,774-INFO: Calculate KL threshold ...
    2021-08-30 05:54:28,580-INFO: Update the program ...
    2021-08-30 05:54:29,194-INFO: The quantized model is saved in ../outputs/mobilenet_v1
    post training quantization finish, and it takes 139.42292165756226.
    
    -----------  Configuration Arguments -----------
    batch_size: 20
    class_dim: 1000
    data_dir: ../dataset/ILSVRC2012_val_100
    image_shape: 3,224,224
    inference_model: ../outputs/mobilenet_v1
    input_img_save_path: ./img_txt
    save_input_img: False
    test_samples: -1
    use_gpu: 0
    ------------------------------------------------
    Testbatch 0, acc1 0.8, acc5 1.0, time 1.63 sec
    End test: test_acc1 0.76, test_acc5 0.92
    --------finish eval int8 model: mobilenet_v1-------------
    
    • 参考模型转化方法,利用 opt 工具转换生成 TIM-VX 模型,仅需要将 valid_targets 设置为 verisilicon_timvx, arm 即可。

    $ ./opt --model_dir=mobilenet_v1_int8_224_per_layer \
        --optimize_out_type=naive_buffer \
        --optimize_out=opt_model \
        --valid_targets=verisilicon_timvx,arm
    

更新支持 TIM-VX 的 Paddle Lite 库

  • 下载 Paddle Lite 源码

    $ git clone https://github.com/PaddlePaddle/Paddle-Lite.git
    $ cd Paddle-Lite
    $ git checkout <release-version-tag>
    注意:编译中依赖的 verisilicon_timvx 相关代码和依赖项会在后续编译脚本中自动下载,无需用户手动下载。
    
  • 编译并生成 Paddle Lite+Verisilicon_TIMVX 的部署库

    • For A311D(Linux 版) & S905D3(Linux 版) & C308X(Linux 版)

      • tiny_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_4_3_generic.tgz
        
      • full_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_4_3_generic.tgz full_publish
        
      • 替换头文件和库

        替换 include 目录
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/include/ PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/include/
        
        替换 NNAdapter 运行时库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libnnadapter.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 NNAdapter device HAL 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libverisilicon_timvx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 芯原 TIM-VX 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libtim-vx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 libpaddle_light_api_shared.so
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_light_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
        替换 libpaddle_full_api_shared.so (仅在 full_publish 编译方式下)
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_full_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
    • For A311D(Android 版) &S905D3(Android 版)

      • tiny_publish 编译方式

        $ ./lite/tools/build_android.sh --arch=armv7 --toolchain=clang --android_stl=c++_shared --with_extra=ON --with_exception=ON --with_cv=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_android_9_armeabi_v7a_6_4_4_3_generic.tgz
        
      • full_publish 编译方式

        $ ./lite/tools/build_android.sh --arch=armv7 --toolchain=clang --android_stl=c++_shared --with_extra=ON --with_exception=ON --with_cv=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_android_9_armeabi_v7a_6_4_4_3_generic.tgz full_publish
        
      • 替换头文件和库

        替换 include 目录
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/include/ PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/include/
        
        替换 NNAdapter 运行时库
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/lib/libnnadapter.so PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx/
        
        替换 NNAdapter device HAL 库
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/lib/libverisilicon_timvx.so PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx/
        
        替换 芯原 TIM-VX 库
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/lib/libtim-vx.so PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/verisilicon_timvx/
        
        替换 libpaddle_light_api_shared.so
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/lib/libpaddle_light_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/
        
        替换 libpaddle_full_api_shared.so(仅在 full_publish 编译方式下)
        $ cp -rf build.lite.android.armv7.clang/inference_lite_lib.android.armv7.nnadapter/cxx/lib/libpaddle_full_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/android/armeabi-v7a/lib/
        
    • For RV1109 & RV1126

      • tiny_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_cv=ON --with_exception=ON --arch=armv7hf  --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm32_6_4_6_5_generic.tgz
        
      • full_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_cv=ON --with_exception=ON --arch=armv7hf  --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm32_6_4_6_5_generic.tgz full_publish
        
      • 替换头文件和库

        替换 include 目录
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/include/ PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/include/
        
        替换 NNAdapter 运行时库
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/lib/libnnadapter.so PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/
        
        替换 NNAdapter device HAL 库
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/lib/libverisilicon_timvx.so PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/
        
        替换 芯原 TIM-VX 库
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/lib/libtim-vx.so PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/verisilicon_timvx/
        
        替换 libpaddle_light_api_shared.so
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/lib/libpaddle_light_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/
        
        替换 libpaddle_full_api_shared.so (仅在 full_publish 编译方式下)
        $ cp -rf build.lite.linux.armv7hf.gcc/inference_lite_lib.armlinux.armv7hf.nnadapter/cxx/lib/libpaddle_full_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/armhf/lib/
        
    • For RK1808

      • tiny_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_6_5_generic.tgz
        
      • full_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_6_5_generic.tgz full_publish
        
      • 替换头文件和库

        替换 include 目录
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/include/ PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/include/
        
        替换 NNAdapter 运行时库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libnnadapter.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 NNAdapter device HAL 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libverisilicon_timvx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 芯原 TIM-VX 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libtim-vx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 libpaddle_light_api_shared.so
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_light_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
        替换 libpaddle_full_api_shared.so (仅在 full_publish 编译方式下)
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_full_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
    • For NXP imx8m plus

      • tiny_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_3_p1_generic.tgz
        
      • full_publish 编译方式

        $ ./lite/tools/build_linux.sh --with_extra=ON --with_log=ON --with_nnadapter=ON --nnadapter_with_verisilicon_timvx=ON --nnadapter_verisilicon_timvx_viv_sdk_url=http://paddlelite-demo.bj.bcebos.com/devices/verisilicon/sdk/viv_sdk_linux_arm64_6_4_3_p1_generic.tgz full_publish
        
      • 替换头文件和库

        替换 include 目录
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/include/ PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/include/
        
        替换 NNAdapter 运行时库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libnnadapter.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 NNAdapter device HAL 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libverisilicon_timvx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 芯原 TIM-VX 库
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libtim-vx.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/verisilicon_timvx/
        
        替换 libpaddle_light_api_shared.so
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_light_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
        替换 libpaddle_full_api_shared.so (仅在 full_publish 编译方式下)
        $ cp -rf build.lite.linux.armv8.gcc/inference_lite_lib.armlinux.armv8.nnadapter/cxx/lib/libpaddle_full_api_shared.so PaddleLite-generic-demo/libs/PaddleLite/linux/arm64/lib/
        
  • 替换头文件后需要重新编译示例程序

其它说明

  • Paddle Lite 研发团队正在持续扩展基于TIM-VX的算子和模型。