模型选择
单目3D检测提供两种方案选择:基于anchor的方案和anchor-free的方案。
anchor方案:从图像中估计出3D检测框,也无需预测中间的3D场景表示,可以直接利用一个区域提案网络,生成给定图像的3D锚点。不同于以往与类别无关的2D锚点,3D锚点的形状通常与其语义标签有很强的相关性。
anchor-free方案:将2D检测方法CenterNet扩展到基于图像的3D检测器,该框架将对象编码为单个点(对象的中心点)并使用关键点估计来找到它。此外,几个平行的头被用来估计物体的其他属性,包括深度、尺寸、位置和方向。
我们采用基于anchor的方法,使用了3D障碍物的平均信息作为先验知识,效果实际落地更好。在骨干网络部分,我们选择的是DenseNet,这种网络建立的是前面所有层与后面层的密集连接,实现特征重用,有着省参数、扛过拟合等优点。我们提供了以下版本的方案尝试:
根据单目3D检测实时性的要求,这里我们选择了DenseNet121作为我们的骨干网络。
算法优化
数据过滤:根据bbox可见程度、大小来过滤每个bbox标签,根据有无保留bbox过滤每张图片,整体平衡前后背景,保证训练的稳定性。
数据增强:主要使用RandomFlip、Resize两种数据增强策略。
anchor定义:模型输出
模型部署
飞桨产业实践范例
助力企业跨越AI落地鸿沟
精彩课程预告
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~
模型选择
单目3D检测提供两种方案选择:基于anchor的方案和anchor-free的方案。
anchor方案:从图像中估计出3D检测框,也无需预测中间的3D场景表示,可以直接利用一个区域提案网络,生成给定图像的3D锚点。不同于以往与类别无关的2D锚点,3D锚点的形状通常与其语义标签有很强的相关性。
anchor-free方案:将2D检测方法CenterNet扩展到基于图像的3D检测器,该框架将对象编码为单个点(对象的中心点)并使用关键点估计来找到它。此外,几个平行的头被用来估计物体的其他属性,包括深度、尺寸、位置和方向。
我们采用基于anchor的方法,使用了3D障碍物的平均信息作为先验知识,效果实际落地更好。在骨干网络部分,我们选择的是DenseNet,这种网络建立的是前面所有层与后面层的密集连接,实现特征重用,有着省参数、扛过拟合等优点。我们提供了以下版本的方案尝试:
根据单目3D检测实时性的要求,这里我们选择了DenseNet121作为我们的骨干网络。
算法优化
数据过滤:根据bbox可见程度、大小来过滤每个bbox标签,根据有无保留bbox过滤每张图片,整体平衡前后背景,保证训练的稳定性。
数据增强:主要使用RandomFlip、Resize两种数据增强策略。
anchor定义:模型输出
模型部署
飞桨产业实践范例
助力企业跨越AI落地鸿沟
精彩课程预告
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~