数据集及模型下载链接:
https://github.com/PaddlePaddle/PaddleSeg
★ 记得Star收藏 ★
防止走丢又实时关注更新
PSSL是具有120+万张和1000类别的语义分割伪标签数据集,伪标签指的则是区别于手动标注,由模型自动生成的标签,而PSSL是由百度自研的可解释性算法自动生成。目前常见的语义分割数据集有Pascal VOC, ADE20K, Cityscapes等,它们的样本数量约为5千到2万,类别约为19到80。而PSSL具有120+万的样本数和1000的类别,是常见数据集的近百倍,因此PSSL数据集具有数量更多、类别更丰富的优势,能克服产业实践中场景多样化带来的挑战。
同时,构建语义分割数据集时往往会遇到标注难度大、制作成本高等困难,而PSSL以其自动生成的特性,能够很好地解决上述困难,维持数据集制作成本与质量之间的平衡。
那么PSSL数据集究竟是如何制作的呢?
单个模型与Consensus解释结果(最右)示意图
预训练方法的改善
如下图所示,对比于传统方式仅初始化分类模块,PSSL全新预训练策略则是在预训练阶段将分割模块也一起进行训练,进而降低下游任务的训练难度。
免费使用PSSL数据集
训练好的预训练模型
在最新版的PaddleSeg中,我们也提供了训练好的模型和训练过程记录,方便开发者省去预训练的过程。
利用PSSL数据集和这种预训练方式,不管什么模型、什么数据,分割效果还能再提升1~5个点。这完全就是免费的午餐呀!
预训练教程全开放
总而言之,PaddleSeg新增的PSSL数据集与预训练模型助力全面提升分割模型在下游任务上的性能,使得分割任务的产业落地更加简单!
引用:
[1] Zhou, B., Khosla, A., Lapedriza, A., Oliva, A., & Torralba, A. (2015). Learning Deep Features for Discriminative Localization. arXiv preprint arXiv:1512.04150.
[3] https://github.com/PaddlePaddle/PaddleClas.
[4]https://github.com/PaddlePaddle/InterpretDL.
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~
数据集及模型下载链接:
https://github.com/PaddlePaddle/PaddleSeg
★ 记得Star收藏 ★
防止走丢又实时关注更新
PSSL是具有120+万张和1000类别的语义分割伪标签数据集,伪标签指的则是区别于手动标注,由模型自动生成的标签,而PSSL是由百度自研的可解释性算法自动生成。目前常见的语义分割数据集有Pascal VOC, ADE20K, Cityscapes等,它们的样本数量约为5千到2万,类别约为19到80。而PSSL具有120+万的样本数和1000的类别,是常见数据集的近百倍,因此PSSL数据集具有数量更多、类别更丰富的优势,能克服产业实践中场景多样化带来的挑战。
同时,构建语义分割数据集时往往会遇到标注难度大、制作成本高等困难,而PSSL以其自动生成的特性,能够很好地解决上述困难,维持数据集制作成本与质量之间的平衡。
那么PSSL数据集究竟是如何制作的呢?
单个模型与Consensus解释结果(最右)示意图
预训练方法的改善
如下图所示,对比于传统方式仅初始化分类模块,PSSL全新预训练策略则是在预训练阶段将分割模块也一起进行训练,进而降低下游任务的训练难度。
免费使用PSSL数据集
训练好的预训练模型
在最新版的PaddleSeg中,我们也提供了训练好的模型和训练过程记录,方便开发者省去预训练的过程。
利用PSSL数据集和这种预训练方式,不管什么模型、什么数据,分割效果还能再提升1~5个点。这完全就是免费的午餐呀!
预训练教程全开放
总而言之,PaddleSeg新增的PSSL数据集与预训练模型助力全面提升分割模型在下游任务上的性能,使得分割任务的产业落地更加简单!
引用:
[1] Zhou, B., Khosla, A., Lapedriza, A., Oliva, A., & Torralba, A. (2015). Learning Deep Features for Discriminative Localization. arXiv preprint arXiv:1512.04150.
[3] https://github.com/PaddlePaddle/PaddleClas.
[4]https://github.com/PaddlePaddle/InterpretDL.
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~