技术公开课实录:图像分割库PaddleSeg深度解析与应用
导读:飞桨(PaddlePaddle)致力于让深度学习技术的创新与应用更简单。为了让更多的开发者了解飞桨的最近技术进展,特别组织了系列技术稿件,视频来源于2019 WaveSummit秋季深度学习开发者峰会上的技术公开课。
本期是由百度飞桨资深研发工程师为大家带来图像分割库PaddleSeg深度解析与应用,敬请观看。
视频关键知识点Notes:
PaddleSeg四个特点:一是丰富的数据增强;二是模块化的设计;三是在高性能优化;四是工业级部署。
01
丰富的数据增强
PaddleSeg提供10余种数据增强的策略,有效的训练数据,大幅度提升模型的鲁棒性,开发者可以根据实际的场景进行灵活组合,根据实际场景进行选用,让整个分割模型应用泛化能力更强。
02
模块化的设计
整个PaddleSeg开发套件都是模块化设计的,无论是数据增强模块里面的多种增强算法,主干网络的多种Backbone模块选择,都可以让开发者更好的根据实际业务场景需求使用。分割网络包含了目前的4种主流网络:医疗领域常见的U-Net,经典的DeepLabV3,面向实时场景的分割模型ICNet等。同时对于损失函数的模块化设计,也可以更好的提升各个分类场景下的分割精度,例如小目标分割的效果。
03
高性能
PaddleSeg在性能优化方面开展了很多工作。包括训练速度提升、GPU利用率提升以及显存性能优化。同时支持较新的FP16混合精度的训练。特别的,对于动态的Loss Scaling,在不损失精度的情况下,性能可以有30%的提升。PaddleSeg在英伟达特斯拉V100卡上,单卡训练速度是对标产品的2.3倍,多卡上是对标产品的3.1倍。
04
工业级部署
根据产业的需求,PaddleSeg开发了高性能的C++预测库。在多线程计算优化、算子硬件加速方面,而且依托于真实的项目实践验证做了大量优化工作,真正满足工业级部署需求。
05
应用场景和案例介绍
5.1电池隔膜产品质检任务
此任务的挑战是,分割目标非常小、类别不均匀、预测性能要求高,不能拖慢流水线的速度。通过PaddleSeg实现方案最终IoU做到了0.82。预测速度在200×200的图上小于2.5毫秒,保证生产效率不会受影响。
5.2工业精密零件质检智能分拣
选用了ICNet,在800×800、1000×1000的大图分割速度约25毫秒,误收率小于0.1%,对比其他框架速度快20%左右。
5.3人像分割
PaddleSeg开放了人像分割的预训练模型,mIoU可以做到0.93,适用于证件照片、人像特效、替换照片视频背景等分割任务。
06
后续规划
PaddleSeg后续开放方向:一是视频级别分割,做到如人体特效、天空分割、实时的语义分割等;二是图像分割解决方案。三是高性能的端侧部署,与PaddleSlim打通,支持模型压缩,并与Paddle Lite整合,让开发者能够更方便的部署到端上。
进入网盘获取视频中的PPT,链接:
https://pan.baidu.com/s/1Kg_nymkE8RC92JdW87fZAw 密码:9nw6
想与更多的深度学习开发者交流,请加入飞桨官方QQ群:796771754。
如果您想详细了解更多飞桨PaddlePaddle的相关内容,请参阅以下文档。
官网地址:https://www.paddlepaddle.org.cn
项目地址:
https://github.com/PaddlePaddle/PaddleSeg