卖货郎机器人的制作:视觉模块之商品识别引擎
本文硬件软件:
CPU:i7-8700
GPU:1070
系统:windows10
软件版本:paddlex1.0.0
CUDA:10.0
CUDNN:7.5.0
本文的商品识别引擎使用了十二类商品共六千张照片进行商品识别建模。建模软件使用了百度Paddlex,数据集切分为训练集90%,验证集5%,测试集5%。
网络模型选择了Mobilenetv3_large_ssld,迭代epoch为10,学习率0.015,bachsize设置为32。针对商品识别中比较重要的特征,在数据增强中选择了随机翻转,随机旋转。
经过大约半小时的训练,得到了一个识别精度不错的模型。结果如图:
预测标签与真实标签对比
变脸识别
飞行小黄人识别
盒装小黄人识别
训练完模型后将摄像头拍摄的图像喂给预测模型,得到识别结果,选择识别置信度最高的结果作为输出。显示在屏幕上,并语音播报出来。