2019/04/14创新实训------街景翻译APP

团队进展

本周团队被世俗的泥潭牵绊住了追求梦想的脚步,但是即使如此,我们依然不放弃任何一个做项目的机会,本周检测模型和识别模型都有了初步的版本,已经可以完成初步的功能,接下来就是提升效果的工作了。

文本检测

见成员博客
XYC: https://blog.****.net/weixin_44633882/article/details/89305919
XCY: https://blog.****.net/u013575592/article/details/89219406

文本识别

模型训练完毕,loss 可以趋近于 0 , 效果已经成型,下面会详细讲述。

个人进展

训练过程

设定迭代 400 遍,学习率为 1e-4 ,采用 CTC loss 函数, 以下是训练过程中的 loss 变化, 可以看到训练的非常好,和上篇博客里的样子完全不同。
2019/04/14创新实训------街景翻译APP

效果

预测结果及部分原图片展示

2019/04/14创新实训------街景翻译APP

2019/04/14创新实训------街景翻译APP 2019/04/14创新实训------街景翻译APP 2019/04/14创新实训------街景翻译APP
Label Bistro خرج THEATER
Predict stro خرج THEATER

优点: 字符没有错误识别,都能够正确的对应

这可能是因为训练集为了测试没有放太大才拥有的比较好的效果

缺点: 开头的 1-2 个字符会丢失

这是因为在产生sliding windows的步骤中纳入开头信息极少,为了解决这个问题,我尝试在开头补0,或者补背景颜色,但是效果甚微,目前还没有思路。