2019/04/14创新实训------街景翻译APP
团队进展
本周团队被世俗的泥潭牵绊住了追求梦想的脚步,但是即使如此,我们依然不放弃任何一个做项目的机会,本周检测模型和识别模型都有了初步的版本,已经可以完成初步的功能,接下来就是提升效果的工作了。
文本检测
见成员博客
XYC: https://blog.****.net/weixin_44633882/article/details/89305919
XCY: https://blog.****.net/u013575592/article/details/89219406
文本识别
模型训练完毕,loss 可以趋近于 0 , 效果已经成型,下面会详细讲述。
个人进展
训练过程
设定迭代 400 遍,学习率为 1e-4 ,采用 CTC loss 函数, 以下是训练过程中的 loss 变化, 可以看到训练的非常好,和上篇博客里的样子完全不同。
效果
预测结果及部分原图片展示
Label | Bistro | خرج | THEATER |
Predict | stro | خرج | THEATER |
优点: 字符没有错误识别,都能够正确的对应
这可能是因为训练集为了测试没有放太大才拥有的比较好的效果
缺点: 开头的 1-2 个字符会丢失
这是因为在产生sliding windows的步骤中纳入开头信息极少,为了解决这个问题,我尝试在开头补0,或者补背景颜色,但是效果甚微,目前还没有思路。