街景字符识别Task1学习笔记
1.本人使用的笔记本显卡是GTX1660Ti-MQ 6G,使用GPU跑baseline需要将步骤5的use_cuda改成True。
2.在运行程序时候遇到如下报错:
原因是GPU里存的tensor无法转为numpy数组,需要先转为cpu类型的tensor,解决方案如下:
在data后加.cpu()即可。
3.程序跑通后将epoch设置为10,其他超参不变的情况下,比较batchsize分别为30,40,64时模型迭代10后的效果发现batchsize=40时效果最好,可以在batchsize为40与64之间多取几个值试试。
batchsize=30
batchsize=40
batchsize=64