分类算法测试
今天主要总结一些问题:
(1)Blas GEMM launch failed : a.shape=(50, 784), b.shape=(784, 10), m=50, n=10, k=784
这个问题很诡异:重启jupyter notebook就没有了,然后切换别的程序执行,又有了,查看GPU信息:
程序都执行完很久了,显存还被占用着。待会我看下关闭之后的显存状态。(应该是代码不规范导致的,但是我还不知道怎么来规范代码)
关闭(jupyter)之后:
(2)loss:nan;acc: < 0.1
学习率太小了,根本学不了。尝试增大;采用SGD。学习率为0.5
但是如果采用Adam,学习率为0.5,直接发散,还不知道为啥。(留待慢慢补充)
因此:修改学习率 + 学习优化算法