分类算法测试

今天主要总结一些问题:

(1)Blas GEMM launch failed : a.shape=(50, 784), b.shape=(784, 10), m=50, n=10, k=784

这个问题很诡异:重启jupyter notebook就没有了,然后切换别的程序执行,又有了,查看GPU信息:

程序都执行完很久了,显存还被占用着。待会我看下关闭之后的显存状态。(应该是代码不规范导致的,但是我还不知道怎么来规范代码)

参考:https://stackoverflow.com/questions/43768498/tensorflow-basic-example-error-cublas-status-not-initialized

关闭(jupyter)之后:

(2)loss:nan;acc: < 0.1

学习率太小了,根本学不了。尝试增大;采用SGD。学习率为0.5

但是如果采用Adam,学习率为0.5,直接发散,还不知道为啥。(留待慢慢补充)

因此:修改学习率 + 学习优化算法

猜你喜欢

转载自blog.csdn.net/gaotihong/article/details/81107018