利用tensorflow深度学习框架手写数字识别

首先解决数据问题，由于tensorflow自带手写数据集，本次直接使用，划重点来了：无论是机器学习还是

深度学习，首先最难的也是最复杂的都是数据集的筛选和清理。数据集的好坏直接影响了学习的成败。tensorflow

自带的手写数据集完全很友好，完全不用清理。切记：真实项目完全不是这样的友好数据。

这里win7电脑加一个8Gcpu就可以了，由于电脑限制，所以使用cpu加速的tensorflow:

导入框架和数据

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

下载数据到当前路径

mnist=input_data.read_data_sets("MNIST_data/",one_hot=True)

print('输入数据：',mnist.train.images)
print('输入数据的shape：',mnist.train.images.shape)
import pylab
im=mnist.train.images[1]
im=im.reshape(-1,28)
pylab.imshow(im)
pylab.show()

结果显示：

print('输入数据的shape:',mnist.test.images.shape)
print('输入数据的shape:',mnist.validation.images.shape)

tf.reset_default_graph(）
x=tf.placeholder(tf.float32,[None,784])
y=tf.placeholder(tf.float32,[None,10])
W=tf.Variable(tf.random_normal(([784,10])))
b=tf.Variable(tf.zeros([10]))
pred=tf.nn.softmax(tf.matmul(x,W)+b)
cost=tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))
learning_rate=0.01
optimizer=tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
training_epochs=25
batch_size=100
display_step=1
saver=tf.train.Saver()

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for epoch in range(training_epochs):
        avg_cost=0.
        total_batch=int(mnist.train.num_examples/batch_size)
        for i in range(total_batch):
            batch_xs,batch_ys=mnist.train.next_batch(batch_size)
            _,c=sess.run([optimizer,cost],feed_dict={x:batch_xs,y:batch_ys})
            avg_cost+=c/total_batch
        if(epoch+1)%display_step==0:
            print("Epoch:",'%04d'%(epoch+1),"cost:","{:.9f}".format(avg_cost))
            print(sess.run(W))
            print("=====================")
            print(sess.run(b))
    print("学习结束！！！！")
    #saver.save(sess,model_path+"model.cpkt")
    saver.save(sess,"C:/Users/Administrator/log/model.cpkt")
    #print("模型保存的路径：%s" %save_path)
    correct_prediction=tf.equal(tf.argmax(pred,1),tf.argmax(y,1))
    accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
    print("Accuracy:",accuracy.eval({x:mnist.test.images,y:mnist.test.labels}))

print("用我的模型来预测！！！！！")
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    saver.restore(sess,"C:/Users/Administrator/log/model.cpkt")
    correct_prediction=tf.equal(tf.argmax(pred,1),tf.argmax(y,1))
    accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
    print("Accuracy:",accuracy.eval({x:mnist.test.images,y:mnist.test.labels}))
    output=tf.argmax(pred,1)
    batch_xs,batch_ys=mnist.train.next_batch(2)
    outputval,predv=sess.run([output,pred],feed_dict={x:batch_xs})
    print(outputval,predv,batch_ys)
    im=batch_xs[0]
    im=im.reshape(-1,28)
    pylab.imshow(im)
    pylab.show()
    im=batch_xs[1]
    im=im.reshape(-1,28)
    pylab.imshow(im)
    pylab.show()

以上也就是单层神经元对于多分类的预测，准确率在0.82左右，虽然看起来过得去，但是细想数据集如此友好，结果却一般，和普通的分类算法近乎无二。所以单层神经网络的

意义并不大。本书主要学习了李金洪先生的tensorflow书籍，对其代码进行了补充和修改，主要bug在于模型保存时，书中的路径是相对路径，运行过很多次都是报错，

后来调整了saver的定义位置，并且将路径写成绝对路径，代码得以运行，有兴趣的骚年可以改变学习率和迭代次数，

修改学习率为0.05时准确率提高到0.88

利用tensorflow深度学习框架手写数字识别

猜你喜欢