神经网络-深度学习(tensorflow一般流程!)

:使用tensorflow,我们要建立学习模型,必须要有一个清晰的流程,来指导我们去实现。

神经网络(NN)实现过程如下:
1).准备数据集,提取特征,作为输入喂给神经网络。
2).搭建NN结构,从输入到输出(先搭建计算图,再用会话执行)
(NN前向传播算法->计算输出)。
3).大量特征数据喂给NN,迭代优化NN参数
(NN反向传播算法->优化参数训练模型)。
4).使用训练好的模型预测和分类。
这四步就是我们一般的建模思路,首先就是准备数据集,提取特征,简单点也就是建立数据集X,和数据的标签Y_。
第二步就是建立前向传播的流程,具体的工作,也就是从输入x到输出y(这个y不是真实标签,而是有模型输出的预测结果)这之间要进行的一切操作,一般也就是数据乘权重,最终输出y
接下来就是建立反向传播,从第二步输出y后,我们还需要根据这个结果对前面操作的权重和偏置等进行优化,具体的工作就是建立损失函数,并用这个函数对参数进行改动。
最后也就是对训练好的模型预测和分类。

下面我们用一个简单例子

import tensorflow as tf
import numpy as np
BATCH_SIZE=8         #表示一次喂入模型的数据的数量
seed=23455          
#基于seed产生随机数
rng=np.random.RandomState(seed)

#1.准备数据集     
#随机数返回322列的矩阵,表示32组 体积和重量 作为输入的数据集
X=rng.rand(32,2)      
#从X这个322列的矩阵中取出一行 判断如果和小于1 给y赋值1,如果和不小于1,给y赋值为0
#作为输入数据集的标签(正确答案)
Y=[[int(x0+x1<1)] for (x0,x1) in X]
print("X:\n",X)
print("Y:\n",Y)


#2.前向传播
#定义神经网络的输入,参数和输出,定义前向传播过程。
x=tf.placeholder(tf.float32,shape=(None,2))
y_=tf.placeholder(tf.float32,shape=(None,1))
w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))

a=tf.matmul(x,w1)
y=tf.matmul(a,w2)

#反向传播
#定义损失函数及反向传播方法
loss=tf.reduce_mean(tf.square(y-y_))
s
#train_step=tf.train.MomentumOptimizer(0.001,0.9).minimize(loss)
#train_step=tf.train.AdamOptimizer(0.001).minimize(loss)

#生成会话,训练steps轮
with tf.Session() as sess:
       init_op=tf.global_variables_initializer()
       sess.run(init_op)
       #输出目前(未经训练)的参数取值
       print("w1:\n",sess.run(w1))
       print("w2:\n",sess.run(w2))
       print("\n")
       #训练模型
       STEPS=3000
       for i in range(STEPS):
            start=(i*BATCH_SIZE)%32
            end=start+BATCH_SIZE
            sess.run(train_step,feed_dict={x:X[start:end]},y_:Y[start:end])
            if i%500 ==0:
               total_loss=sess.run(loss,feed_dict={x:X,y_:Y})
               print("After %d training step(s),loss on all data is %g"%(i,total_loss))
       #输出训练后的参数取值
       print("\n")
       print("w1:\n",sess.run(w1))
       print("w2:\n",sess.run(w2))
发布了27 篇原创文章 · 获赞 16 · 访问量 1894

猜你喜欢

转载自blog.csdn.net/weixin_43979090/article/details/102416013