注:使用tensorflow,我们要建立学习模型,必须要有一个清晰的流程,来指导我们去实现。
神经网络(NN)实现过程如下:
1).准备数据集,提取特征,作为输入喂给神经网络。
2).搭建NN结构,从输入到输出(先搭建计算图,再用会话执行)
(NN前向传播算法->计算输出)。
3).大量特征数据喂给NN,迭代优化NN参数
(NN反向传播算法->优化参数训练模型)。
4).使用训练好的模型预测和分类。
这四步就是我们一般的建模思路,首先就是准备数据集,提取特征,简单点也就是建立数据集X,和数据的标签Y_。
第二步就是建立前向传播的流程,具体的工作,也就是从输入x到输出y(这个y不是真实标签,而是有模型输出的预测结果)这之间要进行的一切操作,一般也就是数据乘权重,最终输出y
接下来就是建立反向传播,从第二步输出y后,我们还需要根据这个结果对前面操作的权重和偏置等进行优化,具体的工作就是建立损失函数,并用这个函数对参数进行改动。
最后也就是对训练好的模型预测和分类。
下面我们用一个简单例子:
import tensorflow as tf
import numpy as np
BATCH_SIZE=8 #表示一次喂入模型的数据的数量
seed=23455
#基于seed产生随机数
rng=np.random.RandomState(seed)
#1.准备数据集
#随机数返回32行2列的矩阵,表示32组 体积和重量 作为输入的数据集
X=rng.rand(32,2)
#从X这个32行2列的矩阵中取出一行 判断如果和小于1 给y赋值1,如果和不小于1,给y赋值为0
#作为输入数据集的标签(正确答案)
Y=[[int(x0+x1<1)] for (x0,x1) in X]
print("X:\n",X)
print("Y:\n",Y)
#2.前向传播
#定义神经网络的输入,参数和输出,定义前向传播过程。
x=tf.placeholder(tf.float32,shape=(None,2))
y_=tf.placeholder(tf.float32,shape=(None,1))
w1=tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))
w2=tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))
a=tf.matmul(x,w1)
y=tf.matmul(a,w2)
#反向传播
#定义损失函数及反向传播方法
loss=tf.reduce_mean(tf.square(y-y_))
s
#train_step=tf.train.MomentumOptimizer(0.001,0.9).minimize(loss)
#train_step=tf.train.AdamOptimizer(0.001).minimize(loss)
#生成会话,训练steps轮
with tf.Session() as sess:
init_op=tf.global_variables_initializer()
sess.run(init_op)
#输出目前(未经训练)的参数取值
print("w1:\n",sess.run(w1))
print("w2:\n",sess.run(w2))
print("\n")
#训练模型
STEPS=3000
for i in range(STEPS):
start=(i*BATCH_SIZE)%32
end=start+BATCH_SIZE
sess.run(train_step,feed_dict={x:X[start:end]},y_:Y[start:end])
if i%500 ==0:
total_loss=sess.run(loss,feed_dict={x:X,y_:Y})
print("After %d training step(s),loss on all data is %g"%(i,total_loss))
#输出训练后的参数取值
print("\n")
print("w1:\n",sess.run(w1))
print("w2:\n",sess.run(w2))