【深度学习】用tensorflow搭建自己的神经网络

1.创建一个神经网络层

2.运用神经网络层搭建完整神经网络

3.显示训练过程

4.tensorboard展示神经网络图

之前已经讲过了神经网络的基本知识：【机器学习】神经网络介绍和 【深度学习】卷积神经网络入门

本节用tensorflow来搭建一个神经网络，实现y=x*x+1的拟合。

1.创建一个神经网络层

在之前的学习中，了解到一个完整的神经网络，包括输入层、卷积层、池化层、全连接层等部分。在tensorflow中，也已经有了专门的卷积层函数，例如：tf.nn.conv2d（卷积）、tf.nn.max_pool（池化）等。

那如果想学习自己搭建一个神经网络层，需要包含哪些部分呢？

如下图所示，一个神经网络层需要有数据输入、数据输出、激活函数。

创建一个神经网络层

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小（前一层神经元个数）
    :param out_size: 输出大小（本层神经元个数）
    :param activation_function: 激活函数（默认没有）
    :return:
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

分析：

参数如下，

input:输入个数

in_size: 当前层的输入的个数

out_size:当前层的输出的个数（即当前层神经元的个数）

activation_function：激活函数（输入层无激活函数，仅起到传递信号的作用，卷积层、池化层等含有激活函数。）

内部运算如下：

权值初始化(Weight)：大小为 in_size * out_size；

偏置初始化(biases)：大小为out_size（即本层神经元的个数）

卷积和运算：W_mul_x_plus_b=tf.matmul(input,Weight) + biases

输出为(output)：activation_function(W_mul_x_plus_b)，若无激活函数则为 output=W_mul_x_plus_b。

2.运用神经网络层搭建完整神经网络

一个完整的神经网络，需要有输入层（输入数据）、隐藏层（功能层）、输出层（输出结果）、损失函数、参数求取（梯度下降法）等。

#准备训练所需的数据

x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度，原先是（300，）变为（300，1）
noise=np.random.normal(0,0.05,x_data.shape)  #噪声
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

#定义数据格式（占位符，便于下边训练）

xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层，含有10个神经元

hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)

#定义一个输出层，含有1个神经元

prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#定义训练过程并进行训练

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss) #梯度下降法使误差最小，学习率为0.1

init=tf.global_variables_initializer() #变量初始化
sess=tf.Session()
sess.run(init) #执行初始化
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data}) #训练
    if i%100==0:
        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  ) #输出当前loss

#关闭sess
sess.close()

--------------------------------------------- 完整程序如下：---------------------------------------------------

#encoding:utf-8
#add_layer_1.py 练习增加网络层

#创建神经网络并训练
#功能：拟合 y=x*x+1

import tensorflow as tf
import numpy as np

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数（默认没有）
    :return:output：数据输出
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

#创建一个具有输入层，隐藏层，输出层的三层神经网络，神经元个数分别为1，10，1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度，原先是（300，）变为（300，1）
noise=np.random.normal(0,0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

# print(x_data.shape)
# x=np.linspace(-1,1,300)
# print(x.shape)

#定义输入数据
xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层
hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)

init=tf.global_variables_initializer()
sess=tf.Session()
sess.run(init)
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )

#关闭sess
sess.close()

运行结果：

发现随着训练次数的增加，loss越来越小。

3.显示训练过程

matplotlib在Python中应用最多的2D图像的绘图工具包，使用matplotlib能够非常简单的可视化数据。

在matplotlib中使用最多的模块就是pyplot，下边用pyplot简单的展示以下训练过程。

1.首先，需要导入pyplot包

import matplotlib.pyplot as plt

2.然后，绘制图像

# 绘制求解的曲线
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.scatter(x_data, y_data)
plt.ion()  #Turn interactive mode on 开启互动模式
plt.show() #Display a figure


#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        try:
            ax.lines.remove(lines[0])
        except Exception:
            pass

        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 计算预测值
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        #print(prediction.shape)
        # 绘制预测值
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)
# 关闭Session
plt.pause(1000)

过程展示：

通过此方法可视化训练过程，可看到曲线渐渐拟合。

最终结果:

完整程序如下：

#encoding:utf-8
#add_layer_1.py 练习增加网络层

#创建神经网络并训练
#功能：拟合 y=x*x+1

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数（默认没有）
    :return:output：数据输出
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

#创建一个具有输入层，隐藏层，输出层的三层神经网络，神经元个数分别为1，10，1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度，原先是（300，）变为（300，1）
noise=np.random.normal(0,0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

# print(x_data.shape)
# x=np.linspace(-1,1,300)
# print(x.shape)

#定义输入数据
xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层
hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)

init=tf.global_variables_initializer()
sess=tf.Session()
sess.run(init)


# 绘制求解的曲线
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.scatter(x_data, y_data)
plt.ion()  #Turn interactive mode on 开启互动模式
plt.show() #Display a figure


#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        try:
            ax.lines.remove(lines[0])  #擦除之前的轨迹
        except Exception:
           pass

        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 计算预测值
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        #print(prediction.shape)
        # 绘制预测值
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)
# 关闭Session
plt.pause(1000)

#关闭sess
sess.close()

4.tensorboard展示神经网络图

神经网络结构的可视化：【tensorflow】Tensorboard的安装及使用，内附详细过程。

训练过程的可视化：

可视化的完整程序如下：

#encoding:utf-8
#add_layer1_view.py 练习网络层可视化

#创建神经网络并训练 #功能：拟合 y=x*x+noise+1
#功能：将add_layer1的图标可视化

import tensorflow as tf
import numpy as np

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    layer_name='layer_name'
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数（默认没有）
    :return:
    """
    with tf.name_scope('layer') :
        with tf.name_scope('Weight'):
            Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
            # Draw histogram: name, variable
            tf.summary.histogram(layer_name + '/weights', Weight)
        with tf.name_scope('biases'):
            biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
            tf.summary.histogram(layer_name + '/biases', biases)
        with tf.name_scope('W_mul_x_plus_b'):
            W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)

        # at histogram
    tf.summary.histogram(layer_name + '/output', output)
    return output

#创建一个具有输入层，隐藏层，输出层的三层神经网络，神经元个数分别为1，10，1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度，原先是（300，）变为（300，1）
noise=np.random.normal(0, 0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出


#定义输入数据
with tf.name_scope('input'):
    xs=tf.placeholder(tf.float32,[None,1],name='x_input')
    ys=tf.placeholder(tf.float32,[None,1],name='y_input')

#定义一个隐藏层
with tf.name_scope('hidden_layer'):
    hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
with tf.name_scope('output_layer'):
    prediction=add_layer(hidden_layer1,10,1,activation_function=None)


#求解神经网络参数
#1.定义损失函数
with tf.name_scope('loss'):
    loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
    # 2.使用tf.scalar_summary来收集想要显示的变量,命名为loss
    tf.summary.scalar('loss', loss)
#2.定义训练过程
with tf.name_scope('train'):
    train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)


init=tf.global_variables_initializer()
sess=tf.Session()

# 3.定义一个summury op, 用来汇总由scalar_summary记录的所有变量
merged_summary_op = tf.summary.merge_all()
# 4.生成一个summary writer对象，需要指定写入路径,例如我这边就是/tmp/logdir
summary_writer = tf.summary.FileWriter('logs_add_layer1/',sess.graph)

#将网络结构图写到文件中
#writer=tf.summary.FileWriter('logs_add_layer1/',sess.graph)
sess.run(init)
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})

    if i%100==0:
        #print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 5.使用sess.run来得到merged_summary_op的返回值
        summary_str = sess.run(merged_summary_op,feed_dict={xs:x_data,ys:y_data})
    # 6.使用summary writer将运行中的loss值写入
    summary_writer.add_summary(summary_str, i)


#关闭sess
sess.close()

------------------------------------------- END -------------------------------------

参考：https://www.jianshu.com/p/e112012a4b2d（一文学会用 Tensorflow 搭建神经网络）

https://blog.csdn.net/mao19931004/article/details/51915016（Matplotlib简单入门学习）

http://www.cnblogs.com/TaylorBoy/p/6802540.html（Tensorboard 可视化之训练过程）

【深度学习】用tensorflow搭建自己的神经网络

猜你喜欢