【深度学习】用tensorflow搭建自己的神经网络

【深度学习】用tensorflow搭建自己的神经网络

1.创建一个神经网络层

2.运用神经网络层搭建完整神经网络

3.显示训练过程

4.tensorboard展示神经网络图


  之前已经讲过了神经网络的基本知识:【机器学习】神经网络介绍  和 【深度学习】卷积神经网络入门

  本节用tensorflow来搭建一个神经网络,实现y=x*x+1的拟合。

1.创建一个神经网络层

   在之前的学习中,了解到一个完整的神经网络,包括输入层、卷积层、池化层、全连接层等部分。在tensorflow中,也已经有了专门的卷积层函数,例如:tf.nn.conv2d(卷积)、tf.nn.max_pool(池化)等。

   那如果想学习自己搭建一个神经网络层,需要包含哪些部分呢?

   如下图所示,一个神经网络层需要有数据输入、数据输出、激活函数

            

 创建一个神经网络层

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小(前一层神经元个数)
    :param out_size: 输出大小(本层神经元个数)
    :param activation_function: 激活函数(默认没有)
    :return:
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

分析:

    参数如下,

        input:输入个数

        in_size: 当前层的输入的个数

        out_size:当前层的输出的个数(即当前层神经元的个数)

        activation_function:激活函数(输入层无激活函数,仅起到传递信号的作用,卷积层、池化层等含有激活函数。)

    内部运算如下:

        权值初始化(Weight):大小为 in_size * out_size;

         偏置初始化(biases):大小为out_size(即本层神经元的个数)

        卷积和运算:W_mul_x_plus_b=tf.matmul(input,Weight) + biases

        输出为(output):activation_function(W_mul_x_plus_b),若无激活函数则为 output=W_mul_x_plus_b。

2.运用神经网络层搭建完整神经网络

一个完整的神经网络,需要有输入层(输入数据)、隐藏层(功能层)、输出层(输出结果)、损失函数、参数求取(梯度下降法)等。

#准备训练所需的数据

x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度,原先是(300,)变为(300,1)
noise=np.random.normal(0,0.05,x_data.shape)  #噪声
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

#定义数据格式(占位符,便于下边训练)

xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层,含有10个神经元

hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)

#定义一个输出层,含有1个神经元

prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#定义训练过程并进行训练

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss) #梯度下降法使误差最小,学习率为0.1

init=tf.global_variables_initializer() #变量初始化
sess=tf.Session()
sess.run(init) #执行初始化
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data}) #训练
    if i%100==0:
        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  ) #输出当前loss

#关闭sess
sess.close()

---------------------------------------------  完整程序如下:---------------------------------------------------

#encoding:utf-8
#add_layer_1.py 练习增加网络层

#创建神经网络并训练
#功能:拟合 y=x*x+1

import tensorflow as tf
import numpy as np

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数(默认没有)
    :return:output:数据输出
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

#创建一个具有输入层,隐藏层,输出层的三层神经网络,神经元个数分别为1,10,1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度,原先是(300,)变为(300,1)
noise=np.random.normal(0,0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

# print(x_data.shape)
# x=np.linspace(-1,1,300)
# print(x.shape)

#定义输入数据
xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层
hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)

init=tf.global_variables_initializer()
sess=tf.Session()
sess.run(init)
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )

#关闭sess
sess.close()
运行结果:

                       

    发现随着训练次数的增加,loss越来越小。

3.显示训练过程

    matplotlib在Python中应用最多的2D图像的绘图工具包,使用matplotlib能够非常简单的可视化数据。

    在matplotlib中使用最多的模块就是pyplot,下边用pyplot简单的展示以下训练过程。

    1.首先,需要导入pyplot包

import matplotlib.pyplot as plt

    2.然后,绘制图像

# 绘制求解的曲线
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.scatter(x_data, y_data)
plt.ion()  #Turn interactive mode on 开启互动模式
plt.show() #Display a figure


#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        try:
            ax.lines.remove(lines[0])
        except Exception:
            pass

        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 计算预测值
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        #print(prediction.shape)
        # 绘制预测值
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)
# 关闭Session
plt.pause(1000)

过程展示:


    通过此方法可视化训练过程,可看到曲线渐渐拟合。

最终结果:

                


整程序如下:

#encoding:utf-8
#add_layer_1.py 练习增加网络层

#创建神经网络并训练
#功能:拟合 y=x*x+1

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数(默认没有)
    :return:output:数据输出
    """
    Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
    biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
    W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)
    return output

#创建一个具有输入层,隐藏层,输出层的三层神经网络,神经元个数分别为1,10,1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度,原先是(300,)变为(300,1)
noise=np.random.normal(0,0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出

# print(x_data.shape)
# x=np.linspace(-1,1,300)
# print(x.shape)

#定义输入数据
xs=tf.placeholder(tf.float32,[None,1])
ys=tf.placeholder(tf.float32,[None,1])

#定义一个隐藏层
hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
prediction=add_layer(hidden_layer1,10,1,activation_function=None)

#求解神经网络参数
#1.定义损失函数
loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
#2.定义训练过程
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)

init=tf.global_variables_initializer()
sess=tf.Session()
sess.run(init)


# 绘制求解的曲线
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.scatter(x_data, y_data)
plt.ion()  #Turn interactive mode on 开启互动模式
plt.show() #Display a figure


#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})
    if i%100==0:
        try:
            ax.lines.remove(lines[0])  #擦除之前的轨迹
        except Exception:
           pass

        print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 计算预测值
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        #print(prediction.shape)
        # 绘制预测值
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)
# 关闭Session
plt.pause(1000)

#关闭sess
sess.close()

4.tensorboard展示神经网络图

神经网络结构的可视化:【tensorflow】Tensorboard的安装及使用,内附详细过程。              

      

    训练过程的可视化:




可视化的完整程序如下:

#encoding:utf-8
#add_layer1_view.py 练习网络层可视化

#创建神经网络并训练 #功能:拟合 y=x*x+noise+1
#功能:将add_layer1的图标可视化

import tensorflow as tf
import numpy as np

#创建一个神经网络层
def add_layer(input,in_size,out_size,activation_function=None):
    layer_name='layer_name'
    """
    :param input: 数据输入
    :param in_size: 输入大小
    :param out_size: 输出大小
    :param activation_function: 激活函数(默认没有)
    :return:
    """
    with tf.name_scope('layer') :
        with tf.name_scope('Weight'):
            Weight=tf.Variable(tf.random_normal([in_size,out_size]) )
            # Draw histogram: name, variable
            tf.summary.histogram(layer_name + '/weights', Weight)
        with tf.name_scope('biases'):
            biases=tf.Variable(tf.zeros([1,out_size]) +0.1 )
            tf.summary.histogram(layer_name + '/biases', biases)
        with tf.name_scope('W_mul_x_plus_b'):
            W_mul_x_plus_b=tf.matmul(input,Weight) + biases
    #根据是否有激活函数
    if activation_function == None:
        output=W_mul_x_plus_b
    else:
        output=activation_function(W_mul_x_plus_b)

        # at histogram
    tf.summary.histogram(layer_name + '/output', output)
    return output

#创建一个具有输入层,隐藏层,输出层的三层神经网络,神经元个数分别为1,10,1
x_data=np.linspace(-1,1,300)[:,np.newaxis]   # 创建输入数据  np.newaxis分别是在列(第二维)上增加维度,原先是(300,)变为(300,1)
noise=np.random.normal(0, 0.05,x_data.shape)
y_data=np.square(x_data)+1+noise    # 创建输入数据对应的输出


#定义输入数据
with tf.name_scope('input'):
    xs=tf.placeholder(tf.float32,[None,1],name='x_input')
    ys=tf.placeholder(tf.float32,[None,1],name='y_input')

#定义一个隐藏层
with tf.name_scope('hidden_layer'):
    hidden_layer1=add_layer(xs,1,10,activation_function=tf.nn.relu)
#定义一个输出层
with tf.name_scope('output_layer'):
    prediction=add_layer(hidden_layer1,10,1,activation_function=None)


#求解神经网络参数
#1.定义损失函数
with tf.name_scope('loss'):
    loss=tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction) ,reduction_indices=[1] ))
    # 2.使用tf.scalar_summary来收集想要显示的变量,命名为loss
    tf.summary.scalar('loss', loss)
#2.定义训练过程
with tf.name_scope('train'):
    train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)


init=tf.global_variables_initializer()
sess=tf.Session()

# 3.定义一个summury op, 用来汇总由scalar_summary记录的所有变量
merged_summary_op = tf.summary.merge_all()
# 4.生成一个summary writer对象,需要指定写入路径,例如我这边就是/tmp/logdir
summary_writer = tf.summary.FileWriter('logs_add_layer1/',sess.graph)

#将网络结构图写到文件中
#writer=tf.summary.FileWriter('logs_add_layer1/',sess.graph)
sess.run(init)
#3.进行训练
for i in range(1000):
    sess.run(train_step,feed_dict={xs:x_data,ys:y_data})

    if i%100==0:
        #print(sess.run(loss,feed_dict={xs:x_data,ys:y_data} )  )
        # 5.使用sess.run来得到merged_summary_op的返回值
        summary_str = sess.run(merged_summary_op,feed_dict={xs:x_data,ys:y_data})
    # 6.使用summary writer将运行中的loss值写入
    summary_writer.add_summary(summary_str, i)


#关闭sess
sess.close()

   -------------------------------------------         END      -------------------------------------

参考:https://www.jianshu.com/p/e112012a4b2d(一文学会用 Tensorflow 搭建神经网络

          https://blog.csdn.net/mao19931004/article/details/51915016(Matplotlib简单入门学习)

                http://www.cnblogs.com/TaylorBoy/p/6802540.html(Tensorboard 可视化之训练过程



猜你喜欢

转载自blog.csdn.net/u012679707/article/details/80485261