TensorFlow深度学习入门笔记（二）基本概念与代码1

关注公众号“从机器学习到深度学习那些事”获取更多最新资料

写在前面

学习建议：以下学习过程中有不理解可以简单查找下资料，但不必纠结（比如非得深究某一个函数等），尽量快速的学一遍，不求甚解无妨。因为有些知识现在陌生，可能学到后面就发现之前的问题都很自然的理解与会用了。多实操代码，不能只复制代码，或者感觉懂了就只看。熟能生巧，我亦无他，唯手熟尔

计算模型：计算图

计算图是TensorFlow中最基本的一个概念，TensorFlow中所有的计算都会被转化为计算图上的节点。TensorFlow名字中的tensor即张量，可以理解为多维数组。tensor表明了TensorFlow的数据结构，即它处理的都是一个个tensor，flow-流体现的是TensorFlow的计算模型。张量这定义的模型中流动，转化成不同的tensor，最终完成任务。

TensorFlow也是一种懒操作，即先画图，并没有真正的开始计算，只是定义了各个计算节点，定义了计算逻辑，只有最终调用run()时才会真正开始计算，有点像scala的模式。TensorFlow中的每一个计算都是计算图中的一个节点，而节点之间的边描述了计算之间的依赖关系（计算逻辑）。

具体的计算网络结构，可以通过TensorFlow中专门的可视化工具TensorBoard画出来。TensorBoard后面会专门讲。

TensorFlow程序分为两个阶段，一是定义计算（图的形成），二是执行计算（run）

先看一段代码，我尽量把注释写满点，开始接触不懂没关系，先跟着套路走，本地跑下代码

代码可以左右滑动哦

import tensorflow as tf # 几乎默认这种，咱也不免俗

a = tf.constant([1.0,2.0]) # 定义一个变量a，并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ，并初始化
add = a + b # 定义计算 (这时并没有真正计算，只是定义了计算图逻辑)
print(add) # 打印出 add 从结果看（输出  Tensor("add:0", shape=(2,), dtype=float32)），这也只是一种定义没有真正计算出a+b的结果，
# 三个节点 a , b , add 。注意这里没有显式的指定计算图(tf.Graph),则会通过tf.get_default_graph()获取默认的计算图

print(a.graph is tf.get_default_graph())
# 输出 True
# 补充：初学时总是混淆这两个函数tf.multiply()与tf.matmul()，在这里记录下
# tensoflow 中tf.multiply(a,b)与tf.matmul(c,d)比较
a = tf.constant([1.0,2.0]) # 定义一个变量a，并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ，并初始化

c = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3])
d = tf.constant([7, 8, 9, 10, 11, 12], shape=[3, 2]) # 定义一个变量d ，并初始化
product1 = tf.multiply(a,b) # 对应位置相乘
product2 = tf.matmul(c,d) # 矩阵的乘法，得到的结果是一个矩阵，行乘列作为对应位置的元素

with tf.Session() as sess:
   print(sess.run(product1))
   print(sess.run(product2))

再来一段在不同计算图中的例子

# 下面定义不同的计算图，并执行计算
import tensorflow as tf

g1 = tf.Graph()
with g1.as_default():
   # 在计算图g1中定义变量v，并初始化为0
   v = tf.get_variable('v', shape=[1], initializer=tf.zeros_initializer())
   # # 初始化为常数
   # v = tf.get_variable('v',initializer=tf.constant([2.0,3.1]))

g2 = tf.Graph()
with g2.as_default():
   # 在计算图g2中定义变量v，并初始化为1
   v = tf.get_variable('v', shape=[1], initializer=tf.ones_initializer())

# 在计算图g1 中读取变量 'v'的值，输出
with tf.Session(graph=g1) as sess:  # 这种也几乎是默认，参考官网
   # TensorFlow中，run之前需要先初始化
   tf.global_variables_initializer().run()
   with tf.variable_scope('',reuse=True):
       # 根据计算图g1初始化的值输出
       print(sess.run(tf.get_variable('v')))
       # tf.get_variable('v') 获取变量，因前面指定了计算图g1，这里会到g1中获取

# 在计算图g2 中读取变量 'v'的值，输出
with tf.Session(graph=g2) as sess:
   # 初始化
   tf.global_variables_initializer().run()
   with tf.variable_scope('',reuse=True):
       # 根据计算图g2初始化的值输出，这行会输出[1.]
       print(sess.run(tf.get_variable('v')))

数据模型：张量

张量是TensorFlow中管理数据的形式。在TensorFlow程序中，所有的数据都是通过张量的形式来表示。

零阶张量表示标量(scalar),也就是一个数

一阶张量为向量(vector),也就是一个一维数组

第n阶张量可以理解为一个n 维数组

注意在TensorFlow中张量只是对运算结果的引用，不是直接采用数组的形式，在张量中没有真正的保存数字，它保存的是如何得到这些数字的计算过程

import tensorflow as tf # 几乎默认这种

a = tf.constant([1.0,2.0]) # 定义一个变量a，并初始化
b = tf.constant([3.0,4.0]) # 定义一个变量b ，并初始化
add = a + b # 定义计算 (这时并没有真正计算，只是定义了计算图逻辑)
print(add) 
# 输出为 Tensor("add:0", shape=(2,), dtype=float32)

看这个输出：Tensor(“add:0”, shape=(2,), dtype=float32)

可以看出 add 在TensorFlow中是一个Tensor, 在TensorFlow计算的结果不是一个具体的数字，而是一个张量(Tensor)。一个Tensor中主要保存了3个属性: name,shape,type,（名字、维度结构、类型）

属性name是一个张量的唯一标识符（有重复会报异常），也给出了这个张量是如何计算出来的

其中add:0 说明了add这个张量是计算节点’add’输出的第一个结果(编号从0开始)

属性shape描述了张量的维度信息。shape=(2,)说明张量add是一个一维数组，数组的长度是2

属性type，是指张量的类型，每一个张量会有一个唯一的类型。类型不匹配时会报错

# 使用张量记录中间结果
a = tf.constant([1.0,2.0],name='a') # 定义一个变量a，并初始化
b = tf.constant([3.0,4.0],name='b') # 定义一个变量b ，并初始化
result = a + b 
# 直接计算向量的和，这样可读性会比较差
result = tf.constant([1.0,2.0],name='a') + tf.constant([3.0,4.0],name='b')

好吧，今天就先介绍这两个概念了，本来还准备了会话、变量、常量这些概念，再写就篇幅太长了点。索性就写短点吧，尽量发的勤快点，小步快跑~

最后，有问题欢迎沟通交流

参考资料

TensorFlow官网

实战Google深度学习框架

TensorFlow深度学习入门笔记（二）基本概念与代码1

猜你喜欢