pytorch第二弹

标签（空格分隔）： pytorch 深度学习

pytorch中的numpy

深度学习是以矩阵为基础的，里面的前向传播都是用矩阵进行计算的，所以在深度学习框架里面需要大量的矩阵操作以及定义。学过python的都知道，在python里面有一个科学工具包numpy是专门来操作矩阵的，在pytroch里面也有类似的操作，pytorch里面使用Tensor代替numpy。numpy能做的事情，Tensor都能完成，并且二者可以互相转换，非常方便。

Tensor定义

x = torch.Tensor(5,3)
print(x.size())

Tensor的定义非常简单，并且和numpy很多地方类似，比如上面的操作语句就定义了一个5行3列的矩阵。你可以通过.size()来看矩阵的形状。

Tensor四则运算

x = torch.Tensor(5,3)
y = torch.rand(5,3)
print(x+y)
print(torch.add(x,y))
result = torch.Tensor(5,3)
print(torch.add(x,y,out = result)) # 结果在result里面
print(result)

注意四则运算时矩阵的形状非常重要，比如进行加法操作的时候，两个矩阵要大小一致，进行乘法要内标相同。

四则运算可以直接使用操作符+ -,也可以使用一些函数add mm等。在用函数的时候加了out参数，则运算结果会存储到out里面。

除了add mm这种类型的函数之外，还有add_下面带下划线的，他们功能时一样的，只是add_会把结果覆盖原来的：

y.add_(x)

则y的值会被修改。

与numpy转换

其实Tensor里面的数据本质还是一个numpy，只是在上面进行了一些封装，为了方便torch框架识别。

把一个Tensor转为numpy通过下面的方法：

y = x.numpy()

把一个numpy转为Tensor可以通过下面的方法：

x = torch.from_numpy(y)

Variable

这里只会简单介绍一下Variable，因为Variable是和自动微分结合在一起的，自动微分也就是自动求导，在之前讲过，这些深度学习框架的主要厉害之处就在于能过自动帮你进行反向传播，而反向传播的基础就是自动微分。

Variable本质是把一个Tensor进行了封装，只是具备了能够微分的属性，所以可能在数值上看不出来差异。

from torch.autograd import Variable
x = Variable(torch.ones(2,2),requires_grad = True)
print(x)
y = 4* x.sum()
print(y.grad_fn)
r = x.sum()
print(r.grad_fn)