深度学习之线性回归

线性回归

基本要素

模型
模型训练及其三要素
- 训练数据
- 损失函数（loss function）
  衡量误差的函数，
- 优化算法
  小批量随机梯度下降（mini-batch stochastic gradient descent）：先选取一组模型参数的初始值，然后对参数进行多次迭代，使每次迭代都可能降低损失函数的值，在每次迭代中，先随机均匀采样一个由固定数目训练数据样本组成的小批量（mini-batch）β，然后求小批量中数据样本的平局损失有关模型参数的梯度（导数），最后用此结果与预先设定的一个正数的乘积作为模型参数在此次迭代中的减小量，注：批量大小和学习了的值是人为设定的，并非模型训练学习，因此叫做超参数，我们通常讲的“调参”正是指调节超参数；
模型预测

表示方法

神经网络图
线性回归是一个单层神经网络，输出层中负责计算输出o的单元叫做神经元，o的计算依赖于输入，即输出层中的神经元与输入层中各个输入完全连接，因此输出层又叫做全连接层（fully-connected layer）或稠密层（dense layer）；
矢量计算表达式

线性回归的实现

实现简单步骤：生成数据集 -> 读取数据 -> 定义模型 -> 初始化模型参数 -> 定义损失函数 -> 定义优化算法 -> 训练模型 ;

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2019/1/15 23:04
# @Author  : Cunyu
# @Site    : cunyu1943.github.io
# @File    : chapter3.py
# @Software: PyCharm

""""
线性回归的实现
"""

from IPython import display
from matplotlib import pyplot as plt
from mxnet import autograd, nd
import random

# 生成人工数据集

num_input = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2

features = nd.random.normal(scale=1, shape=(num_examples, num_input))
labels = true_w[0] * features[:,0] + true_w[1] * features[:,1] + true_b
labels += nd.random.normal(scale=0.01, shape=labels.shape)

print(features[0], labels[0])

def use_svg_display():
	# 用矢量图显示
	display.set_matplotlib_formats('svg')

def set_figsize(figsize = (3.5, 2.5)):
	use_svg_display()
	# 设置图的尺寸
	plt.rcParams['figure.figsize'] = figsize

set_figsize()
plt.scatter(features[:,1].asnumpy(), labels.asnumpy(), 1)
plt.show()

# 读取数据
def data_iter(batch_size, features, labels):
	num_examples = len(features)
	indices = list(range(num_examples))
	random.shuffle(indices)
	for i in range(0, num_examples, batch_size):
		j = nd.array(indices[i:min(i+batch_size, num_examples)])
		yield features.take(j), labels.take(j) # take函数根据索引返回对应元素

batch_size = 10
for X, y in data_iter(batch_size, features, labels):
	print(X, y)
	break

# 定义模型
from mxnet.gluon import nn
net = nn.Sequential()   # nn表示neural networks
net.add(nn.Dense(1))    # 定义一个1层的全连接层

# 初始化模型参数
from mxnet import init
net.initialize(init.Normal(sigma=0.01)) # 指定权重参数每个元素将在初始化时随机采样均值为0，标准差为0.01的正态分布

# 定义损失函数
from mxnet.gluon import loss as gloss
loss = gloss.L2Loss()   # 平方损失又称为L2范数损失

# 定义优化算法
from mxnet import gluon
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate':0.03})

# 训练模型
num_epochs = 3
print('批量样本求平均:')
for epoch in range(1, num_epochs + 1):
    for X, y in data_iter(batch_size, features, labels):
        with autograd.record():
            l = loss(net(X), y)
        l.backward()
        trainer.step(batch_size)
    l = loss(net(features), labels)
    print('epoch %d, loss: %f' % (epoch, l.mean().asnumpy()))
dense = net[0]
print('权重：\n', true_w, dense.weight.data())
print('偏差：\n', true_b, dense.bias.data())

深度学习之线性回归

线性回归

基本要素

表示方法

线性回归的实现

猜你喜欢