[Comprensión profunda de PyTorch] Derivación automática de PyTorch: cálculo de gradiente de tensor, retropropagación y uso de optimizadores
Derivación automática de PyTorch: cálculo de gradiente de tensor, retropropagación y uso de optimizador
PyTorch es un marco de aprendizaje profundo de código abierto que proporciona un poderoso mecanismo de derivación automática que nos permite calcular fácilmente el gradiente de tensores, realizar retropropagación y usar optimizadores para actualizar los parámetros del modelo. En este artículo, explicaremos en detalle el mecanismo de derivación automática de PyTorch y los conceptos relacionados.
Cálculo de gradiente de tensores
En PyTorch, el tensor es la unidad básica de almacenamiento y transformación de datos. Cada tensor tiene un requires_grad
atributo que indica si es necesario calcular los gradientes. De forma predeterminada, esta propiedad es falsa, es decir, no se calculan gradientes. Podemos requires_grad=True
habilitar el cálculo de gradiente configurando.
import torch
x = torch.tensor(