Numpy: la dimensión de los datos


dimensión de los datos

Las matrices Numpy multidimensionales también se pueden llamar tensores. Todos los sistemas de aprendizaje automático actuales utilizan tensores como estructura de datos básica. Un tensor es un contenedor de datos, y los datos que contiene son casi numéricos, por lo que también es un contenedor de números. Todos estamos familiarizados con las matrices, que son arreglos bidimensionales (tensores bidimensionales). Un tensor es una generalización de una matriz a cualquier dimensión. La dimensión de un tensor a menudo se llama eje.

Las dimensiones de los datos se muestran en la figura:
inserte la descripción de la imagen aquí

1. Escalar (tensor 0D)

Un tensor que contiene solo un número se llama escalar (también llamado tensor escalar, tensor de dimensión cero o tensor 0D). En Numpy, un número float32 o float64 es un tensor escalar (o una matriz de escalares). No hay tensores 0D en la imagen de arriba.

>>> import numpy as np
>>> a = np.array(12)
>>> a
array(12)
>>> a.ndim
0

2. Vector (matriz unidimensional, tensor 1d)

Una matriz de números se denomina vector o tensor unidimensional (tensor 1D). Un tensor 1D tiene un solo eje.

>>> import numpy as np
>>> a = np.array([12,3,5,7])
>>> a
array([12,3,5,7])
>>> a.ndim # 数组维度(维数、轴数、秩)
1

3. Array bidimensional (2d-tensor)

Una matriz de vectores se denomina matriz bidimensional (tensor 2D). Hay 2 ejes (a menudo llamados fila y columna).

>>> import numpy as np
>>> a = np.array([[12,3,5,7],[11,2,4,6],[10,8,6,7]])
>>> a
array([[12,  3,  5,  7],
       [11,  2,  4,  6],
       [10,  8,  6,  7]])
>>> a.ndim # 数组维度(维数、轴数、秩)
2

Los elementos del primer eje se denominan filas y los elementos del segundo eje se denominan columnas.

4. Matriz tridimensional (3d-tensor)

Al combinar varias matrices bidimensionales en una nueva matriz, puede obtener una matriz tridimensional y su valor puede entenderse como un cubo compuesto de números.

>>> import numpy as np
>>> a = np.arange(1,28).reshape(3,3,3)
>>> a
array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]],

       [[19, 20, 21],
        [22, 23, 24],
        [25, 26, 27]]])

La forma de los datos tridimensionales se muestra en la figura: los
inserte la descripción de la imagen aquí
datos de series temporales o datos de secuencia, y los datos de imágenes son matrices tridimensionales. Una imagen generalmente tiene tres dimensiones: alto, ancho y profundidad de color. Las imágenes en escala de grises tienen un solo canal de color y se pueden guardar en dos dimensiones. Pero por convención, los tensores de imagen son siempre tensores 3D, como se muestra en la figura:
inserte la descripción de la imagen aquí
un color constituye una matriz bidimensional (2d-tensor), tres colores (RBG) tres matrices bidimensionales constituyen una matriz tridimensional (3d-tensor). tensor) ), formando una imagen en color.
La combinación de múltiples tensores 3D crea un tensor 4D. Como se muestra en la figura, las imágenes de múltiples colores forman una matriz de cuatro dimensiones (tensor 4d):
inserte la descripción de la imagen aquí
y así sucesivamente, el aprendizaje profundo generalmente procesa tensores que van desde 0D a 4D, pero el procesamiento de datos de video también puede encontrar tensores 5D.

Supongo que te gusta

Origin blog.csdn.net/shield911/article/details/124073579
Recomendado
Clasificación