Introducción a los conceptos básicos de Python NumPy

1. Introducción a NumPy


  • NumPy es un paquete básico para análisis de datos y computación científica de alto rendimiento. Es la base de varias otras herramientas como los pandas.
  • Funciones principales de NumPy:
    • ndarray, una estructura de datos multidimensional que es eficiente y ahorra espacio
    • Funciones matemáticas que realizan operaciones rápidas en un conjunto completo de datos sin bucles
    • Funciones de álgebra lineal, generación de números aleatorios y transformada de Fourier
  • Método de instalación: pip install numpy

2. Primera experiencia


1. Caso 1

Dada la capitalización de mercado (USD) de varias empresas multinacionales, conviértala en moneda adulta.

import numpy as np
import random

a = [random.uniform(100.0, 200.0) for i in range(3)]
print(a)
b = np.array(a)
c = b * 6.8
print(c, c[1])

resultado:

[129.70799881689956, 115.85222551317838, 161.37833819727018]
[ 882.01439195  787.79513349 1097.37269974] 787.795133489613

2. Caso 2

Dado el precio y la cantidad de artículos en el carrito de compras, encuentre el monto total

import numpy as np
import random

a = [random.uniform(10.0, 20.0) for i in range(3)]  # 金额
a = np.array(a)
print(a)
b = [random.randint(1, 10) for i in range(3)]  # 件数
b = np.array(b)
print(b)
print(a * b, (a*b).sum())

resultado:

[18.21776421 13.63878433 13.37232689]
[9 3 7]
[163.95987791  40.916353    93.60628826] 298.48251916984424

3. ndarray (objeto de matriz multidimensional)


1. Introducción

  • Crear ndarray: np.array(array_like)
  • La diferencia entre matrices y listas:
    • Los tipos de elementos dentro de los objetos de matriz deben ser los mismos
    • El tamaño de la matriz no se puede modificar

2. Atributos comunes

Insertar descripción de la imagen aquí

import numpy as np

a = np.array([1, 2, 3, 4, 5])
print(a)
b = np.array(range(10))
print(b)
print(b.size, b.ndim, b.shape, b.dtype)
print('------------------\n')
c = np.array([[1, 2, 3], [4, 5, 6]])
print(c)
print(c.T, c.size, c.ndim, c.shape, c.dtype)

resultado:

[1 2 3 4 5]
[0 1 2 3 4 5 6 7 8 9]
10 1 (10,) int64
------------------

[[1 2 3]
 [4 5 6]]
[[1 4]
 [2 5]
 [3 6]] 6 2 (2, 3) int64

3. tipo de datos

Insertar descripción de la imagen aquí

4. creación numerosa

Insertar descripción de la imagen aquí

import numpy as np

print(np.array([0] * 10))
print(np.zeros(10), np.zeros(10, dtype='int'), np.ones(10))  # 默认float64
print("empty: ", np.empty(3))
print("arange: ", np.arange(1, 5), np.arange(1, 5, 0.3))
print("linspace: ", np.linspace(0, 3, 4))
print("eye:\n", np.eye(5))

resultado:

[0 0 0 0 0 0 0 0 0 0]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.] [0 0 0 0 0 0 0 0 0 0] [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
empty:  [6.94190175e-310 6.94190175e-310 1.28822032e-057]
arange:  [1 2 3 4] [1.  1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4.  4.3 4.6 4.9]
linspace:  [0. 1. 2. 3.]
eye:
 [[1. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 1.]]

Cinco, operación por lotes ndarray

(1) Matrices y escalares
import numpy as np

a = np.arange(1, 5)
print(a)
print(a + 1, a * 3, 1 // a, a ** 2, a > 2)

resultado:

[1 2 3 4]
[2 3 4 5] [ 3  6  9 12] [1 0 0 0] [ 1  4  9 16] [False False  True  True]
(2) Matrices y matrices del mismo tamaño.
import numpy as np

a = np.arange(1, 5)
b = np.arange(4, 8)
print(a, b)
print(a + b, b / a, b ** a, b % a, a == b)

resultado:

[1 2 3 4] [4 5 6 7]
[ 5  7  9 11] [4.   2.5  2.   1.75] [   4   25  216 2401] [0 1 0 3] [False False False False]

4. Indexación y corte


1. índice de matriz estándar

import numpy as np

a = np.arange(1, 5)
print(a, a[0])
b = np.arange(1, 7).reshape((2, 3))
print(b, b[0][0], b[0, 0])

resultado:

[1 2 3 4] 1
[[1 2 3]
 [4 5 6]] 1 1

2. rebanada ndarray

注意: el segmento de matriz no copia objetos

import numpy as np

a = np.arange(1, 5)
print(a, a[0:2], a[:2], a[2:])
print('--------------------')
b = [1, 2, 3, 4]
c = a[:2]  # 如果不想修改a[:2].copy()
d = b[:2]
c[0] = 10
d[0] = 10
print(a, b)
print('--------------------')
e = np.arange(1, 7).reshape((2, 3))
print(e)
print(e[0:2, 0:2])

resultado:

[1 2 3 4] [1 2] [1 2] [3 4]
--------------------
[10  2  3  4] [1, 2, 3, 4]
--------------------
[[1 2 3]
 [4 5 6]]
[[1 2]
 [4 5]]

5. índice booleano


import numpy as np

a = np.arange(1, 5)
print(a, a[a > 2], a > 2)
# 取出偶数
print(a[a % 2 == 0], a[(a > 1) & (a % 2 == 0)])
print(a[(a > 3) | (a % 2 == 0)])   # 或

resultado:

[1 2 3 4] [3 4] [False False  True  True]
[2 4] [2 4]
[2 4]

6. Índice de fantasía


import numpy as np

a = np.arange(20, 40)
print(a)
print(a[[1, 4, 5, 6]])
print("----------------")
b = np.arange(20, 40).reshape(4, 5)
print(b)
print(b[0, 2:4], b[0, b[0] > 22])

# 特殊取法
print("----------------")
print(b[[1, 3], :][:, [1, 3]])

resultado:

[20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39]
[21 24 25 26]
----------------
[[20 21 22 23 24]
 [25 26 27 28 29]
 [30 31 32 33 34]
 [35 36 37 38 39]]
[22 23] [23 24]
----------------
[[26 28]
 [36 38]] [[26 28]
 [36 38]]

7. Funciones generales


1. Introducción

  • Función universal: una función que puede operar en todos los elementos de una matriz al mismo tiempo

  • Funciones generales comunes:

    • Funciones unarias: abs, sqrt, exp, log, ceil, floor, rint, trunc, modf, isnan, isinf, cos, sin, tan
    • Funciones binarias: sumar, sbustract, multiplicar, dividir, potencia, mod, máximo, mínimo
  • Reponer:

    • nan(No es un número): No es igual a ningún número de punto flotante (nan!= nan)
    • inf (infinito): mayor que cualquier número de punto flotante
    • Crea valores especiales en NumPy: np.nan np.inf
    • En el análisis de datos, nan se utiliza a menudo para representar valores de datos faltantes.

2. Caso

import numpy as np

a = np.arange(-2.5, 2.5)
b = np.array([4, 16])
print(a, abs(a), np.abs(a), np.sqrt(b))

# floor: 往小取整 ceil: 往大取整 round,rint: 四舍五入 trunc: 去掉小数位
print(np.floor(a), np.ceil(a), np.round(a), np.trunc(a))

# modf: 整数和小数分开
print(np.modf(a))

resultado:

[-2.5 -1.5 -0.5  0.5  1.5] [2.5 1.5 0.5 0.5 1.5] [2.5 1.5 0.5 0.5 1.5] [2. 4.]
[-3. -2. -1.  0.  1.] [-2. -1. -0.  1.  2.] [-2. -2. -0.  0.  2.] [-2. -1. -0.  0.  1.]
(array([-0.5, -0.5, -0.5,  0.5,  0.5]), array([-2., -1., -0.,  0.,  1.]))

8. Métodos estadísticos


1. Introducción

sum  求和            min 求最小值
mean 求平均数         max 求最大值
std  求标准差         argmin 求最小值索引
var  求平方差         argmax 求最大值索引

2. Caso

import numpy as np

a = np.array([4, 3, 5, 6])
print(a.sum(), a.mean(), a.std(), a.var())
print(a.min(), a.max(), a.argmin(), a.argmax())

resultado:

18 4.5 1.118033988749895 1.25
3 6 1 3

9. Generación de números aleatorios


1. Introducción

rand        给定形状产生随机数组(0到1之间的数)
randint     给定形状产生随机整数
choice      给定形状产生随机选择
shuffle     与random.shutffle相同,打乱
uniform     给定形状产生随机数组

2. Caso

import numpy as np

a = np.array([4, 3, 5, 6])
print(np.random.rand(2))
print(np.random.randint(2, 5))
print(np.random.choice([1, 2, 3], 3))
li = [4, 2, 5, 1]
np.random.shuffle(li)
print(li)
print(np.random.uniform(2.0, 4.0, 3))

resultado:

[0.72368355 0.55070405]
2
[2 3 1]
[2, 4, 1, 5]
[3.08668595 2.13194105 2.28684747]

Supongo que te gusta

Origin blog.csdn.net/Dream_ya/article/details/123794305
Recomendado
Clasificación