Objeto de la serie Pandas para el análisis de datos de Python

¡Acostúmbrate a escribir juntos! Este es el quinto día de mi participación en el "Nuevo plan diario de Nuggets · Desafío de actualización de abril", haga clic para ver los detalles del evento .

Pandas es una biblioteca de análisis de datos de Python diseñada e implementada en base a NumPy. Pandas proporciona una gran cantidad de funciones y métodos que nos permiten procesar datos de manera eficiente. También incluye muchas bibliotecas de procesamiento de datos y algunos modelos de datos, que se puede decir que son muy poderoso.

Se puede instalar con el siguiente comando:

conda install pandas
#
pip install pandas
复制代码

Estructura de datos de la serie

Hay dos estructuras de datos más utilizadas en Pandas: Series y DataFrame.Este artículo presenta principalmente Series y cómo crear objetos Series.

La serie es una matriz unidimensional que consta de una columna de índices y una columna de valores. Los índices y los valores están en correspondencia uno a uno y pueden almacenar diferentes tipos de tipos de datos, como cadenas, booleanos, números , objetos Python, etc.

Crear un objeto Serie

El formato para crear un objeto Serie es el siguiente:

s = pd.Series(data, index)
复制代码

Los datos del parámetro son datos, que pueden ser un diccionario, una lista, una matriz Numpy ndarray, etc., el índice del
parámetro es un índice y el valor debe ser único, similar a la clave de un diccionario de Python, que se puede omitir. predeterminado es un número entero que aumenta desde 0.

  • Crear a partir de la lista:
data = ["a", "b", "c", "d", "e"]
s = pd.Series(data)
s
复制代码
  • Crear desde el diccionario:

Cuando los datos son un diccionario, si no se pasa ningún índice, el índice se construirá de acuerdo con las claves del diccionario, y el valor correspondiente al índice es el valor correspondiente a la clave del diccionario.

data = {"a": 1, "b": 2, "c": 3}
s = pd.Series(data)
s
复制代码

La salida resultante es la siguiente:

a    1
b    2
c    3
dtype: int64
复制代码
  • Crear a partir de una matriz ndarray:

ndarray es un tipo de matriz de Numpy. El uso simple de Numpy en el análisis de datos de Python se presentó en el artículo anterior.

data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s
复制代码

Podemos procesar y analizar los datos llamando a las propiedades y métodos correspondientes a través del objeto Serie creado, que se presentará en el próximo artículo.

No es fácil ser original. Si les resulta útil, por favor denle a Me gusta y listo~

Finalmente, me gustaría agradecer a mi novia por su tolerancia, comprensión y apoyo en el trabajo y en la vida.

Supongo que te gusta

Origin juejin.im/post/7084925907307069447
Recomendado
Clasificación