¡Acostúmbrate a escribir juntos! Este es el quinto día de mi participación en el "Nuevo plan diario de Nuggets · Desafío de actualización de abril", haga clic para ver los detalles del evento .
Pandas es una biblioteca de análisis de datos de Python diseñada e implementada en base a NumPy. Pandas proporciona una gran cantidad de funciones y métodos que nos permiten procesar datos de manera eficiente. También incluye muchas bibliotecas de procesamiento de datos y algunos modelos de datos, que se puede decir que son muy poderoso.
Se puede instalar con el siguiente comando:
conda install pandas
# 或
pip install pandas
复制代码
Estructura de datos de la serie
Hay dos estructuras de datos más utilizadas en Pandas: Series y DataFrame.Este artículo presenta principalmente Series y cómo crear objetos Series.
La serie es una matriz unidimensional que consta de una columna de índices y una columna de valores. Los índices y los valores están en correspondencia uno a uno y pueden almacenar diferentes tipos de tipos de datos, como cadenas, booleanos, números , objetos Python, etc.
Crear un objeto Serie
El formato para crear un objeto Serie es el siguiente:
s = pd.Series(data, index)
复制代码
Los datos del parámetro son datos, que pueden ser un diccionario, una lista, una matriz Numpy ndarray, etc., el índice del
parámetro es un índice y el valor debe ser único, similar a la clave de un diccionario de Python, que se puede omitir. predeterminado es un número entero que aumenta desde 0.
- Crear a partir de la lista:
data = ["a", "b", "c", "d", "e"]
s = pd.Series(data)
s
复制代码
- Crear desde el diccionario:
Cuando los datos son un diccionario, si no se pasa ningún índice, el índice se construirá de acuerdo con las claves del diccionario, y el valor correspondiente al índice es el valor correspondiente a la clave del diccionario.
data = {"a": 1, "b": 2, "c": 3}
s = pd.Series(data)
s
复制代码
La salida resultante es la siguiente:
a 1
b 2
c 3
dtype: int64
复制代码
- Crear a partir de una matriz ndarray:
ndarray es un tipo de matriz de Numpy. El uso simple de Numpy en el análisis de datos de Python se presentó en el artículo anterior.
data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s
复制代码
Podemos procesar y analizar los datos llamando a las propiedades y métodos correspondientes a través del objeto Serie creado, que se presentará en el próximo artículo.
No es fácil ser original. Si les resulta útil, por favor denle a Me gusta y listo~
Finalmente, me gustaría agradecer a mi novia por su tolerancia, comprensión y apoyo en el trabajo y en la vida.