Directorio de artículos
Introducción a los pandas
Pandas es un conjunto de herramientas
para analizar datos estructurados en Python. La base es numpy: operaciones matriciales de alto rendimiento. La
biblioteca de gráficos matplotlib: proporciona visualización de datos.
herramientas ipython
Abrir usando la línea de comando
Estructura de datos del núcleo de Pandas
Creación de series
La serie es una matriz etiquetada unidimensional. Cualquier dato (entero, punto flotante, cadena, objeto Python) se puede colocar en la matriz. El
formato básico:
s = pd.Series (datos, índice = índice)
donde índice es una lista , Se utiliza como etiqueta para los datos. los datos pueden ser de diferentes tipos de datos: diccionario de Python, objeto ndarray, un valor escalar.
La naturaleza de los objetos Series: objetos tipo
ndarray, objetos tipo dict, operaciones de alineación de etiquetas.
Creación de DataFrame
DataFrame es una matriz bidimensional con etiquetas de fila y columna, que pueden ser tablas de Excel, tablas de bases de datos SQL y diccionarios de objetos Series. Es la estructura de datos más utilizada en Pandas.
Formato básico:
df = pd.DataFrame (datos, índice = índice, columnas = columnas)
donde índice es la etiqueta de la fila, columnas es la etiqueta de la columna, los datos pueden ser: matriz numérica unidimensional, un diccionario compuesto de lista y serie, Matriz numpy bidimensional, una serie, objeto DataFrame.
1. Cree una fecha unidimensional para
crear una matriz bidimensional
2. Cree un diccionario
Operaciones básicas de pandas
Ver elemento
- Ver los datos en las primeras filas El método de
encontrar directamente el intervalo de los datos es ineficiente y
eficiente
- Ver los datos de una determinada columna
- Ver las etiquetas de las filas, las etiquetas de las columnas y los atributos de los datos
Conversión de datos
Ordenar
Los datos se ordenan por fila, columna y etiqueta específica
Juicio numérico
Juicio numérico de elementos en los datos
Copiar datos y modificar elementos