Enseñarle a usar Python para el análisis y la visualización de datos.

Python es un lenguaje muy bueno para el análisis de datos, principalmente porque las bibliotecas centradas en datos son muy adecuadas. Pandas es uno de ellos, lo que facilita la importación y el análisis de datos. En este artículo, solía analizar los datos del archivo Country Data.csv en el conjunto de datos públicos del sitio web de Stanford.

Instalación
Instalar Pandas:

pip install pandas

Cree un DataFrame en Pandas utilizando el método pd.Series para pasar varias Series a la clase DataFrame para completar la creación del marco de datos. Aquí, se pasa en dos objetos Serie, con s1 como primera fila y s2 como segunda fila.

ejemplo:

Producción:

 

 

 

Importar datos con Pandas

El primer paso es leer los datos. Los datos se almacenan como un archivo de valores separados por comas o csv, donde cada fila está separada por una nueva línea y cada columna está separada por una coma (,). Para poder usar los datos en Python, el archivo csv debe leerse en un Pandas DataFrame. DataFrame es una forma de representar y procesar datos de tablas.

ejemplo:

import pandas as pd 

df = pd.read_csv("IND_data.csv") 

df.head() 

df.shape 

Producción:

 

29,10

Indexar DataFrames con Pandas

Puede utilizar el método pandas.DataFrame.iloc para crear un índice. El método iloc permite recuperar hasta filas y columnas por ubicación.

ejemplo:

df.iloc[0:5,:] 
df.iloc[:,:] 
df.iloc[5:,:5] 

Mucha gente aprende Python y no sabe por dónde empezar.
Muchas personas aprenden Python y después de dominar la gramática básica, no saben dónde encontrar casos para comenzar.
Muchas personas que han realizado estudios de casos no saben cómo adquirir conocimientos más avanzados.
Entonces, para estos tres tipos de personas, les proporcionaré una buena plataforma de aprendizaje, ¡gratis para recibir tutoriales en video, libros electrónicos y el código fuente del curso!
Grupo QQ: 721195303


Indexación usando etiquetas en Pandas

Puede usar el método pandas.DataFrame.loc para indexar etiquetas, lo que le permite usar etiquetas en lugar de posiciones para indexar.
ejemplo:

df.loc[0:5,:] 
df = df.loc[5:,:] 

El contenido anterior en realidad no es muy diferente de df.iloc [0: 5 ,:]. Esto se debe a que, aunque la etiqueta de la fila puede tomar cualquier valor, nuestra etiqueta de la fila coincide exactamente con la posición. Sin embargo, las etiquetas de columna pueden facilitar el procesamiento de datos. ejemplo:

df.loc[:5,"Time period"] 

 

DataFrame Math 与 Pandas

El cálculo del marco de datos se puede realizar utilizando la función estadística de la herramienta pandas.
ejemplo:

df.describe() 
df.corr() 
df.rank() 

 

 

 

Diagrama de pandas

Los gráficos de estos ejemplos se realizan utilizando convenciones estándar para hacer referencia a la API de matplotlib, que proporciona los conceptos básicos de Pandas para crear fácilmente mapas hermosos.
ejemplo:

import the required module 
import matplotlib.pyplot as plt 
df['Observation Value'].hist(bins=10) 

df.boxplot(column='Observation Value', by = 'Time period') 

x = df["Observation Value"] 
y = df["Time period"] 
plt.scatter(x, y, label= "stars", color= "m", 
			marker= "*", s=30) 
plt.xlabel('Observation Value') 
plt.ylabel('Time period') 
plt.show() 

 

 

 

Todavía quiero recomendar el grupo de aprendizaje de Python que construí yo mismo : 721195303 , todos los cuales están aprendiendo Python. Si quieres aprender o estás aprendiendo Python, puedes unirte. Todos son parte del desarrollo de software y comparten productos secos de de vez en cuando (solo relacionado con el desarrollo de software de Python), incluida una copia de los últimos materiales avanzados de Python y la enseñanza basada en cero compilada por mí en 2021. ¡Bienvenidos amigos que están en un nivel avanzado e interesados ​​en Python para que se unan!

 

Supongo que te gusta

Origin blog.csdn.net/pyjishu/article/details/114580500
Recomendado
Clasificación