Ensine você a usar Python para análise e visualização de dados

Python é uma linguagem muito boa para análise de dados, principalmente porque as bibliotecas centradas em dados são muito adequadas. O Pandas é um deles, facilitando a importação e análise de dados. Neste artigo, analisei os dados no arquivo Country Data.csv no conjunto de dados públicos no site de Stanford.

Instalação
Instale o Pandas:

pip install pandas

Crie um DataFrame no Pandas usando o método pd.Series para passar várias Series para a classe DataFrame para concluir a criação do quadro de dados. Aqui, ele é passado em dois objetos Series, com s1 como a primeira linha e s2 como a segunda linha.

exemplo:

Resultado:

 

 

 

Importar dados com Pandas

O primeiro passo é ler os dados. Os dados são armazenados como um valor separado por vírgula ou arquivo csv, onde cada linha é separada por uma nova linha e cada coluna é separada por uma vírgula (,). Para poder usar os dados em Python, o arquivo csv precisa ser lido em um Pandas DataFrame. DataFrame é uma forma de representar e processar dados da tabela.

exemplo:

import pandas as pd 

df = pd.read_csv("IND_data.csv") 

df.head() 

df.shape 

Resultado:

 

29,10

Indexar DataFrames com Pandas

Você pode usar o método pandas.DataFrame.iloc para construir um índice. O método iloc permite a recuperação de até linhas e colunas por local.

exemplo:

df.iloc[0:5,:] 
df.iloc[:,:] 
df.iloc[5:,:5] 

Muitas pessoas aprendem python e não sabem por onde começar.
Muitas pessoas aprendem python e depois de dominar a gramática básica, não sabem onde encontrar casos para começar.
Muitas pessoas que fizeram estudos de caso não sabem como aprender conhecimentos mais avançados.
Portanto, para esses três tipos de pessoas, irei fornecer a vocês uma boa plataforma de aprendizado, gratuita para receber tutoriais em vídeo, e-books e o código-fonte do curso!
Grupo QQ: 721195303


Indexando usando tags em Pandas

Você pode usar o método pandas.DataFrame.loc para indexar rótulos, o que permite usar rótulos em vez de posições para indexação.
exemplo:

df.loc[0:5,:] 
df = df.loc[5:,:] 

O conteúdo acima não é muito diferente de df.iloc [0: 5 ,:]. Isso ocorre porque, embora o rótulo da linha possa assumir qualquer valor, nosso rótulo da linha corresponde exatamente à posição. No entanto, os rótulos das colunas podem facilitar o processamento de dados. exemplo:

df.loc[:5,"Time period"] 

 

DataFrame Math 与 Pandas

O cálculo do quadro de dados pode ser feito usando a função estatística da ferramenta pandas.
exemplo:

df.describe() 
df.corr() 
df.rank() 

 

 

 

Diagrama de Pandas

Os gráficos nesses exemplos são feitos usando convenções padrão para fazer referência à API matplotlib, que fornece os fundamentos do Pandas para criar mapas bonitos com facilidade.
exemplo:

import the required module 
import matplotlib.pyplot as plt 
df['Observation Value'].hist(bins=10) 

df.boxplot(column='Observation Value', by = 'Time period') 

x = df["Observation Value"] 
y = df["Time period"] 
plt.scatter(x, y, label= "stars", color= "m", 
			marker= "*", s=30) 
plt.xlabel('Observation Value') 
plt.ylabel('Time period') 
plt.show() 

 

 

 

Ainda quero recomendar o grupo de aprendizagem Python que construí por mim mesmo : 721195303 , todos os quais estão aprendendo Python. Se você quiser aprender ou estiver aprendendo Python, seja bem-vindo. Todos são parte do desenvolvimento de software e compartilham produtos secos de de vez em quando (apenas relacionado ao desenvolvimento de software Python), incluindo uma cópia dos materiais avançados mais recentes do Python e ensino baseado em zero compilado por mim em 2021. Bem-vindos amigos que estão em nível avançado e interessados ​​em Python!

 

Acho que você gosta

Origin blog.csdn.net/pyjishu/article/details/114580500
Recomendado
Clasificación