Prefácio
O texto e as imagens deste artigo são provenientes da Internet e são apenas para fins de aprendizagem e comunicação. Não têm qualquer uso comercial. Se você tiver alguma dúvida, entre em contato conosco para processamento.
PS: Se você precisa de materiais de aprendizagem Python, você pode clicar no link abaixo para obtê-los você mesmo
Visão geral deste artigo
Pandas é a ferramenta que os cientistas de dados mais usam ao fazer processamento de dados.
Comparando o Excel, podemos descobrir que o Pandas pode basicamente implementar todas as funções do Excel, e é mais conveniente e conciso do que o Excel.Na verdade, muitas operações foram descritas mais ou menos em artigos anteriores.
Mas no quadro de dados, a conclusão de várias configurações de "formato condicional" nos ajuda a destacar mais os dados e tornar a exibição dos dados mais bonita. Esta é a primeira vez hoje.
A tabela da esquerda da figura acima mostra os dados do resultado do exame final de uma determinada turma. Precisamos usar a tabela da esquerda para completar a exibição dos efeitos conforme mostrado na tabela da direita. Os objetivos a serem cumpridos são os seguintes:
- (1) O valor da coluna "média" é reservado para 1 casa decimal;
- (2) A estes dados, acrescente um título para ajudar a explicar "Resultados do exame final de grau sênior (5)" para nos facilitar a distinguir os dados;
- (3) Oculte a coluna do índice (observe a extrema esquerda!);
- (4) Oculte as colunas designadas, não trataremos de algumas colunas, portanto, não precisamos exibi-las;
- (5) Desenhe um gráfico de barras de acordo com o valor numérico da coluna “Idioma”;
- (6) Destaque o maior valor dos dados na coluna "média";
- (7) Desenhe um mapa de cores verde com base nos valores da coluna "matemática";
- (8) Exibir o valor vazio de todo o DataFrame em vermelho, destacando-o;
uma linha de código pode fazer todas as operações acima.
Amigos que usaram Pyecharts podem todos conhecer a "regra da cadeia", aqui também podemos usar esse método, e todas as funções acima podem ser realizadas com uma linha de código.
1. Leia os dados
import pandas as pd
df = pd.read_excel("特殊.xlsx")
df.index = list(range(df.shape[0]))
df
Os resultados são os seguintes:
2. Uma linha de código
df.style.format('{:.1f}',subset='均值').set_caption('高三(5)班期末考试成绩').\
hide_index().hide_columns(['索引']).bar('语文',vmin=0).highlight_max('均值').\
background_gradient('Greens',subset='数学').highlight_null()
Os resultados são os seguintes:
Instruções de uso
Este é um novo recurso do Pandas 0.17.1. De acordo com o documento oficial: Este é um recurso novo e está em desenvolvimento ativo. Adicionaremos recursos e podemos fazer grandes alterações em versões futuras.
Esse método aparece na classe pandas.formats.style.Styler. Não vou apresentar o princípio desse método em detalhes aqui hoje. Você sabe como usá-lo e vou introduzi-lo lentamente nos artigos seguintes.
Acima, implementamos diretamente todas as funções com uma linha de código. E se quisermos implementar apenas uma determinada função?
- df.style.format ()
- df.style.set_caption ()
- df.style.hide_index ()
- df.style.hide_columns ()
- df.style.bar ()
- df.style.highlight_max ()
- df.style.background_gradient ()
- df.style.highlight_null ()
Tudo bem, vou apresentá-lo a você hoje, então apresse-se e experimente!