5 linhas de código levarão você a rastrear a "lista Forbes 2021" para ver quem está na China?

Hoje é 20 de agosto de 2021. Sentado em casa à noite, de repente vi as 2021福布斯排行榜notícias. Então me inspirei para escrever este artigo.

Notícias: O Ranking 123 Network Rich Channel fornece a lista de ricos da Forbes de 2021, que inclui a lista de 2021 das pessoas mais ricas do mundo e os rankings mais ricos de vários países do mundo. Atualmente, Jeff Bezos ocupa o primeiro lugar entre o homem mais rico do mundo, com uma riqueza de 191,4 bilhões de dólares, enquanto o homem mais rico da China é: Zhong Suisui (valor: 62,6 bilhões de dólares).

Como se trata de dados tabulares, não há contramedidas. Para economizar tempo, posso enviá-los diretamente para a pandasbiblioteca. Preciso apenas de 5 linhas de código!

import pandas as pd
import csv

for i in range(1,16):  # 爬取全部页
    tb = pd.read_html(f'https://www.phb123.com/renwu/fuhao/shishi_{
      
      i}.html')[0] 
    tb.to_csv(r'福布斯排行榜.csv', mode='a', encoding='utf_8_sig', index=0)

O resultado é o seguinte:
insira a descrição da imagem aqui
muito constrangedor, a linha de cabeçalho está toda lá, então são 14 cabeçalhos, vamos ler e remover a linha duplicada!

df = pd.read_csv("福布斯排行榜.csv",header=None)
df.drop_duplicates(inplace=True)
df.to_excel("福布斯排行榜.xlsx",index=None)

Use a drop_duplicates()função diretamente para implementar a operação de desduplicação e salve novamente um novo arquivo.

Certo, vamos começar nossa exploração de dados!

df1 = pd.read_excel("福布斯排行榜.xlsx",header=1)
df1

O resultado é o seguinte:
insira a descrição da imagem aqui

1. Os 10 melhores do mundo

x = df1.head(10)
x

O resultado é o seguinte:
insira a descrição da imagem aqui

2. Os 10 principais países com mais pessoas na lista

df1.groupby("国家/地区")["名字"].count().sort_values(ascending=False)[:10].to_frame().reset_index()

O resultado é o seguinte:
insira a descrição da imagem aqui

3. Top 10 na China

y = df1[df1["国家/地区"] == "中国"]
y.head(10)

Os resultados são os seguintes:
insira a descrição da imagem aqui
Na verdade, sejam as dez maiores da China ou as dez maiores do mundo, são basicamente algumas de nossas 耳熟能详empresas. É preciso dizer que o número de americanos na lista é realmente grande.

Bem, basta conhecê-lo, e inspirar-se em seu coração! Se você não pode ser outra pessoa, você deve trabalhar duro. Pense nisso como uma canja de galinha para o fim de semana!

Acho que você gosta

Origin blog.csdn.net/weixin_41261833/article/details/119832660
Recomendado
Clasificación