Hoje é 20 de agosto de 2021. Sentado em casa à noite, de repente vi as 2021福布斯排行榜
notícias. Então me inspirei para escrever este artigo.
Notícias: O Ranking 123 Network Rich Channel fornece a lista de ricos da Forbes de 2021, que inclui a lista de 2021 das pessoas mais ricas do mundo e os rankings mais ricos de vários países do mundo. Atualmente, Jeff Bezos ocupa o primeiro lugar entre o homem mais rico do mundo, com uma riqueza de 191,4 bilhões de dólares, enquanto o homem mais rico da China é: Zhong Suisui (valor: 62,6 bilhões de dólares).
Como se trata de dados tabulares, não há contramedidas. Para economizar tempo, posso enviá-los diretamente para a pandas
biblioteca. Preciso apenas de 5 linhas de código!
import pandas as pd
import csv
for i in range(1,16): # 爬取全部页
tb = pd.read_html(f'https://www.phb123.com/renwu/fuhao/shishi_{
i}.html')[0]
tb.to_csv(r'福布斯排行榜.csv', mode='a', encoding='utf_8_sig', index=0)
O resultado é o seguinte:
muito constrangedor, a linha de cabeçalho está toda lá, então são 14 cabeçalhos, vamos ler e remover a linha duplicada!
df = pd.read_csv("福布斯排行榜.csv",header=None)
df.drop_duplicates(inplace=True)
df.to_excel("福布斯排行榜.xlsx",index=None)
Use a drop_duplicates()
função diretamente para implementar a operação de desduplicação e salve novamente um novo arquivo.
Certo, vamos começar nossa exploração de dados!
df1 = pd.read_excel("福布斯排行榜.xlsx",header=1)
df1
O resultado é o seguinte:
1. Os 10 melhores do mundo
x = df1.head(10)
x
O resultado é o seguinte:
2. Os 10 principais países com mais pessoas na lista
df1.groupby("国家/地区")["名字"].count().sort_values(ascending=False)[:10].to_frame().reset_index()
O resultado é o seguinte:
3. Top 10 na China
y = df1[df1["国家/地区"] == "中国"]
y.head(10)
Os resultados são os seguintes:
Na verdade, sejam as dez maiores da China ou as dez maiores do mundo, são basicamente algumas de nossas 耳熟能详
empresas. É preciso dizer que o número de americanos na lista é realmente grande.
Bem, basta conhecê-lo, e inspirar-se em seu coração! Se você não pode ser outra pessoa, você deve trabalhar duro. Pense nisso como uma canja de galinha para o fim de semana!