トレンドクロールBaiduの

ソース

インポート要求
BS4輸入BeautifulSoupのから
の輸入パンダのPdなど
のurl = "https://tophub.today/n/Jb0vmloB1G"
ヘッダ= { 'のUser-Agent': 'のMozilla / 5.0(Windows NTの6.3; Win64の、x64の)のAppleWebKit / 537.36 (KHTML、ヤモリ等)クローム/ 69.0.3497.100サファリ/ 537.36 '}
HTML = r.text
R = requests.get(URL)
r.encoding = r.apparent_encoding
スープ= BeautifulSoup(HTML、' lxmlの')
list_1 = []
list_2 = []
:soup.find_all(クラス_ = "ら")におけるiについて
list_1.append(i.get_text()ストリップ()。)
soup.find_allにおけるL用(クラス_ = "テーブル"):
list_2.append( l.get_text()。ストリップ())
データ= [list_1、list_2]
印刷(データ)
H = pd.DataFrame(データ、インデックス= [ "标题"、 "热度"])
、印刷(HT)

結果

おすすめ

転載: www.cnblogs.com/yanweijie1005/p/12538662.html