グラブの見出し

インポート要求
lxmlのインポートetreeから
インポートJSON
インポート時間の


クラスToutiao(オブジェクト):
デフ__init __(自己):
= {self.headers
'ユーザーエージェント':「のMozilla / 5.0(Windows NTの10.0; WOW64)のAppleWebKit / 537.36(KHTML、ヤモリ)クローム/ 75.0.3770.100サファリ/ 537.36'のような
}

DEF(自己)get_key_word:
オープンと':Fとして./ key_word.txt'、 'R')
データ= f.readlines()
戻り値のデータ

(#1デフGET_URL自己、データ):
データ内のDAのための#:
#url_list =「https://www.toutiao.com/api/pc/feed/?category={}&utm_source=toutiao''&widen=1&max_behot_time=0&max_behot_time_tmp=0''&tadrequire=true&as=A1256D1346DF1B7&cp=5D360F210BD7CE1''&_signature= NQO3JgAAaDs8T80zj26hTjUDtz'.format(
ダ)
url_listでのURLの#:
Fとしてオープン( './ url.txt'、 'A')と#:
#1 f.write(URL)

デフGET_CONTENT(自己):
オープンで(」 Fとして./url.txt」、 'R'):
url_list = f.readlines()
URLのurl_listで:
試す:
応答= requests.get(URL = URL、ヘッダー=自己。ヘッダ)
time.sleep(1)
応答= json.loads(response.content.decode( 'UTF-8'))

応答[ "データ"]に再用:
オープン( '../ BT / bt.txt'と、 '+'、エンコード=」 UTF-8 ')、Fとして:
f.write(再')['タイトル'] +' \ nは

オープンと(' ../ BT / nr.txt」、 '+'、符号化= 'UTF-8') Cとおり
c.write( '\ n' + [ '抽象']再)
Eなどの例外を除いて:
印刷(E)


__name__ == '__main__'であれば:
toutiao = Toutiao()
データ= toutiao.get_key_word()
#1 toutiaoを.get_url(データ)
toutiao.get_content()

おすすめ

転載: www.cnblogs.com/victorstudy/p/11237288.html