データ処理PythonのJSONの爬虫類

# - * -コーディング:UTF-8 - * - 
#@time:2019年11月5日午後11時18分
#@Author:AForever
#@Site:
#@file:Spider_05.py
#@Software:PyCharm

#处理JSON数据

からurllibはインポート要求
輸入JSON


デフget_data():
URL = 'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=400&page_start=0'
ヘッダー= {
'のUser-Agent': 'のMozilla / 5.0(のWindows NT 6.1; WOW64)のAppleWebKit / 537.36(KHTML、ヤモリ等)クローム/ 56.0.2924.87サファリ/ 537.36'
}
REQ = request.Request(URL、ヘッダー=ヘッダ)
応答= request.urlopen(REQ)
場合response.getcode()== 200:
結果= response.read()
#プリント(型(結果))#バイト类型
#プリント(結果)
結果= STR(結果コード= 'UTF8')
プリント(結果)
リターン結果


parse_data DEF(HTML):
将字符串形式的JSON转换为辞書字典
データ= json.loads(HTML)
映画=データ[ '科目']
映画の中で映画のために:
プリント(映画[ 'タイトル']、映画[ '率'])


の場合__name__ == '__main__':
#get_data()
parse_data(get_data())

おすすめ

転載: www.cnblogs.com/AForever01/p/11986622.html