# - * -コーディング:UTF-8 - * -
#@time:2019年11月5日午後11時18分
#@Author:AForever
#@Site:
#@file:Spider_05.py
#@Software:PyCharm
#处理JSON数据
からurllibはインポート要求
輸入JSON
デフget_data():
URL = 'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=400&page_start=0'
ヘッダー= {
'のUser-Agent': 'のMozilla / 5.0(のWindows NT 6.1; WOW64)のAppleWebKit / 537.36(KHTML、ヤモリ等)クローム/ 56.0.2924.87サファリ/ 537.36'
}
REQ = request.Request(URL、ヘッダー=ヘッダ)
応答= request.urlopen(REQ)
場合response.getcode()== 200:
結果= response.read()
#プリント(型(結果))#バイト类型
#プリント(結果)
結果= STR(結果コード= 'UTF8')
プリント(結果)
リターン結果
parse_data DEF(HTML):
#将字符串形式的JSON转换为辞書字典
データ= json.loads(HTML)
映画=データ[ '科目']
映画の中で映画のために:
プリント(映画[ 'タイトル']、映画[ '率'])
の場合__name__ == '__main__':
#get_data()
parse_data(get_data())
データ処理PythonのJSONの爬虫類
おすすめ
転載: www.cnblogs.com/AForever01/p/11986622.html
おすすめ
ランキング