スーパーシンプルなPythonの爬虫類

輸入コーデックは、
 インポート要求
 から BS4 輸入BeautifulSoupの
 輸入から lxmlのインポートetreeの
URL = ' https://jbk.jiankang.com/zhengzhuang/pinyin-z/?p=5 ' 
R = requests.get(URL)の.text 
SYM = re.findall(' <a href="/zhengzhuang/[0-9]{1,5}.*(?=</a>)' 、R)
 プリント(SYM)
 のためのラインSYM:
     プリント(ライン)
codecs.openと(' 症状.TXT '' A '' UTF8 ' Fなど)
     のためのラインSYM:
        f.write(ライン + ' \ n '

 

おすすめ

転載: www.cnblogs.com/yiwoqu/p/11542065.html
おすすめ