htmlページからの高速解析データ

どのようにすぐに我々はhtmlページからのデータを解析したいです

基本的な入力方法爬虫類

 

シーン:

図1に示すように、インターフェースは、XMLに戻るインターフェース

図2は、テキストデータを解析したいページから欲しいです

 

 

使用

PIP3 lxmlのインストール

 

インポート要求

lxmlのインポートetreeから

 

R = requests.post(URL、データ)の.text

 

#コピーHTMLコンテンツ

html_demo = '  '

コンテンツの#使用etree.HTMLパースHTML

#demo = etree.HTML(html_demo) 

デモ= etree.HTML(R) 

ノード= demo.xpath( '')#充填経路のXPath

 

#テキストを取得

T =ノード[0]の.text

印刷(T)

 

おすすめ

転載: www.cnblogs.com/dearddu/p/12521347.html