BeautifulSoupの簡単な使用

もっとゆっくり公式文書負荷(私のパーティーの理由があると推定)

https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#find-parents-find-parent

1、ダウンロードしBeautifulSoup4

2、インポートモジュール

BS4のインポート BeautifulSoup

BeautifulSoup GETラベルのテキストを使用して3、

BS4 インポートBeautifulSoup 
S1 = 「」「
<Pクラス=」QL-ALIGN =左ザ・は正当化「>記録用紙に、孟Meiqi、呉玄機器を含むロケット十代の少女、ヤンを超え、セグメントオーストリアフアン、Yamy、Laimeiユン、張ZiningとLiziティン、公式の数字を超えたヤンは168であるように公式の数字は1-3センチ矮星よりも、そのような人の高さと高さのデータ、体重フィールドが、それに加えLaimeiユンで、孟Meiqi、呉玄の楽器のような他のもののうちの少なくとも1つを有しますcmで、実際の高さは166.5センチメートルであった。</ P> 
"" " 
BS = BeautifulSoup(S1、" html.parser プリント(bs.text)

目的:HTMLファイルからテキストを抽出するには

4、役割:XSS攻撃を防ぐために、リッチテキストボックス:ラベル指定された目的を削除します

BS4のインポートBeautifulSoup 
    BS = BeautifulSoup(S1、" html.parser " 
    RET = bs.text
     プリント(RET) 
    RET = bs.find_all()
     プリント(RET)
     のためのタグbs.find_all():
         プリント(タグ。名)
         であれば tag.name == " スクリプト" 
            tag.decompose()

 

おすすめ

転載: www.cnblogs.com/wt7018/p/11361183.html
おすすめ