Pythonの爬虫類:BF4のインストールと使用

' '' 解析器を安装
PIP3はlxmlのインストール
:解析库安装
PIP3はBS4をインストール
''' 

html_doc = ''」
<HTML> <HEAD> <TITLE>ヤマネの物語</ TITLE> </ HEAD> 
<BODY> 
<Pクラス= "姉妹"> <B> $、37 </ B> </ P> 

<Pクラス= "物語" ID = "P">一度3人の妹があった時間に。そしてそれらの名前はなかった
<a href="http://example.com/elsie" class="sister">エルシー</a>に、
<HREF = "http://example.com/lacie"クラス= "姉妹"ID ="リンク2 ">のLaCie </a>と
<HREF =" http://example.com/tillie」クラス= "姉妹" ID = "LINK3" > Tillieする</a>。
彼らは井戸の底に住んでいます。</ p> 

<Pクラス= "物語"> ... </ P> 
''」
BS4インポートBeautifulSoupから
 
#のpython自带解析库
BeautifulSoupスープ=#(html_doc、 'html.parser')
オブジェクトにスープ与えるために#コールBS4 
スープを= BeautifulSoup(html_doc、 'lxmlの')

#1 BS4は、オブジェクトを
印刷する(スープ)

#BS4をタイプ
印刷(タイプ(スープ)) 
美化を
= soup.prettify HTML()
印刷(HTML)

  

おすすめ

転載: www.cnblogs.com/Auraro997/p/11128167.html