きれいセレクタ/文書ツリーDay3-7トラバース


そして、 <a href="http://example.com/tillie" class="sister" id="link3"> Tillieする</a>。
彼らは井戸の底に住んでいます。</ p>



<Pクラス= "ストーリー"> ... </ p型> 
"" " 

スープ = BeautifulSoup(html_doc、' lxmlの' ドキュメントツリーのトラバース1焦点に直接
印刷(soup.html)
 印刷タイプの((スープを。 HTML))
 を印刷(soup.a)
 印刷(soup.p) 

2.ラベル名を取得する
印刷(soup.a.name) 

取得したタグの3キー属性
印刷(soup.a.attrs) は、ラベルを取得しますすべての属性
印刷(soup.a.attrs [ HREF ]) 

4を取得し、キーテキストラベルの
印刷(soup.a.text) 

入れ子に選ば5. 
印刷(soup.html.body.p) 

6子ノード、子孫ノード
を印刷(soup.p.children) 返すイテレータオブジェクトの
印刷((一覧(soup.p.children))) 

7。親ノードの祖先ノード
印刷(soup.b.parent)
 印刷(soup.b.parents)
 印刷(一覧(soup.b.parents)) 

8兄弟
印刷(soup.a)
次の兄弟ノード
を印刷(soup.a. NEXT_SIBLING) 

取得、すべての次の兄弟ノード、返しプロデューサーの
印刷(soup.a.next_siblings)
 印刷(一覧(soup.a.next_siblings)) 

兄弟取得
印刷(soup.a.previous_siblingを)
 発電機のリターンにすべての兄弟を取得
印刷(リスト(soup.a.previous_siblings))

 

おすすめ

転載: www.cnblogs.com/zxdhahaha/p/11128293.html