使用BS4は、XMLファイルの使用状況を解析
1. html.parser
BS4インポートBeautifulSoupから
スープ= BeautifulSoup(HTML、「html.parser」)
の二つの引数:最初の引数は、HTMLテキストを解析することで、2番目のパラメータは、使用の一種でありますHTMLの用語のパーサは、これは組み込みパーサBS4で、html.parserである
2。
スープ= BeautifulSoup(HTML、 "lxmlの")
すべての資格のラベルを探します
A)を見つけるためにタグを使用します
soup.find_all(' B ')
b)の正規表現検索
soup.find_all(re.compile(" ^ B "))
c)のタブが提供するリストを表示して下さい
soup.find_all([ " A "、" B "])
参考リンク:
https://www.cnblogs.com/gl1573/p/9480022.html