爬虫類の日記 - ベースのHTMLフォーマットとコーディングBS4ライブラリ

HTMLベースのフォーマットとコーディングBS4ライブラリ

import requests
from bs4 import BeautifulSoup
r=requests.get('https://python123.io/ws/demo.html')
demo=r.text
soup = BeautifulSoup(demo,'html.parser')

print(soup.prettify())

私たちは、おいしいスープの話をする前に、それはすでに方法を飾り立てる一度使用した後、何も私は自分自身を見つけることができませんでしたので、私はちょうど知っている、それが何であるかわからない、やって説明がないことをクロールに、そのメソッドを使用した後HTMLは、グループとなって長いものとなり、そしてたくさん明確に見えたかもしれません。

コーディングに関しては、エンコード形式を飾り立てるUTF8である限り、UTF8があったとして、基本的に程度まで心配することは何もありません。内容は中国であったとしても、彼はまた、プリントアウトすることができます。

おすすめ

転載: www.cnblogs.com/chanyuli/p/11403593.html