美しいスープのインスタレーション
1. 美しいスープの設置
Beautiful Soup は、Web ページからデータを簡単に抽出するために使用できる、Python 用の HTML または XML 解析ライブラリです。そのパーサーは lxml ライブラリに依存しているため、その前に、lxml ライブラリが正常にインストールされていることを確認してください。
この記事の環境は Windows 10 64-bit + python3.11 です。ここでは Windows のインストールを例に説明します。
1.1 lxmlライブラリのインストール
lxml ライブラリをインストールするには、まず pip を使用してインストールを試みます。
pip install lxml
pip インストールで libxml2 ライブラリなどの情報が不足しているなどのエラーが報告された場合は、wheel メソッドを使用してインストールできます。
ホイール方法を使用して取り付けます。最初にホイールを取り付ける必要があります
pip install wheel
次に、公式 Web サイトhttps://pypi.org/project/lxml/にアクセスして、lxml に対応するホイールのバージョンをダウンロードします。最新バージョンは lxml 4.9.1 で、[ファイルのダウンロード] をクリックします。
リストされたファイルで、自分のバージョンと一致するものを選択します。たとえば、Python のバージョンが 3.10、マシンが Windows システムの 64 ビット バージョンである場合、lxml-4.9.1-cp310-cp310-win_amd64.whl を選択します。
ここで注意が必要なのは、Python の最新バージョンはバージョン 3.11 ですが、lxml には対応する公式 Windows バージョン 311 がなく、Linux ではバージョン 311 のみであるということです。Python3.10 バージョンにダウングレードするなど、Python バージョンをダウングレードすることを選択できます。
または、 https://www.lfd.uci.edu/~gohlke/pythonlibs/で、Windows ホイール インストール パッケージの 311 バージョンを見つけることができ、自分で試すことができます。
Wheel パッケージをインストールするには、Wheel インストール パッケージが配置されているディレクトリに移動して pip コマンドを実行するか、フルパスを指定することもできます。
pip install lxml-4.9.0-cp311-cp311-win_amd64.whl
1.2 beautifulsoup4をインストールする
インストールには pip を使用することをお勧めします。次のインストールコマンドを実行します。
pip install beautifulsoup4
1.3 beautifulsoup4が実行できるか確認する
以下のコードを実行して、hello が正常に出力できれば、Beautifulsoup4 を解析に使用できたことになります。
beautifulsoup4 のみが正常にインストールされ、lxml ライブラリが正しくインストールされていない場合、次のコードは正常に実行できません。
from bs4 import BeautifulSoup as bs
soup = bs('<p>hello</p>', 'lxml')
print(soup.p.string)