Python解析ライブラリBeautiful Soupのインストール

1. 美しいスープの設置

Beautiful Soup は、Web ページからデータを簡単に抽出するために使用できる、Python 用の HTML または XML 解析ライブラリです。そのパーサーは lxml ライブラリに依存しているため、その前に、lxml ライブラリが正常にインストールされていることを確認してください。

この記事の環境は Windows 10 64-bit + python3.11 です。ここでは Windows のインストールを例に説明します。

1.1 lxmlライブラリのインストール

lxml ライブラリをインストールするには、まず pip を使用してインストールを試みます。

pip install lxml

pip インストールで libxml2 ライブラリなどの情報が不足しているなどのエラーが報告された場合は、wheel メソッドを使用してインストールできます。

20221211174313

ホイール方法を使用して取り付けます。最初にホイールを取り付ける必要があります

pip install wheel

20221211193726

次に、公式 Web サイトhttps://pypi.org/project/lxml/にアクセスして、lxml に対応するホイールのバージョンをダウンロードします。最新バージョンは lxml 4.9.1 で、[ファイルのダウンロード] をクリックします。

20221211204339

リストされたファイルで、自分のバージョンと一致するものを選択します。たとえば、Python のバージョンが 3.10、マシンが Windows システムの 64 ビット バージョンである場合、lxml-4.9.1-cp310-cp310-win_amd64.whl を選択します。

20221211200756

ここで注意が必要なのは、Python の最新バージョンはバージョン 3.11 ですが、lxml には対応する公式 Windows バージョン 311 がなく、Linux ではバージョン 311 のみであるということです。Python3.10 バージョンにダウングレードするなど、Python バージョンをダウングレードすることを選択できます。

または、 https://www.lfd.uci.edu/~gohlke/pythonlibs/、Windows ホイール インストール パッケージの 311 バージョンを見つけることができ、自分で試すことができます。

20221211204213

Wheel パッケージをインストールするには、Wheel インストール パッケージが配置されているディレクトリに移動して pip コマンドを実行するか、フルパスを指定することもできます。

pip install lxml-4.9.0-cp311-cp311-win_amd64.whl

20221211202526

1.2 beautifulsoup4をインストールする

インストールには pip を使用することをお勧めします。次のインストールコマンドを実行します。

pip install beautifulsoup4

20221211173125

1.3 beautifulsoup4が実行できるか確認する

以下のコードを実行して、hello が正常に出力できれば、Beautifulsoup4 を解析に使用できたことになります。

beautifulsoup4 のみが正常にインストールされ、lxml ライブラリが正しくインストールされていない場合、次のコードは正常に実行できません。

from bs4 import BeautifulSoup as bs

soup = bs('<p>hello</p>', 'lxml')
print(soup.p.string)

20221211203212

Je suppose que tu aimes

Origine blog.csdn.net/hubing_hust/article/details/128278550
conseillé
Classement