実際、Anaconda と Jupyter ノートブックは、データ分析の標準的な環境になっています。
簡単に言えば、Anaconda はパッケージ マネージャーおよび環境マネージャーであり、Jupyter ノートブックはデータ分析用のコード、画像、およびドキュメントを 1 つの Web ドキュメントに結合できます。
次に、Anaconda について詳しく紹介し、最後に Jupyter ノートブックを示します。
1. アナコンダとは?
2.インストール方法は?
3. パッケージの管理方法は?
4. 環境を管理するには?
5.Jupyter ノートブックをすぐに使い始める方法は?
ただし、始める前に、以下の手順に従って自分のコンピューターで練習する必要があることを強調する必要があります。以下に多くのコマンドが表示されますが、誰もそれらを覚えていません。でも怖がらないで、途中であきらめないでください。順序を覚える必要はありません。あとでデータ分析を学べば、自然と覚えられるからです。
思い出せなくても問題ありません。どこで探すかを学んでください。上記の手順に従い、各手順が何をするかを理解する必要があります。後で何かをする必要がある場合は、このドキュメントをチェックすることを忘れてください。
習得の最初は大変かもしれませんが、中途半端に諦めずに自分でやれば、確実にマスターできると思います。
1. アナコンダとは?
アナコンダは英語で「パイソン」を意味し、パイソンのようなセクシーで魅惑的な体を意味する「アナコンダ」という歌があります。
下に表示されているアナコンダのアイコンはすべて、最後に互いに噛み合う「ボア コンストリクター」のようなものです。
おそらくすでに Python がインストールされているのに、なぜ Anaconda が必要なのでしょうか? 3 つの理由があります。
1) Anaconda には、一般的に使用される多数のデータ サイエンス パッケージが付属しており、conda、Python、および 150 を超える科学パッケージとそれらの依存関係が付属しています。そのため、すぐにデータの処理を開始できます。
2) 管理パック
Anaconda は conda (パッケージ マネージャーおよび環境マネージャー) で開発されました。
データ分析では、多くのサードパーティ パッケージを使用します。conda (パッケージ マネージャー) は、パッケージのインストール、アンインストール、更新など、これらのパッケージをコンピューターにインストールして管理するのに役立ちます。
3) 管理環境
なぜ環境を管理する必要があるのですか?たとえば、プロジェクト A で Python 2 を使用していて、新しいプロジェクト B のボスが Python 3 を必要としている場合、2 つの Python バージョンを同時にインストールすると、多くの混乱とエラーが発生する可能性があります。現時点では、conda を使用すると、プロジェクトごとに異なる動作環境を作成できます。
また、pandas のバージョンが異なるなど、パッケージのバージョンが異なるプロジェクトも多くあり、Numpy のバージョンを 2 つ同時にインストールすることはできません。プロジェクトの環境。現時点では、conda がお手伝いします。
2. Anaconda のインストール方法は?
Anaconda は、複数のプラットフォーム (Windows、Mac OS X、および Linux) で使用できます。インストーラーとインストール手順は、以下のアドレスにあります。オペレーティング システムが 32 ビットか 64 ビットかに応じて、ダウンロードする対応するバージョンを選択します。
(Anaconda は Windows XP をサポートしなくなりました。同時に、コンピューターが 32 ビットか 64 ビットかを確認し、間違ってインストールしないでください。)
公式サイトアドレス:https://www.continuum.io/downloads
公式ウェブサイトのアドレスがダウンロードに遅すぎる場合は、私の公式アカウントから「情報」を返信して、ネットワークディスクからダウンロードできます
Anaconda のダウンロードは比較的大きく (約 500 MB)、Python で最も一般的に使用されるデータ サイエンス パッケージが付属しているためです。
Python がコンピューターに既にインストールされている場合、インストールによる影響はありません。実際、スクリプトとプログラムで使用されるデフォルトの Python は、Anaconda に同梱されているものです。
注: Windows 10 システムの場合は、Anaconda ソフトウェアをインストールするときに注意してください。右クリックしてソフトウェアをインストールし、管理者として実行することを選択します。
インストールが完了したら、Windows の場合は以下のように Anaconda Prompt (Mac の場合はターミナル) を開きます (以降、Anaconda Prompt を総称して「ターミナル」と呼びます)。
注: Windows 10 システムの場合は、下の図に従ってください。
win10 システムが上記の操作に従わない場合、後で次のエラー メッセージが報告されます。
ターミナルまたはコマンド プロンプトで「conda list」と入力すると、インストールした内容を確認できます。
PS: 上記の操作を行った後、Anaconda Prompt で Conda コマンドを使用できない場合は、次の順序で解決策を試してください (通常、それらを使用する友人はこの手順を無視して続行します)。
1) 以前に Python をインストールしたことがあるかどうかを確認します。インストールしたことがある場合は、Python を完全に削除して (同時に環境変数も削除して)、Anaconda を再インストールしてください。
2) 環境変数に Conda コマンドを追加したことを確認します。
3) Anaconda のインストール パスに、中国語や英語以外の一般的な文字が含まれていないことを確認します。
4) 上記の手順を実行しても改善されない場合は、Anaconda をアンインストールしてから再インストールしてください。
Conda コマンドが Anaconda Prompt で使用できる場合は、以下に進みます。
後でエラーが報告されないようにするには、最初にすべてのパッケージを更新する必要があります。次のコマンドを入力して、ターミナル内のすべてのパッケージを更新します。
conda アップグレード --all
更新するかどうかを尋ねられたら、y (はい) を入力して更新を続行します。最初にインストールするソフトウェア パッケージのバージョンは一般的に比較的古いため、事前に更新することで将来の不要な問題を回避できます。
上記のコマンドを実行するか、インストール パッケージが次のエラー メッセージを報告する場合:
次の解決策を使用できます (ターミナルで次のコマンドを実行します)。
conda config --チャンネルを追加 https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls はい
コマンド ライン メソッドを追加できない場合は、「ノートブックの作業フォルダー」にある .condarc ファイルを見つけることができます。
あなたの「ノートブックの作業フォルダ」は何ですか?
By default, it is the folder where you start the Anaconda Prompt terminal. たとえば、次のフォルダーは私のコンピューターにあります (Windows は C://Users/username/.condarc、Linux/Mac は ~/.condarc):
フォルダーを開き、ファイルの内容を次のように変更します。
(.condarc が見つからない場合は、notepad++ ソフトウェアを使用して、「ノートブック作業フォルダー」の下に新しいファイルを作成し、次の内容を追加します)
便宜上、次のセクションを上記のファイルに直接コピーできます。
チャネル:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- デフォルト
show_channel_urls: はい
3. パッケージの管理方法は?
Anaconda をインストールすると、パッケージの管理 (インストール、アンインストール、更新) が容易になります。
1) パッケージをインストールする
ターミナルに次のように入力します。
conda install package_name
たとえば、pandas をインストールするには、ターミナルに次のように入力します。
コンダインストールパンダ
複数のパッケージを同時にインストールすることもできます。conda install pandas numpy のようなコマンドは、これらのパッケージをすべて一度にインストールします。バージョン番号を追加して、目的のパッケージ バージョンを指定することもできます (例: conda install numpy=1.10 )。
conda は依存関係も自動的にインストールします。たとえば、scipy は numpy を使用し、必要とするため、numpy に依存します。scipy のみをインストールする場合 (conda install scipy)、conda は numpy もインストールします (まだインストールされていない場合)。
2) パッケージをアンインストールする
ターミナルに次のように入力します。
conda remove package_names
上記のコマンドの package_names は、アンインストールするパッケージの名前を参照します。たとえば、pandas パッケージをアンインストールする場合: conda remove pandas
3) パッケージの更新
ターミナルに次のように入力します。
conda update package_name
環境内のすべてのパッケージを更新する場合 (これは便利な場合が多い)、conda update --all を使用します。
4) インストール済みパッケージの一覧表示
# インストール済みパッケージ一覧
コンダリスト
たとえば、よく使用される 2 つのパッケージ、numpy と pandas のインストールに成功しました。
探しているパッケージの正確な名前がわからない場合は、conda search search_term で検索してみてください。たとえば、numpy をインストールしたいのはわかっていますが、正確なパッケージ名は不明です。私はこれを試すことができます: conda search num.
4. 環境を管理するには?
conda は、プロジェクトごとに異なるランタイム環境を作成できます。
0) ノートブックが nb_conda 環境に自動的に関連付けられるように nb_conda をインストールします。
1) 環境を作る
ターミナル使用時:
conda create -n env_name package_names
上記のコマンドで、env_name は設定環境の名前 (-n はコマンドの後の env_name が作成する環境の名前であることを意味します)、package_names は作成時にインストールするパッケージの名前です。環境。
たとえば、py3 という名前の環境を作成し、そこに numpy をインストールするには、ターミナルで conda create -n py3 pandas と入力します。
2) 環境作成時に、環境にインストールするPythonのバージョンを指定できる
これは、Python 2.x と Python 3.x の両方でコードを操作している場合に便利です。たとえば、特定の Python バージョンで環境を作成するには、py3 という名前の環境を作成し、ターミナルに Python3 タイプの最新バージョンをインストールします。
conda create -n py3 python=3
または、py2 という名前の環境を作成して、最新バージョンの Python2 をインストールすることもできます。
create create -n py2 python=2
私が行うプロジェクトは異なるため、Python2 を使用する場合もあれば、Python3 を使用する場合もあります。そこで、私は自分のコンピューターにこれら 2 つの環境を作成し、そのような環境名を取りました: py2、py3. このようにして、プロジェクトに応じて異なるバージョンの Python を簡単に使用できます。
特定のバージョン (Python 3.6 など) をインストールする場合は、 conda create -n py python=3.6 を使用します。
3) 環境に入る
Windows では、activate my_env で入力できます。OSX/Linux で source activate my_env を使用して環境に入ります。
環境に入ると、ターミナルプロンプトに環境名が表示されるので、下の画像はpy3を入力した環境です(ここでpy3は上記の環境を作成したときに付けた名前です。好きな名前を付けることができます)。
環境に入った後、conda list を使用して、デフォルトで環境にインストールされているいくつかのパッケージを表示できます。
環境にパッケージをインストールするコマンドは、以前と同じです: conda install package_name.
ただし、今回は、インストールした特定のパッケージは、環境に入って初めて利用可能になります。
3) 環境を離れる
Windows では、ターミナルに次のように入力します。
無効にする
OSX/Linux タイプの場合:
ソースの無効化
4) 共有環境
共有環境は、他の人がコードで使用されているすべてのパッケージをインストールし、それらが正しいバージョンであることを確認できるため便利です。たとえば、薬局のデータ分析システムを開発する場合、プロジェクト展開システムの Wang Ergou に提出してプロジェクトを展開する必要がありますが、Wang Ergou は、開発時に使用していた Python のバージョンと、使用したパッケージを知りません。そしてパッケージ版。これをどうするか?
You can use conda env export > environment.yaml in the terminal in your current environment to save your current environment to a file. パッケージは YAML ファイル (Python バージョンとすべてのパッケージの名前を含む) として保存されます。
コマンド conda env export の最初の部分は、環境内のすべてのパッケージの名前 (Python バージョンを含む) を出力するために使用されます。
「ノートブックの作業フォルダー」(およびターミナルで上記に表示されるパス) の下に、エクスポートされた環境ファイルが表示されます。
GitHub でコードを共有する場合は、環境ファイルも作成してコード リポジトリに含めることをお勧めします。これにより、他のユーザーがコードのすべての依存関係を簡単にインストールできるようになります。
エクスポートした環境ファイルを他のコンピューター環境で使用する方法は?
まず、py3 をアクティブにするなど、conda で環境に入ります。
次に、次のコマンドで環境を更新します。
# -f は、ファイルのローカル パスをエクスポートすることを意味するため、/path/to/environment.yml を実際のローカル パスに置き換える必要があります。
conda env update -f=/path/to/environment.yml
conda を使用しないユーザーの場合、通常は pip freeze > environment.txt も使用して txt ファイルをエクスポートし、それを含めます。
詳細はこちら:https://pip.pypa.io/en/stable/reference/pip_freeze/
例を使用すると、この使用シナリオを理解しやすくなります。
まず、プロジェクトのパッケージをコンピューターの conda の environment.txt ファイルにエクスポートします。
次に、このファイルをプロジェクトのコード リポジトリに含めます。他のプロジェクト メンバーは、自分のコンピューターに conda がインストールされていなくても、このファイルを使用して私と同じ開発環境をインストールできます。
彼は自分のコンピューターで python コマンド環境に入り、次のコマンドを実行して、プロジェクトに必要なパッケージをインストールします。
pip install -r /path/requirements.txt
/path/requirements.txt は、コンピューター上のファイルの実際のパスです。
5) 環境を一覧表示する
作成した環境の名前を忘れてしまうことがあるので、そのときは conda env list を使用して、作成したすべての環境を一覧表示します。
現在使用している環境の横にアスタリスクが付いた環境のリストが表示されます。デフォルトの環境 (つまり、選択した環境にいないときに使用される環境) の名前は root です。
6) 環境を削除する
環境を使用しなくなった場合は、 conda env remove -n env_name を使用して、指定した環境を削除できます (ここでは、環境の名前は env_name です)。
最後に、もう一度強調しておきますが、上記のコマンドに惑わされないでください。上記のコマンドはたくさんありますが、誰もそれらを覚えることができません。後で、Zhihu でより多くのプロジェクトを実行するために私に従ってください。上記の手順に従い、各手順が何をするかを理解する必要があります。後で何かをする必要がある場合は、このドキュメントをチェックすることを忘れてください。
Conda の公式ドキュメント: https://conda.io/docs/user-guide/tasks/index.html
以上の手順で、Anaconda を学習し、データ分析用の Python 環境をインストールしたら、Jupyter Notebook をデータ分析用に快適に使用できるようになります。
⬇️「原文を読む」をクリック
無料データ分析トレーニングキャンプに申し込む