以前に格納されたPythonの基礎

 1.ディレクトリのsys.path変数にリストされているのsysモジュールファイルを探して、インポートSYS、パイソンを実行します。そして、初期化されているモジュール内の文の主なブロックを実行し、その後、モジュールを使用することができます。

2.python内部使用のユニコードが処理されるが、ユニコード、その符号化フォーマットの使用を検討するために、他のUCS-4であり、二つの一のUCS-2、それが65536ヤードビットの合計であり、それは2147483648グラム符号ビットを有しています。
https://cloud.tencent.com/developer/article/1406492

3. 2007リリース以来、scikit-学ぶPythonは、機械学習、scikit学習略語の分類のためのサポートを含むsklearn、回帰、および次元削減の重要なリポジトリになってきました機械学習アルゴリズムの4つのクラスター。さらに3つのモジュールによって特徴抽出、データの処理とモデル評価を含みます。

4. __name__ == '__main__'の場合:影響

典型的には二つの方法で使用されるPythonのファイルは、最初のスクリプトとして直接実行され、第二には、別のPythonスクリプトを実行する(ブロック再利用)と呼ばれてインポートすることです。したがって__name__ ==「主」の場合:役割は、どちらの場合も、コードの実行を制御することで、__name__ ==「主」の場合:コードでのみ(すなわち、スクリプトファイルの直接実行など)のみ最初のケースでそれが実行され、他のスクリプトへのインポートは実行されません。

5. CountVectorizerとTfidfVectorizerを達成2つのAPIがあります。

CountVectorizer:
テキストのみに出現する単語の頻度を検討
:TfidfVectorizerの
表示されるテキスト内の特定の単語の頻度に加えて、検討事項の数を、この用語はまた、すべてのテキストの懸念を含み

より重要な特徴をタップし、高頻度語の影響はセンスが表示されますがありません減らすことができます 

6.
コーパスではgensimの基本的な概念であり、文書のコレクションの現れであるも、その後のさらなる処理のための基礎。本質的に、コーパスが実際にフォームまたは契約であり、実際には二次元の行列であります

公開された39元の記事 ウォンの賞賛1 ビュー453

おすすめ

転載: blog.csdn.net/qq_40647378/article/details/103789676
おすすめ