中国の分析の講義を読み取るためのpythonを取得

 

 

 

 

 

 これは、直接ではなく、書き込みよりも、関数名を使用することができ   、ライブラリ名機能名

あなたのプログラムは、同じ名前の関数を持っている場合、コードが実行されている、仕事はその関数の最後の宣言です

ライブラリ名が長い場合は、エイリアス(使用機能のライブラリ別名をより便利になります)

 

タイプワードはLSにリスト保存タイプで生成されます

jiebaは非常に良い中国のサブシソーラスあります

中国語のテキスト・ワード操作の場合は、生成された単語を含むリストを生成します

jiebaは、サードパーティのライブラリ、追加のインストールが必要です

jiebaライブラリがインストールされています:

(CMDコマンドライン)jiebaをインストールするPIP

正常にインストールjiebaは正常にインストール後にプロンプ​​トが表示されます

あなたはアイドルをインストールすると、インストールされたサードパーティライブラリをネットワーキングピップできるツールが付属しています

2行目は、単語全体ですべての可能な列挙単語がある冗長性があり、

最後の行のjieba.add_word(w)は辞書jiebaポイントに新しい単語を追加することで、それはなります

 

コンピューティングエコシステムプログラミング

まず、コンピューティングの巨大なのpythonを活用するエコシステムは、生産性を向上させるプログラミング

  • Python言語に加えて、Pythonのライブラリの数の数の使用を習得します
  • いくつかのために「共通の問題」、Pythonライブラリを見つけるために、学ぶために
  • http://pypi.orgこれは、サードパーティの公式のPythonライブラリ・インデックス・エンジンによって維持され、14万人以上のサードパーティのライブラリがあります

 

第二に、完全なプログラミングパイソン周りのコンピューティングエコシステム

  • プログラミングタスクの完了の枠組みの中でより重要なのpython・コンピューティング・エコシステムと組み合わせることで
  • たとえばます:pythonと組み合わせた深い学習アプリケーションを実行するには
  • たとえば、次のように書いたアプリケーションのための爬虫類組み合わせScrapyフレームワークを

第三に、ビルドPythonライブラリのPythonの豊富なコンピューティング・エコシステム

  • 新しい理解と意識、ビルドPythonのコンピューティング・エコシステムのための
  • 下地層は、インタフェースパイソンを与え、C / C ++言語等を利用することができます 

 

#WordCount.py
import jieba as ja #导入jieba中文分词库给别名ja
f = open("file1.txt","r",encoding="utf-8") #打开文件,并给出解码方式
txt = f.read() #
f.close() #关闭文件
ls = ja.lcut(txt)
d={}             #创建了一个空字典,键值对的集合
for w in ls:
    d[w] = d.get(w,0)+1 #建立每个词与出现次数的键值对
	
for k in d:               #将d中的每一个键读出,使用d[k]获得它的值
    if d[k] >= 50 and k != "\n":
	    print('"{}"出现{}次'.format(k,d[k]))  #k是这个词,d[k]是通过字典查到对应的值

 

辞書はキーと値のペアの組み合わせとして具現化、マッピングの組み合わせである
マッピングがある(インデックス)と値(データ)に対応します

 

d.get(<キー1>、0)#この行は見つけることが辞書にある鍵1つの値を、

もしキー1つの実質リターン対応する値、

何も存在しない場合、キー1、2番目のパラメータは、0を返します。

 

 

 

 

 

 

 

 

 

公開された101元の記事 ウォン称賛73 ビュー120 000 +

おすすめ

転載: blog.csdn.net/usstmiracle/article/details/104455189