徐Lijun 20190912から3単語頻度統計

この仕事のための要件を参照https://edu.cnblogs.com/campus/nenu/2019fall/homework/6583

私のコードの送信元アドレス:https://xulijun.coding.net/p/countwords/d/countwords/git

Wordの周波数統計SPEC 20180918

1.機能1 

小さなファイル入力。プログラムファイルの統計情報と、各単語の出現の統計的頻度の単語の合計量によって、同一のワードカウントしないの繰り返し総数に、単語の2つの存在は1回と呼ばれます。

1.1主な難しさ:

(1)コンソール・コマンドラインパラメータを入力するために対象に、Pythonコードは、コンソールで直接実行することができないので、私は、情報へのアクセス権を持っているのpythonコマンドラインパラメータがsys.argvの[]使用取得さ理解します。

辞書場合は、特殊文字を削除したいテキスト内の(2)最初の単語頻度統計単語、私はスペースに置き換え文書、特殊文字、それらのすべてをフィルタリングするために正規表現を使用し、その後、ループ、各単語の単語の頻度を決定そこに言葉+1を。

コードは以下の通りです

DEF getFrequency(TestText):
    TestTextは re.sub =(' [^ A-ZA-Z0-9n]を''  '、TestText)  英数字以外の文字を削除する特殊な 
    周波数} = {   #は、単語頻度辞書を定義
    するためのWord  testtext.splitは():   #1 サイクル各単語頻度統計を
        IFワードにおける周波数:
            周波数[単語] + 1 =。
         
            周波数[ワード] = 1つの。
    周波数 =ソート(frequency.items()、キー= ラムダ X:X [1]、リバース= TRUE)   (各単語の用語頻度)は、辞書値に従ってソート

 

1.2の効果を示します

2.機能2

英語は、してくださいファイブ個人的にエントリを作品にサポートコマンドラインでは、ファイル名を入力します。

2.1キーと困難

ファンクションつは、関数または2を実行する機能を決定するためのパラメータsys.argvの[1]「-s」と等しい使用して、情報へのアクセスを通じて、サフィックスTXTせずにファイル名を入力するように私に尋ねました。

コードは以下の通りであります:

DEF メイン(ARGV):
     IF   [1] sys.argvのの== ' -s '    # '-s'に等しいかどうかを確認するためにコマンドラインパラメータを取得し
        (sys.argvの[doCount用 2] ,. 1 ELIFの os.path.isdir( sys.argvのの[1。)]:
        fileFindAndCount(sys.argvのの[)1。]: は、フォルダ内のファイルを読み込み
    、他
        [doCount(sys.argvののために。1]、2)

 

 

2.2効果ショー

3.機能3

サポートコマンドライン、ファイル、バッチの統計情報を格納し、英語作品にディレクトリ名を入力します。

3.1キーと困難

フォルダのパスを決定する方法を入力され、フォルダを横断する()メソッド、os.listdirと()メソッドをos.path.isdirことができます。

コードは以下の通りであります:

ELIF os.path.isdir(sys.argvの[1 ]):
        fileFindAndCount(sys.argvの[ 1 ])

DEF fileFindAndCount(パス1):
    ファイル = os.listdir(パス1)
     のためのファイルのファイル:
         もしos.path.isfile(ファイル):
           doSomeFileCount(ファイル)

 

 

3.2の効果を示します

4.機能4

コンソールから、これは自分の顔ファイブを作ることではなく、英語のシングル作品を読み、それにあなたのガールフレンドのため
のクールの友人、あなたが埋め込まれたスクリプトのためのより適切な提供することができますショーは動作します(または、彼女が言ったように、より多くのフレキシブル
インターフェイス)。にもかかわらず、Linuxのリダイレクション:あなたが要求を読み取ることができない場合は、シニアシニア姉妹見習い、またはビングに相談し
、この機能は、Linuxが急速に好意を見つけるためにキーワード検索を追加して、窓の下にもあります。

4.1キーと困難

Baiduのと高齢者がコンテンツをリダイレクト頼む、基本を理解しますが、正常にコンパイルすることができなかった、私はこの機能の準備を完了させるために努力しています。

PSPテーブル

概要:最初の関数の先頭、情報、長い時間へのアクセスに起因するため、限られた容量と第4の時間関数には、ジョブが終了した場合でも、正常にコンパイルされていないと私は彼を書き出すように努力していきます。

 

おすすめ

転載: www.cnblogs.com/xulijun811/p/11536904.html