コアー、WERの精度を比較して計算するPythonスクリプトツール2 txtファイルのテキストの二種類を用いて、精度

A. 準備:

ソースファイルのLinuxサーバ、src2mlf.py rec2mlf.py HRESULTS文書、部品1および1部は、文書を比較する必要があります。これは、クラウドディスクにファイルを配置しました

II。どのように使用するには:

1.比較ツールのHRESULTSは、Linux環境で実行する必要がある、とだけMLFファイルの比較をサポートしている
TXTファイルはMLFファイルに変換、2州Pythonスクリプトツールsrc2mlf.pyとresult2mlf.py
結果ファイル、元のテスト・セットにSRCファイル認識結果として
ファイル形式:(行あたりのtxt:スペース+ +文字列の数)
1列1つの
G2文字2
。3 ...
3.pythonのpython3スクリプト・バージョンに必要な
4 runメソッド:
原稿MLFのテストセットを生成します:のpython3 src2mlf.py xx.txt> xx.mlf
生成された認識結果のMLFファイル:へのpython3 result2mlf.py xx.txt> xx.mlf
5. MLFはsrc.mlfにファイル準備に必要なコントラストとresult.mlf例えば、
実行HRESULTSは、営業成績は、画面に印刷
./HResults -t -I src.mlfを/ dev / null result.mlf
1.TXTファイルを実行し、結果を保存し、実行しHRESULTS
./HResults -t -I SRCを。 MLFは/ dev / nullにresult.mlf> 1.TXT

 

III。変換スクリプトの内容

- * -コーディング:UTF-8 - * - 
インポートOS、SYS 

DEF to_mlf(XI):
    DX = {
        " 0 "" " " 1 "" " " 2 "" " " 3 "" " " 4 "" " "5 """ " 6 "" " " 7 "" " " 8 "" " " 9 "" " 
    }; 
    D = [] 
    ENG = [] 
    TX = [ " "" " " " " " " " " " " "' ; '' '' '' '' ' ' ' ];
     のためのx におけるXI:
        U = x.encode(" UTF-8 " #1 プリント( "2"、u)の場合は U 
        TX:
             続けます場合 lenは(U)== 1 もし X におけるDX:
                U = DX [X] .encode(" UTF-8 " 
            eng.append(STR(U、エンコーディング = ' UTF-8 ' ))
         もし LEN (ENG)> 0:
                d.append("" .join(ENG).upper())
                ENG = [] 
            d.append(STR(U、エンコーディング = ' UTF-8 ' ))
     ならLEN(ENG)> 0:
            d.append("" .join(ENG).upper())
     戻りDの

デフfn_to_lab(S):
    X = s.split()
     のための I におけるX:
        D = to_mlf(i.strip ())
         場合 LEN(D)> 0:
             印刷" \ n " .join(d)参照)
     、印刷' ' 
FN = sys.argvの[1 ]
 印刷' #MLF#!' のための L 
オープン(FN):
    L = l.strip()
    X = l.split()
    K = X [0] .strip()
    V = "  " .join(X [1 :])
    T = " " .join( k)を
     印刷' "*ノー%のs.lab" '%のトン)
    fn_to_lab(V)

 

 

IV。テスト結果

====================== HTKの結果分析=======================
日:月8月26日午後04時29分42秒2019
参考:src_1.mlf
レック:hori.mlf
------------------------全体の結果----- ---------------------
SENT:%修正= 77.00 [H = 385、S = 115、N = 500]
WORD:%コアー= 97.26、開度Acc = 97.01 【H = 8034、D = 54、S = 172、I = 21、N = 8260]
============================= ======================================

おすすめ

転載: www.cnblogs.com/yinlili/p/11417082.html