A. 準備:
ソースファイルのLinuxサーバ、src2mlf.py rec2mlf.py HRESULTS文書、部品1および1部は、文書を比較する必要があります。これは、クラウドディスクにファイルを配置しました
II。どのように使用するには:
1.比較ツールのHRESULTSは、Linux環境で実行する必要がある、とだけMLFファイルの比較をサポートしている
TXTファイルはMLFファイルに変換、2州Pythonスクリプトツールsrc2mlf.pyとresult2mlf.py
結果ファイル、元のテスト・セットにSRCファイル認識結果として
ファイル形式:(行あたりのtxt:スペース+ +文字列の数)
1列1つの
G2文字2
。3 ...
3.pythonのpython3スクリプト・バージョンに必要な
4 runメソッド:
原稿MLFのテストセットを生成します:のpython3 src2mlf.py xx.txt> xx.mlf
生成された認識結果のMLFファイル:へのpython3 result2mlf.py xx.txt> xx.mlf
5. MLFはsrc.mlfにファイル準備に必要なコントラストとresult.mlf例えば、
実行HRESULTSは、営業成績は、画面に印刷
./HResults -t -I src.mlfを/ dev / null result.mlf
1.TXTファイルを実行し、結果を保存し、実行しHRESULTS
./HResults -t -I SRCを。 MLFは/ dev / nullにresult.mlf> 1.TXT
III。変換スクリプトの内容
#- * -コーディング:UTF-8 - * - インポートOS、SYS DEF to_mlf(XI): DX = { " 0 ":" 零" 、 " 1 ":" 一" 、 " 2 ":" 二" 、 " 3 ":" 三" " 4 ":" 四" "5 ":"五" " 6 ":" 六" " 7 ":" 七" " 8 ":" 八" " 9 ":" 九" }; D = [] ENG = [] TX = [ " 、"、" 。" " !" " )" " 、" " 。" " !"、' ; '、' '、' :'、' ?'、' 『' ' 』' ]; のためのx におけるXI: U = x.encode(" UTF-8 " ) #1 プリント( "2"、u)の場合は U で TX: 続けます。 場合 lenは(U)== 1 : もし X におけるDX: U = DX [X] .encode(" UTF-8 " ) eng.append(STR(U、エンコーディング = ' UTF-8 ' )) 他: もし LEN (ENG)> 0: d.append("" .join(ENG).upper()) ENG = [] d.append(STR(U、エンコーディング = ' UTF-8 ' )) ならLEN(ENG)> 0: d.append("" .join(ENG).upper()) 戻りDの デフfn_to_lab(S): X = s.split() のための I におけるX: D = to_mlf(i.strip ()) 場合 LEN(D)> 0: 印刷(" \ n " .join(d)参照) 、印刷(' ' ) FN = sys.argvの[1 ] 印刷(' #MLF#!' ) のための L で オープン(FN): L = l.strip() X = l.split() K = X [0] .strip() V = " " .join(X [1 :]) T = " " .join( k)を 印刷(' "*ノー%のs.lab" '%のトン) fn_to_lab(V)
IV。テスト結果
====================== HTKの結果分析=======================
日:月8月26日午後04時29分42秒2019
参考:src_1.mlf
レック:hori.mlf
------------------------全体の結果----- ---------------------
SENT:%修正= 77.00 [H = 385、S = 115、N = 500]
WORD:%コアー= 97.26、開度Acc = 97.01 【H = 8034、D = 54、S = 172、I = 21、N = 8260]
============================= ======================================