HTWCore Winフォームのクライアントプログラムの.NETのコアに基づいており、オーディオおよびビデオソースにそうミーティング、レコード、セミナー、講演会のさまざまなを処理するために使用することができ、音声認識の使用は、映像コンテンツ抽出技術は、ワード文書に編成します。次の技術を使用したプロジェクト:
- .NETのコアに基づいて、ひいてはWindowsプラットフォームの様々なバージョンのために使用することができるクロスプラットフォームのプログラムであり、将来的には、MACプラットフォームをLinuxのに適合します。インストールから、パフォーマンスが比較的高い、単一のファイルにパッケージ化。
- オーディオ分割、ボリューム処理、オーディオ及びビデオデコーディング、トランスコーディング、オーディオとビデオのノイズ低減、映像音声とビデオフレーム抽出処理を使用します。
- 現在の主要な音声認識技術の使用は、現場に音声会議、録音、講演会などを識別することができます。
- 文字を区別するための識別技術を使用することで、自然、読みやすい文書を整理、声紋を記録しました。
- 音声認識処理は、各単語のタイムコードに記録された字幕ファイルを追加し、SRTファイルを生成するために使用することができます。
- テキスト分析、自然言語処理技術、ワープロ、自然追加句読点の種類を使用します。
- 抽出ビデオ2つの画像を比較するためのアルゴリズム、除去(構造類似性は、2つの画像の類似性の尺度である)字幕が最初のビデオフレームを含む有効なテキスト画像に分離し、次いでSSIMとの類似性に基づいて埋め込み同様の高い写真やパフォーマンスを向上させます。
- ビデオフレームOCRは、テキスト画像と自然の様々なシーンを扱うことができる、など中国語、英語、日本語、韓国語、することができ、また、バイリンガルテキストことができ、バイリンガルブランチ抽出結果が表示されます。
- テキスト類似度アルゴリズム、効果的にデエンファシスを使用してテキストの内容。
- 結果はテキスト処理ソフトウェア一般的に使用される単語、ワードラップ、インデント、ドキュメントの内容読みやすくするためとしてエクスポートされます。
次のようにHTWCore効果は次のとおりです。
-
テキストボックスにオーディオおよびビデオファイル。
- これは、直接識別することができたり、オーディオおよびビデオ処理かもしれません。
- 「ことば」ボタンをクリックして、表示を進めます。
- オーディオとビデオの同じディレクトリにワープロ文書によって生成された結果は、オーディオの1時間は10分未満で結果を取ります。
95%以上の良好な音声品質認識精度率。
- 字幕を組み込み、最初のショットは、範囲を額装。
左のフレームを調整すると、楕円形のテキストサブタイトル右のスライダの調整範囲を表示されます。
其余功能可直接使用,不一一说明了。
HTWCore下载:
链接: https://pan.baidu.com/s/12A7ot2kZkYIoekPi5U9tMw 提取码: es72