[Baiduの脳手書き文字認識との完全なコードレイダースは、コスト効率に組織を可能にします

要件のI.概要:

インテリジェント情報化時代、中小企業の大半は、ペーパーレスオフィスを実現するために、紙ベースのコンテンツ、データ管理ソフトウェアをデジタル化し、ERPやその他のオフィスソフトウェアを使用していました。しかし、精密検査で、中小企業は、まだ改善することができたいくつかの作業プロセスを持っています。

同社の担当者候補は、候補者は、最初の印刷フォームのときたとえば、その後、ERPシステムに入力された申込書の内容の店員によって最終的に候補者が内容を記入してみましょう、と。その中でも、候補店員コンテンツは、ERPシステムに入力された、このステップは非常に時間のかかる多くの候補同じ日ならば、それは情報を入力する時間店員候補の多くを取るだろう、。

あなたは、ソフトウェアの対応する識別結果にカスタムテンプレート[IOCR文字認識]、識別候補コンテンツのテーブル、および塗りつぶしと組み合わせて、Baiduの手書き文字認識機能を使用するか、または対応するEXCELやその他の電子文書、唯一の店員の必要性を生成することができる場合コンテンツの認識が正しい校正、キーは仕事に良い仕事候補情報、エントリの店員を減らすために多くの作業をすばやく、/負荷を保存行うことができるようになります。

だから、休暇のために書かれた要求と同様に、オフィスの購入注文は、毎日賃金の従業員を詳述し、いくつかのフォームをインテリジェントに作業効率の店員を改善し、大幅に店員の負担を軽減、Baiduの手書き文字認識方法により同定することができます。

加えて、個々のアプリケーションは、個人的な議事録、プレゼンテーションすることができるので、[]関数を使用して、手書き文字認識に、デジタルコンテンツが格納され、永久保存のため[Baiduのネットワークディスク]と組み合わせることができます。彼らは少ししてから、適切なプラットフォームのアップにアップロード仕上げ、テキストデータの] [手書き文字認識機能を使用する場合の作家のように、ペンを記録するいくつかの習慣は、コンピュータタイピングを使用することに慣れていません。

さらに、学校のアプリケーションでは、学生の書き込み教師を補正し、時間がかかり、労働集約的なことは、学生の手書きは異なり、そして時には単なるテキストは非常にそう、労力を消費している学生を識別するために、教師はしばしば多くを費やします学生のテキストを特定するのに最大の努力。[]手書き文字認識機能は、その後、統一標準テキストにデジタル化組成、およびいくつかの[アイ]モード表示や他の方法を取る場合は、大幅に教師は、上のより多くの焦点を、変更エッセイエネルギー消費を読んで教師を減らすために読みやすくイデオロギー的な内容を書いて、可能な場合は、良い記事を見つけた、あるいはどこへ行く全国の大学入試のエッセイの音量を変更するには、このメソッドを使用するようにしてください。


第二に、の値:

1、百度] [IOCRカスタムテンプレート文字認識と組み合わせた手書き文字認識機能を、]を用いて、判定AIインテリジェント誤り訂正および他の機能の前と後、大幅最も中小企業に適した、効率を改善するための事務作業をテキスト入力店員の作業負荷を低減することができます。

あなたは、関数オフライン[の]文字認識を手書きすることができ、あるいは自社のサーバーまでに個別に展開することができた場合2.、それは大きな展望を持っているでしょう。

百度]を助ける3、および永久保存のために他のネットワークディスク[手書き文字認識機能は、スピーチは、[百度と組み合わせるなど、個人/プロテキスト労働者、ノート、デジタル化]を。

4、あなたはとても教師を軽減するだけでなく、マーキングや教師が、組成物のイデオロギー的な内容に集中できるようにするつもりは学生のエッセイに適用され、良い記事を見つけた、とさえボリューム行くを変更するには、国の大学入学のエッセイに拡張[手書き文字認識]を試すことができますエッセイは、仕事のプレッシャーをマーキングするだけでなく、より多くの思考、良い記事の意味合いを見つけることができます。


第三に、使用レイダース

注:この記事はネットコア2.1のためのC#言語の開発環境を使用しています。

1、プラットフォームへのアクセス

特定のアクセスモードは比較的簡単です、あなたは愛情のひよこの宝ポストの度合いを参照することができ、このステップのアプリケーションを[作成]を参照してください、私が使っていたので、バックを使用します(主にAPPID呼び出すときに、使用される他の情報を取得)。ネットコア・プラットフォームのC#、SDKプログラム、それはあなたが時間を持っている場合、私は別のチュートリアルアウトを書きます、ビット異なるです:https://ai.baidu.com/forum/topic/show/867951    (愛のおかげひよこ宝物)

2、インタフェースの呼び出し説明

文字認識アクセス公式ドキュメント(C#、SDKプログラム):https://ai.baidu.com/docs#/OCR-Csharp-SDK/top

(1)インタフェースの説明

手書き漢字、識別のための番号。

 

(2)文字認識C#SDKを取り付けます

方法の一つ:使用Nugetは、依存関係を管理する(推奨)

でNuGetを検索  Baidu.AI、あなたは最新バージョンをインストールすることができます。

パケットアドレス  https://www.nuget.org/packages/Baidu.AI/


方法2:ダウンロードしてインストール 

文字認識C#SDKのディレクトリ構造

Baidu.Aip
├──net35
│├──AipSdk.dll // BaiduのAIサービスウィンドウDLL
│├──AipSdk.xml //注釈ファイル
│└──Newtonsoft.Json.dll //サードパーティの依存
├── net40
├──net45
└──netstandard2.0
├──AipSdk.deps.json
└──AipSdk.dll
1. C#SDK圧縮キットの公式ウェブサイトで:http://ai.baidu.com/sdk#ocr

2.解凍した後、内基準AipSdk.dllとNewtonsoft.Json.dllとして追加されます。


(3)新しいインタラクティブクラス

//セットAPPID / AK / SKの
VaRのAPP_ID = "あなたのIDのApp";
VARのAPI_KEY = "あなたのキーAPI";
VARのSECRET_KEY = "あなたの秘密鍵"。

クライアントの新しい新Baidu.Aip.Ocr.Ocr =(SECRET_KEYのAPI_KEY、)VAR;
client.Timeout = 60000; //タイムアウトを変更します


(4)コードを呼び出します

空HandwritingDemoのパブリック(){
    VAR = File.ReadAllBytesイメージ( "イメージファイルのパス");
    例外、使用のtry / catchキャプチャ投げるかもしれ//コール手書き文字認識、ネットワークなど
    のvar結果を= client.Handwriting(画像) ;
    Console.WriteLineを(結果);
    //オプションの引数
    のvarオプション辞書新しい新しい= {
        { "recognize_granularity"、 "ビッグ"}
    };
    //引数手書き文字認識と呼ばれる
    結果= client.Handwriting(画像、オプション) ;
    Console.WriteLineを(結果);
}


(5)の例に戻ると


{
"LOG_ID":620759800、
"words_result":[
{
"場所" {
"左":56、
"トップ":0、
"幅":21、
"高さ":210
}、
"単語": "3"
}
]、
"words_result_num":1
}


第四に、キーコードの例

1、フロントページレイアウト.cshtml重要なコード

ネイティブコードは、HTMLを表示することができないため、簡単にしか説明します。

メインフォームがフォームである、あなたはそれ以外の場合は、あなたが写真をアップロードすることができない、属性のenctype =「multipart / form-data」を設定する必要があります。

二つの形式のフォームコントロールがあります。

入力、タイプ=「ファイル」、アップロードの写真と、

入力、タイプ=、「提出」を提出し、リターン認識結果。


2、背景.cshtml.csは、重要なコードを呼び出します

      [は、bindProperty]
      [必須]
        公共IFormFileするFileUpload {取得します。セット; }
        プライベート読み取り専用IHostingEnvironment HostingEnvironment。
        公共リストMSG =新しいリスト();
        公共の文字列curPath {取得します。セット; }

        パブリック非同期タスクOnPostHandwritingAsync()
        {
            MSG =新しいリスト();
            //するFileUploadクラス属性違反をキャッチするための初期チェックを実行します。
            (!ModelState.IsValid)であれば
            、{
                リターンページ();
            }

            webRootPath = HostingEnvironment.WebRootPath文字列; // wwwrootディレクトリの
           VAR FILEDIR = Path.Combine(webRootPath、 "のような画像を、保存するためのサーバーの相対的な位置:// BaiduPicture // "を);
            IF(Directory.Exists(FILEDIR)!)
            {
                ディレクトリ。 CreateDirectory(FILEDIR);
            }
           ストリング拡張= Path.GetExtension(FileUpload.FileName);
           文字列imgName = Guid.NewGuid()のToString( "N")+ ;.拡張
           VAR filePathに= Path.Combine(webRootPath、「ピクチャー対向サーバに保存以下のような位置、:// BaiduPicture」、imgName)。

           curPath = Path.Combine(「サーバ・イメージの相対位置(Startup.csファイル内の設定の必要性()最初のセットで、仮想ディレクトリマッピング機能を開く)、例えば:/ BaiduPicture /」、imgName)。

            (VAR FILESTREAM =新規のFileStream(filePathに、FileMode.Create、FileAccess.Write))を使用して
            、{
                のawait FileUpload.C​​opyToAsync(FILESTREAM)。
            }

            //はAPPID / AK / SKの設定
           ; =新しいBaidu.Aip.Ocr.Ocrます( "APIキー"、 "あなたの秘密鍵")新しいVARクライアントを
            VARイメージ=  System.IO .File.ReadAllBytes(filePathに);
            / /コール手書き文字認識、例外、使用のtry / catchキャプチャ投げるかもしれローカル絵、ネットワークなどのための画像パラメータ
            のvar結果= client.Handwriting(画像を); // 手書き文字認識。

            MsgList =リスト[ "words_result"] ToListメソッド();.結果
            ; Msg.Add( "\ N-手書き文字認識結果を")
            foreachの(msgListでJToken MS)
            {
                Msg.Add(MS [ "単語"] ToStringメソッド(。 ));
            }
            ページを返す();
        }
V.試験結果

1、ページ:

2、認識結果:

(1)

(2)

注:レイダーズが、これは操作の処理における、深さの単語ではないので、手書き認識を使用する方法について説明しますので。あなたが認識結果を改善したい場合は、認識結果が文字列に出力され取り、その後、対応するテキストコンテンツ、またはEXCELファイルへの更なる輸出用を抽出するために正規表現を使用することができます。

改善のための六つの勧告

1、質問があります:

(1)部分は、通常の状況下で、それが最後に二つのレコード、一つのレコードとして認識されるべきで、特にテキスト[ - デジタル - テキスト - そのような行数]場合組み合わせ情報、テキストであれば、図面近距離、数字とテキストを識別することが容易であり、改善する必要があります。

そのような「母」として(2)別の例基は個々の単語からなる単語であり、識別が「女性良い」単語として識別され、これも改善する必要があります。(134 ****** 14を思い出させるの友人のおかげで)

(3)現在はややずさんな手書き文字認識率は、改善する必要性は非常に高いものではありません。

由于计算机、手机等电子设备的普及,大部分人都习惯了打字,手写情况大大减少,由此导致很大一部分人写的字龙飞凤舞,比较难以识别(我写的字就很潦草,有时候连自己都无法认出来。。。),而且目前来说,中小企业应聘人员的综合教育水平普遍较低(普工招的比较多),有的甚至不会写字,所以导致手写文字各种各样。经过测试,百度手写文字识别能力虽然比较优秀了,但是离真正应用到实际工作中去还是有一定的距离的。

2、改进建议

(1)结合【IOCR自定义模板文字识别】功能,智能识别模板内容,格式化提取内容,方便开发人员调用(目前好像已支持手写数字识别,希望能更快增加支持手写文字识别)。

(2)如果能格式化输出内容,或一键导出EXCEL电子文档等功能,则更加方便跟EPR等软件的对接。

(3)可以运用AI技术,结合前后文智能识别错别字,修正错误或语句问题,提高识别结果。

(4)若能将【手写文字识别】功能离线话,或可以部署到企业自己的服务器上去,会有更多的企业愿意尝试,也能将【手写文字识别】功能运用到【财务报表】等保密性要求较强的方向中去。

(5)将【手写文字识别】和【百度网盘】、【护眼模式】等工具结合起来,实现个人/专业文字工作者的笔记、演讲稿、作文等内容的数字化存储,方便观看阅读。

作者: 让天涯

おすすめ

転載: www.cnblogs.com/AIBOOM/p/12020106.html