無料のOCR画像認識テキスト認識API

1. OCR画像認識とテキスト認識

光学式文字認識 (OCR) は、テキスト素材の画像ファイルを分析および認識して、テキストおよびレイアウト情報を取得するプロセスを指します。つまり、画像内のテキストが認識され、テキストの形式で返されます。

自然シーンでのテキスト認識は非常に困難です。その理由としては、画像の背景は非常に豊かで、低輝度、低コントラスト、不均一な照明、遠近感の歪み、不完全なオクルージョンなどの問題に直面することが多く、さらにテキストのレイアウトが乱れることがあります。問題は、テキストのフォント、サイズ、太さ、色が異なる可能性があることです。

ここに画像の説明を挿入

2. 利用手順

1. インターフェース

注意事項: https プロトコルの使用を推奨します。https プロトコルが使用できない場合は、http プロトコルを使用してください。

リクエストメソッド:POST

https://luckycola.com.cn/aiTools/imgOcr

2. リクエストパラメータ

重要な注意事項⚠️ : このインターフェースのリクエストパラメータはmultipart/form-data形式です⚠️

シリアルナンバー パラメータ それは必要ですか 説明する
1 コーラキー はい ColaKey の唯一の検証は、公式 Web サイト ( http(s): //luckycola.com.cn )から入手できます。
2 ファイル はい 識別する必要がある画像リソース (png、jpg、jpeg 形式) 注: このインターフェイスのリクエスト パラメーターはmultipart/form-data形式です。
3 ラング いいえ 現在検出された画像の内容は中国語ですか、英語ですか? 中国語の場合はパラメータ値を渡さず、英語の場合は「eng」と入力し、値を正しく設定してください。

注!!!: ColaKey をまだお持ちでない場合は、公式 Web サイトのパーソナル センターにアクセスして入手してください。
公式 Web サイトのアドレス: http(s): //luckycola.com.cn/

3. リクエストパラメータの例

重要な注意事項⚠️ : このインターフェースのリクエストパラメータはmultipart/form-data形式です⚠️

ここに画像の説明を挿入

4. インターフェースの戻り例

{
    
    
	// 接口返回成功
	"code": 0,
	// 接口返回提示
	"msg": "OCR识别成功",
	"data": {
    
    
		// 图片OCR识别出来的文本内容
		"text": "LC 官 网 部 分  、AI 聊 天 接 口"
	}
}

3. ヒント

OCR コンテンツ認識の精度を大幅に向上させるために、次の点に注意してください。

  1. 認識される画像は、できるだけ鮮明で識別しやすいものである必要があります。
  2. 認識された画像にできるだけ多くのコンテンツを集中させるようにしてください。
  3. 認識された画像のコンテンツには 1 つの言語のみが含まれている必要があり、API パラメーターは lang に対応する値で正しく渡される必要があります。

おすすめ

転載: blog.csdn.net/qq_48896417/article/details/132520827