デジタル チェーン テクノロジーは、フライング パドルと Wenxin 大型モデルを使用してバルク商品のデジタル サプライ チェーン システムを構築し、業界の透明性と標準化を向上させます。

一次産品産業は巨大な市場規模を有し、国民経済と国民生活に関係しており、その中核となるエネルギー商品、基礎原材料、農産物及び副産物の三分野はいずれも我が国の経済発展の過程において極めて重要な役割を果たしている。発達。中でも、商品サプライチェーンの円滑な運営と安定した発展は、産業チェーン全体の運営にとって極めて重要です。

しかし、従来のバルク商品サプライチェーンには 2 つの大きな問題があります。 1 つは取引リンクが不透明でありビジネスプロセスが標準ではない1 つは取引チェーン内の各ノードの情報が相互に接続されておらず、それぞれが情報の島を形成していることです。 ; 貿易プロセスにおける契約、請求書、商品の品質、資本の流れ 課税や税金などの面で関連する基準や規制に厳密に従うことは多くの場合困難であり、一般に取引情報の手動処理に依存しています。この2つの問題により、各リンクにおける情報の相互検証が不可能となり、情報流通の効率が低下し、商品サプライチェーンの高度化・効率化が制限されるだけでなく、業界内で不正・不正事件が多発しています。 、業界の発展に深刻な影響を与えます。

Digital Chain Technology は、人工知能などの先進技術を使用してバルク商品のリアルタイム取引のデジタル化を実現することに特化した企業で、パドルテキスト認識開発キットPaddle OCRと自然言語処理モデル ライブラリPaddle NLPと管理システムオフライン文書認識シナリオの問題に焦点を当て、Paddle NLP のユニバーサル情報抽出モデル UIE-X (大規模文書インテリジェンス モデルである Wenxin ERNIE -Layoutをモデル ベースとして使用) に基づいて、ERNIE -Layout は強化されたレイアウト知識を革新的に導入します。さまざまな上位レベルのアプリケーションに SOTA モデル ベースを提供し、非標準ドキュメントの識別とキー フィールドの抽出を通じて、供給における情報障壁を打ち破ります。バルク商品のチェーンを構築し、システムデータの品質を向上させ、取引効率を大幅に向上させます。

非標準文書のデジタル化を入り口として「不透明かつ非標準」の情報の壁を打ち破る

商品業界への深い理解と業界のサプライチェーンの問題点への洞察に基づいて、デジタルチェーンテクノロジーチームは、商品取引の効率をアップグレードおよび改善するには、まずすべての取引情報が重要であることを痛感しています。効率的かつ正確にデジタル化する必要があります。

「従来の商品サプライチェーンでは、物流請求書や契約書などの取引情報は物理的なオブジェクトの形で存在し、手動で写真を撮り、アーカイブし、手動で入力する必要があります。問題が発生すると、手動でレビューし、状況を後戻りする必要があります。 Shulian Technology の社長補佐である Zhang Yue 氏は、「各企業の文書標準が異なることがよくあります。つまり、オフラインの非標準文書が多数あり、手動で入力する必要があります」と紹介しました。人工知能は、非標準文書のデジタル化の効率を改善し、それを入り口として業界全体のデジタル アップグレードを促進する方法を見つけられることを期待しています。テクノロジーは私たちの最良の選択です。」

デジタルチェーンテクノロジーチームは、ビジネスプロセスと組み合わせて、非標準文書のデジタル化を実現するためのテキスト認識と情報抽出の分野に焦点を当てます。しかし、調査の結果、チームはテキスト認識技術のサプライヤーがすでに市場に存在しているものの、大量の商品のサプライチェーンを開発するためのソリューションがほとんどないことを発見しました。バルクサプライチェーンのすべてのリンクでは、商品とその輸送および取引情報を記録するために多数のオフラインフォームが必要です。しかし、企業間で文書の形式には大きな違いがあり、統一された業界標準はなく、機械で印刷された文書と手書きの文書が混在していることがよくあります。それだけでなく、バ​​ルク商品は他の一般商品とは異なり、商品記録には日常の生産や生活ではあまり使用されない特殊な文字が多数含まれています。市場にあるソリューションモデルは一般に、特殊文字などの業界データのトレーニングが不足しており、さまざまな非標準形式の正確な識別や情報抽出と分類をサポートすることが困難であるため、情報識別効率が低くなり、現在のビジネスニーズを満たすことができません。

従来の非標準書類の例: 各社の自動車請求書 一方、外部サプライヤーからの製品の購入も融通が利かず、システムのアップグレードではサプライヤーとの連絡や調整に多くの時間がかかり、サプライヤーが人的資源をサポートできない場合、実用化の進展に深刻な影響を与えるだろう。したがって、効率的で柔軟な製品を自己開発することがチームにとって最優先事項となっています。

フライングパドルテクノロジー + エコロジーにより、非標準文書認識の効率が 20 倍向上します

最終的にチームは、テキスト認識開発キットであるPaddle OCR、自然言語処理モデル ライブラリであるPaddle NLP、およびユニバーサル情報抽出モデルである UIE-X に基づいて自己研究プロジェクトを実行することを選択しました。Paddle OCRが提供する豊富で実用的なツール ライブラリを通じて、大量のサプライ チェーンの非標準ドキュメントの認識モデルがトレーニングされ、 Paddle NLP を介した UIE-X の呼び出しに基づいて、独自のデータセットを使用して微調整します。これにより、トレーニングと開発のコストが大幅に削減されます。全体的な技術的ソリューションは次の手順に要約できます。

  • ビジネス文書の種類を徹底的に調査し、既存の膨大なサンプルに基づいて抽出すべき重要な情報を明確にし、キーワード抽出ルールを設定します。

  • Paddle OCR、Paddle NLP、UIE-Xに基づいてモデル分析を実施し、対応するキーワード抽出ルールを開発します。

  • モデルのトレーニングはデータ アノテーションとモデルの評価を通じて実行され、ルールの最適化はビジネス フィードバックを通じて実行されます。

研究開発プロセス図

テキスト認識プロセスにおいて、従来の光学式文字認識プロセスは、画像の前処理(カラー画像のグレースケール、二値化処理、画像変化角度検出、補正処理など)、レイアウト分割(直線検出、傾き検出)、文字の位置決めとセグメンテーションです。 、文字認識、レイアウト復元、後処理、校正など。パドルテキスト認識開発キットPaddle OCRを使用すると、まず入力のしきい値が下がり、最も基本的な光学式文字認識理論が必要なくなります。第 2 に、Paddle OCR には豊富なコンポーネントと一連の基本的な事前トレーニング モデルが備わっています。テキスト検出とテキスト認識 AI を使い始める際の難しさを軽減します。開発者は、一定レベルの Python 開発能力があれば、オープンソース モデルに基づいてテストとチューニングを行い、最終的にデプロイを完了して短期間で起動できます。

自然言語処理モデル ライブラリ Paddle NLP のクロスモーダル ドキュメント ユニバーサル情報抽出モデル UIE-X は、Wenxin の大規模モデルに基づいており、プロのラベル付けチームが存在しない場合は、小規模なサンプル トレーニングを使用してカスタマイズされた開発を実施し、コストを節約します。多額のラベルです費用 これに基づいて、Datalink は数十の契約サンプルを準備し、ラベル付けとトレーニングにPaddle Smart Labeling Paddle Labelを使用するだけで、最終的な重要情報抽出精度は 87.5% に達します。

導入プロセス中、Paddle OCR は HubServing サービスをサポートし、Paddle NLP は SimpleServing サービスをサポートし、推論を高速化し、ワンクリックでの導入を可能にする半精度推論モードをサポートします。また、CPU と GPU の複数のサーバー展開もサポートしているため、テスト中のデバッグの困難さが軽減されます。導入プロセスでは、Docker のワンクリック インストール方式を使用するため、運用と保守の導入の負担が軽減されます。
最終的に、プロジェクトチームは、バルク商品のデジタルサプライチェーン向けのインテリジェントな識別および管理システムの開発に成功し、バルク商品サプライチェーンにおけるオフライン文書の認識シナリオの下で、オフラインの非標準文書の識別と抽出重要なフィールドが実現され、大幅に改善されました。 関連文書の手動補足記録の効率が向上しました。オフラインの契約書を手動で再記録するには5分程度かかっていましたが、現在は手動で結果を確認して部分的に修正するだけで済み、その時間は15秒未満に短縮され、認識効率は20倍に達しています。オリジナル。

デジタルリンクテクノロジーの導入により、このシステムを使用しているある企業の情報入力担当者は、月次業務が最も集中する時期に、入力が必要な非定型文書が集中して大量に発生することが多いと報告しました。通常、その部門の同僚 3 人は 1 日あたり 4 時間以上の残業をする必要があります。現在、バルク商品のデジタル サプライ チェーンのインテリジェントな識別および管理システムを使用することにより、ビジネスの最も忙しい時間帯であっても残業に別れを告げ、より専門的な業務を完了するためにより多くの人員を解放することができます。同時に、手動入力から機械認識への変更により、データの精度も大幅に向上しました。以前は四半期ごとに平均10~15件の入力ミスが発生し、重大な入力ミスでは支払金額のミスも発生していましたが、現在は一切発生していません。全体的なビジネスレベルが向上し、会社の発展はより健全になりました。

このプロジェクトは、バルク サプライ チェーンの典型的なテーブル認識シナリオでうまく機能しました。チームはラベル付けフォーム認識モデルを再トレーニングし、単一行データを抽出してセルの次元で出力を修正し、最終的にフォーム認識精度を 87% から 98% に向上させ、契約書におけるフォーム認識の精度を大幅に向上させました。大量の商品のビジネス シナリオでは、多数の表形式の文書 (財務報告書、鉄道の切符、請求書、重量リスト、検査機関の証明書など) の情報抽出が非常に重要です。

Zhang Yue 氏は、フライング パドルの生態コミュニティの存在も、チームが開発にフライング パドルを選んだ重要な理由であると述べました。「フライング パドルコミュニティは、画像の不正行為防止、署名の比較、その他のシナリオなど、多くの業界の例を提供します。同時に、業界における技術応用の最新の開発状況をタイムリーに入手することにも役立ちます。それだけでなく、研究開発の過程で技術的な問題に遭遇したときにも、フライングパドル専門的な研究開発チームと運営チームから常にタイムリーなサポートを得ることができます
。」現在、デジタルチェーン技術のデジタルサプライチェーンのインテリジェント識別管理システムは、バルク商品の自動識別と情報抽出を実現しています。 -オフライン契約、鉄道切符、トラック重量請求書などの標準文書を提供し、1,000 社以上の石炭会社に提供しています。商品、食品、その他の商品の分野で、さまざまな規模のサプライチェーン企業に商業サービスを提供しています。

継続的な改善と改善により、より多くの中小企業に力を与える

Zhang Yue氏は開発計画について、デジタルチェーンテクノロジーのバルク商品のデジタルサプライチェーンインテリジェント識別および管理システムは、2つの主要な側面で引き続きアップグレードおよび拡張されると述べた。

一つは、システムそのものの製品力と技術力を継続的に向上させることです。一方で、システムが「役に立つ」だけでなく「使いやすい」ものとなるよう、ユーザーエクスペリエンスの最適化を継続し、より多くの顧客が喜んで使用できるようにし、業界のデジタルトランスフォーメーションを共同で推進します。一方で、システムの境界を拡張し、可能な限り多くの商品とさまざまなシナリオのビジネス ニーズをカバーし、一般化されたサービスを提供します。

2 つ目は、モノのインターネット、ブロックチェーン、その他のテクノロジーを組み合わせてスマート ウェアハウスのモノのインターネット プラットフォームを構築し、バルク製品取引における複数の関係者が関与する取引プロセスに改ざん防止、追跡可能、信頼できる記録を提供することですこのようにして、サプライチェーンのデータと金融サービスが接続され、幅広い中小規模の商品サプライチェーン企業が銀行融資などの金融サービスを受けるために必要な支援を提供し、「困難で高価である」という企業の悩みを解決します。融資」。

「デジタルチェーンテクノロジーは、商品業界、財務、技術の経験を持つ上級管理者によって始められました。私たちは、技術の応用を通じて商品のサプライチェーンを強化し、商品取引の透明性を高め、中小企業への資金調達をより効率的にします」 Zhang Yue 氏は、「将​​来的には、 Baidu Fei Paddleおよび Wenxin Big Model との協力を強化し、バルク物流サプライ チェーン プロセスの自動化とインテリジェントな監視のレベルをさらに向上させたいと考えています。 AI テクノロジーとリスク評価モデルを通じてデータ マイニングを構築し、より多くの中小企業が金融支援の機会を獲得できるようにします。」

高度な AI テクノロジーを導入し、業界にデジタルかつインテリジェントな変革をもたらし、コモディティ業界の「不透明で非標準的な」障壁を打ち破ることが業界のトレンドとなっています。フライングパドルとウェンシンビッグモデルはまた、より多くのサプライチェーンサービス企業と連携して、引き続き業界の変革とアップグレードを支援し、コモディティ業界における人工知能の道を模索し、経済的および社会的価値を創造していきます。

記事参照

https://github.com/PaddlePaddle /パドルNLP/tree/develop/applications/information_extraction/ document

https://github.com/PaddlePaddle /パドルocr _

関連書籍

宝武中南鉄鋼は空飛ぶパドルの助けを借りて、鉄筋のオーバーランを監視するための「黄金の目」を備えています。

長江デルタの生物医学産業は加速しており、革新的な製薬会社や医療技術パートナー向けの空飛ぶパドルとプロペラにはAI大型モデルエンジンが搭載されています

フライングパドル技術を使用してスクラップ鋼選別業界の新しいパターンをリード

銀行のインテリジェントな事件防止: 「AI テクノロジー防御」を使用して違反の抜け穴をふさぐ

リアルタイム性が2段階にアップ!フライング パドル PaddleSpeech により、財務二重記録ビジネスのインテリジェント化が可能になります

{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/4067628/blog/8881615