数美科技告诉你什么样的视频审核将会被AI替代?| 数美人工智能研究院

数美科技告诉你什么样的视频审核将会被AI替代?| 数美科技人工智能研究院

视频创作者通常会抱怨:“为什么我周三上午上传的视频,还一直在审核中,怎么审核过得这么慢?”

当前,对于UGC、PGC视频创作者而言,最关心的莫过于自己产出的视频内容什么时候可以快速过审上线,如果能达到秒级发布就更好了。

而视频平台的视频审核员,面对的却是各类海量视频内容,其中不乏暴恐、涉政、辱骂、低俗、敏感词等违法违规视频内容,有限的人力审核远远不足以满足创作者的即发即审、即审即过。

这是一种典型的供需关系不平等的发展现象,由于供不应求,不仅会引发一系列的问题,还会在视频平台和视频创作者之间造成矛盾关系,而一旦出现审核出错、失误的情况,也会直接引发用户的强烈不满,最终也将导致视频平台对与优秀UGC、PGC作者人群的重度流失,最为严重将导致视频平台的下架、关停。

数美科技人工智能研究院长期深耕大数据AI技术的研发创新,针对各类用户视频审核难、审核慢等一系列的问题,数美科技人工智能研究院对“视频审核”的工作流程、AI视频审核技术开发、解决方案等方面进行了深入的研究与探讨。

视频审核发展现状

最初的视频审核工作流程是先发布后审核,新兴视频平台鼓励用户自由创作各种视频内容,但是随着UGC内容创作的越发丰富,视频审核平台面临的视频审核挑战也在不断升级。

同時に、全国的なネットワーク監督部門が必要とするポルノ、政治関連、違法、暴力、デリケートな言葉などのコンテンツ、およびプラットフォーム自体の利益を損なう広告の流用は、間違いなくレビューのプレッシャーを増大させます。したがって、UGCコンテンツのフォームの多様性により、コンテンツのレビューとフィルタリングが非常に困難になり、特にビデオの非構造化データのコンテンツを識別するのが非常に難しくなります。

大規模な短いビデオプラットフォームYunfei(仮名)を例に挙げます。同社には1,000人の監査人がいて、24時間ビデオをレビューする必要があります。何千万ものビデオ作品が毎日見直されるため、採用を増やす必要があります。監査を強化し、3,000人以上採用します。

ここに画像の説明を挿入
プロセスとルールを確認する

通常の状況では、雲飛は予備審査と審査に対応するために7つの並行審査部門を設置します。ユンフェイの舞台裏でクリエイターがアップロードした動画は、これらの7つの部門に同時に送信され、クロスチェックが行われます。部門の動画監査員は、監査規則と規制に従って、毎日2回の繰り返しの長い勤務体制を開始します。

レビューには24時間の中断がないため、平均的な人は1日あたり約4,000本のビデオをレビューする必要があり、人件費は莫大です。

その中でも、最初のレビューは、主にビデオコンテンツとセキュリティレビュー操作の品質に基づいています(ホームページの推奨、人気がない、削除、禁止など)。たとえば、政府機関は一連の規則や規制を提示し、ビデオプラットフォームでの違法なコンテンツを明示的に禁止しています。これは、レビュールールの「赤い線」であり、その後に、明確性や現在の制限要件などの客観的なソフトルールが続きます。

レビューでは、最初のレビューに合格したコンテンツを再確認するだけでなく、さまざまなコンテンツのフローを制御します。つまり、製品の色調を制御します。審査の過程で、審査された動画にはランダムなトラフィックが発生します。雲飛は、ブランドの口調に従って運用に適した動画コンテンツを選択し、さまざまなコミュニティで公開します。リリース後、高品質の動画のトラフィックも増加します。

難易度と要件を確認する

基本的な観点から見ると、UGCコンテンツの多様性により、ビデオコンテンツのレビューとフィルタリングが非常に困難になり、特に、写真、ビデオ、音声などの非構造化データのコンテンツを特定することが困難になり、デリケートな単語を一致させる従来の方法は困難になっていますリスクコンテンツの効果的な識別は、この段階ではまだ人間によるレビューに依存しています。

ビデオレビューシーンの問題点
監査作業の主な目的は、政治、暴力的なテロ、銃乱射、下品などの違法なコンテンツを排除することです。ただし、大量のビデオや長期にわたる人間によるレビューに直面すると、バリアントフォントやゴミなど、見落とされやすい領域がいくつか存在することは避けられません。広告の流用、QRコード/ロゴ/無意味な灌漑、およびその他の違法なコンテンツは、肉眼では識別が困難です。

「レビューの欠落、レビューの誤り、またはレビューの誤り」が原因でビデオレビューが深刻で悪質な違法コンテンツをリリースすると、ビデオプラットフォームへの打撃は「致命的」になります。そのため、人間による審査の難度は絶えず拡大しており、雲飛にとって緊急のニーズを解決する唯一の方法は、多数のビデオ審査員を採用することです。

ビデオ監査アプリケーション技術

Sumei Technology Artificial Intelligence Research Instituteは、技術的な観点から、ビデオレビューが包括的なレビューモードであることを発見しました。これには、テキスト認識、画像認識、音声認識だけでなく、ライブブロードキャストシナリオでのオンラインリアルタイムビデオも含まれます。監査。また、このコンポジットビデオレビュー方法は、AI技術が人間のレビューをインテリジェントに置き換えるための最も直接的で効率的な方法でもあります。

AIテクノロジーによるインテリジェントなビデオコンテンツ認識とスマートタグが追加され、直接分類されます。この結果はビデオレビューアに提示され、ビデオプラットフォームの人件費を大幅に削減できるだけでなく、不必要な繰り返しのレビュー作業も大幅に削減できます。

API呼び出しインターフェイスと視覚的なWeb監査の背景を提供するインテリジェントなビデオフィルタリングを使用すると、傾向分析でリスクコンテンツの傾向を表示し、履歴でフィルター処理されたコンテンツの詳細を表示し、リストサービスで機密コンテンツをカスタマイズおよび管理できます。

したがって、上記の機能を実現するためには、システムアーキテクチャの整合性とインテリジェントビデオ監査の技術的パラメータの正確性に対するより高い要件があります。

インテリジェントビデオフィルタリングシステムアーキテクチャ

Sumei Technology Artificial Intelligence Research Instituteは、アーキテクチャがモジュール式プログラミング方式を採用すべきであると考えています。これは、システム機能のさまざまな組み合わせや変更に便利であり、開発に関与していない技術保守担当者が補足および保守するのに便利です。アプリケーションの効果の目的を達成するために、既存のリソースを最大限に活用し、システム開発のレベルを向上させるために、既存のソフトウェアとハ​​ードウェア環境、および高度な管理システム開発計画を使用してみてください。

インテリジェントビデオフィルタリングシステムアーキテクチャ
上の図に示すように、システムには主に次のモジュールが含まれています
。1。アクセスレイヤー:パラメータの合法性の検証、承認の検証など、アクセスを要求するロジックを担当します
。2。ビジネスロジックレイヤー:ビデオの逆多重化を担当します。デコードおよびその他の処理。
3.戦略レイヤー:組み込みのルールモジュールと基本エンジンによって提供される特性を組み合わせて、ビデオがルールに違反しているかどうかを判断し、組み込みのルールの動的調整をサポートします
。4。エンジンレイヤー:さまざまなコンテンツ認識エンジンがディープラーニングモデルを通じてコン​​テンツ検出を実行します。
5.モデルレイヤー:何億ものビデオ、画像、テキスト、音声のトレーニングサンプル
を保存; 6. AIインテリジェントプラットフォームレイヤー:TensorFlowやその他のディープラーニングテクノロジーに基づいて、ストレージエンジンで数千万のサンプルを使用して大規模なトレーニングを行う深層学習モデルをスケーリングします。

コアとなる利点は
、画像の深い認識エンジン、音声認識エンジン、テキスト検出モデル、ビデオ音声コーデック技術に基づいており、ビデオ、音声、字幕、ポルノ、テロ、政治的機密コンテンツ、詐欺的な広告、その他の違法および違法なコンテンツを正確に特定して、部分的な手動レビュー。

インテリジェントなビデオフィルタリングソリューションには、次のような中核的な利点があります
。1.ビデオコンテンツのリスクを正確に特定する:ポルノ、セクシー、政治的人物、政治事件、暴力的なテロ、広告の透かし、ビデオのQRコードなどのリスクを特定できます
。ビデオ画像、音声、キャプション、字幕を同時に識別できます。3
。大規模なデータサンプル:複数のマシンアルゴリズムモデルを使用した大規模なネットワークデータに基づいて、複数のモデルの組み合わせトレーニングにより、さまざまな種類の違法ビデオを1日に何億回も正確に識別できます画像、音声、テキスト処理機能により、モデルの反復がより速く効率的になり、あらゆる種類の違法ビデオをより効率的に処理できます
。4。柔軟な標準戦略のカスタマイズ:カスタム監査ディメンションをサポートし、業界の特性に基づいた排他的なビデオ認識戦略を提供し、監査標準の一貫性を高めます実際のビジネスシナリオ。

同時に、インテリジェントビデオフィルタリングAPIの遅延とスループット、再現率、精度も、ビデオフィルタリング監査の技術的な強さの重要な指標です。この段階では、Sumei TechnologyのスマートビデオフィルタリングAPIの最大応答時間は1秒、タイムアウト率は0.01%未満、スマートビデオ処理のリアルタイムレートは30%に達することができ、スマートビデオフィルタリングAPIは最大100の同時処理タスクをサポートし、需要レベルにも基づくことができます。拡張、再現率、正確率は90%を超え、ビデオ形式MPEG、AVI、MOV、WMVなどをサポートします。

AIはビデオレビューの方向を置き換えることができます

現在のAIスマートビデオレビューの強みから判断すると、SUMEIテクノロジーArtificial Intelligence Research Instituteは、人間によるレビュー/機械によるレビューに完全に依存することは、さまざまなビデオプラットフォームのさまざまなレビュー要件を完全に満たすことができないことを発見しました。特に大規模なライブブロードキャストプラットフォームでは、ビデオ作成プラットフォームと比較して、レビュー要件とレビュー方法の多様化と標準的な側面が高くなっています。

詳細なアルゴリズム研究とテクニカル分析のためのさまざまなビデオ監査ランディングシナリオを組み合わせることにより、Sumei Technology Artificial Intelligence Research Instituteは、上記の問題を解決する最も直接的かつ効果的な方法は、「個人レビュー+機械レビュー」監査プログラムを効率的に使用することであると認識しました。 。

AIを使用して不要な人間によるレビュー作業の一部を置き換えると、半分の労力でより効果的なレビュー効果を得ることができます。

ビデオストリーミングコンテンツレビュープログラム
SUMEIのAIリサーチインスティテュートは、汎用のインテリジェントビデオフィルタリング製品のアーキテクチャに加えて、AIが人間によるレビューを置き換えることができると考えており、次の3つの方向も含まれます。

インテリジェントテキストフィルタリングは、完全なユーザーポートレートシステムと特徴的なインテリジェントセマンティック分析機能を確立することにより、政治、禁止、ポルノ、広告流用に関連するリスクの識別をサポートし、マルチシーンおよびマルチディメンションの判断と組み合わせて、認識の正確度は99%以上です。高速処理、過失致死率の大幅な削減、手動によるレビューのコストの削減、オンラインリスクの排除。

インテリジェントな画像フィルタリングは、ディープラーニングベースの画像認識テクノロジーとポートレートベースのユーザー行動分析テクノロジーを採用し、強力な画像認識エンジンを構築して、ポルノ、テロリスト、政治的にデリケートなコンテンツ、不正な広告、その他の違法コンテンツを正確に識別し、労働を完全に解放します監査により、製品のユーザーエクスペリエンスが大幅に向上します。

インテリジェントオーディオフィルタリングでは、ffmpegベースのオーディオ情報ダイナミックトランスコーディングテクノロジー、ディープラーニングベースの音声認識テクノロジー、インテリジェントな特性セマンティック分析テクノロジーを使用します。これらのテクノロジーは、複数のシナリオと複数の次元でほとんどのオーディオフォーマットを検出および認識できます。政治、ポルノ、広告の流用、その他多くのタイプを含みます。高精度の製品認識効果により、手動レビューのコストを大幅に削減し、オーディオコンテンツの品質を向上させることができます。

SUMEIテクノロジーは、特にビデオレビューの分野でAIオンラインビジネスリスク管理ソリューションを提供する世界をリードする専門プロバイダーです。スマートイメージ、スマートオーディオ、スマートピクチャー、スマートテキストフィルタリングなどの高精度の技術力を持ち、長年の豊富な経験を持っています。当社は、世界中の何百もの大規模なビデオおよびライブ放送プラットフォームで長期的なサービスを提供しており、今後もビデオレビューの分野を深め、グローバルな顧客向けのオンラインビジネスの継続的な成長を促進していきます。

おすすめ

転載: blog.csdn.net/SHUMEITECH/article/details/108450255