一枚の絵でわかる!生成AIアルゴリズムの現状

2023年8月現在、アルゴリズム登録システムには151の関連アルゴリズムが登録されており、中国企業All in AIの生成AIアルゴリズムのレイアウトの現状を観察することができる。これら 151 のアルゴリズムのうち、生成合成アルゴリズムの 33.8% はテキスト生成の分野に集中しており、画像、マルチメディア、オーディオの方向性も各社の主要な方向性の 1 つです。

写真

画像出典: The Paper 「AI が急速に発展した今年、私たちの仕事はどれだけ置き換えられましたか?」 》 https://www.thepaper.cn/newsDetail_forward_25440475

Tencent、Alibaba、Baidu、Byte、Douyin、NetEase、Kingsoft、SenseTime、Huawei、JD.com、Kuaishou、Meitu、iFlytek などの 25 の有名なインターネット企業が、成功したアルゴリズムの主力であることがわかります。合計 104 のアルゴリズムが出願を通過し、68.8% を占め、平均すると、各企業は 4 つのアルゴリズムの出願を成功させました。小規模インターネット企業 35 社のうち、登録されているアルゴリズムは 47 個のみで、割合は 31.2% に過ぎず、平均すると、各企業が申請に成功したアルゴリズムは 1.3 個だけです。主要機関が発行した AIGC 業界マップによると、市場に公開されている約 100 の大型モデルと数百の AIGC アプリケーションの大部分は、まだアルゴリズムの登録番号を取得できていないか、アルゴリズムをまだ実行していません。アプリケーション、つまりビジネスはまだ「継続中」です。

製品やサービスが Web ページ、アプリ、アプレットのいずれの形式であっても、深層合成テクノロジー サービス (テキスト、画像、オーディオ、ビデオ、仮想現実など)、アルゴリズムの登録が必要です。監督を受け入れないと、ビジネスとユーザーは大きな不確実性にさらされることになります。では、落とし穴を回避するにはどうすればよいでしょうか? Bote Intelligent AIGC Security Laboratory は、20 以上のアルゴリズムの個別指導の登録プロセスに基づいて、落とし穴を回避するための次のガイドラインをまとめました

写真

まず、アルゴリズム ファイリングの要件を十分に理解してください。 「生成型人工知能サービスの管理に関する暫定措置」、「インターネット情報サービスの深層合成の管理に関する規定」、および「インターネット情報サービスのアルゴリズム推奨の管理に関する規定」は、インターネット情報サービスの基本的な規制基盤です。アルゴリズムの提出。これらは注意深く読み、規制の観点から見る必要があります。独り言を避け、アルゴリズムが 3 つの法律および規制の要件に準拠していることを確認してください。

2 番目、送信されたコンテンツは完全かつ正確です。公式宣言 Web サイトで提供されている対応するテンプレートでは、200 を超える応答ポイントが提案されています。申告者は、各回答項目に対して一つ一つ正確に回答することが求められます。フォームに不備があったり、誤りや脱落があった場合、申請の承認に影響します。

3 番目は、データ セキュリティの問題です。データ セキュリティの考慮が不十分なため、たとえば、申請に含まれるトレーニング データの一部が海外の安全でないデータである、または選択された制度モデルが不十分であるなどの理由で、ソースを追跡することは、元のトレーニング データが安全であることを示します。さらに、個人の権利と商業著作権の侵害、および不十分なクリーニングと減感作が含まれる可能性があります。たとえば、一部の顧客トレーニング データは法的判断を使用します。医療診断レポートなどは、使用前に感度を下げてオーソライズすることをお勧めします。そうしないと通過が困難になります。

4 番目、アルゴリズム。アルゴリズムのわかりやすい説明を提供します。モデルのインプット戦略とアウトプット戦略の各ステップをどのように設計するかについては、最小の粒度と十分な透明性を持って規制当局に提示する必要があります。

5 番目、介入戦略とラベル付け: 介入戦略では、ユーザーの入力および出力コンテンツのレビュー、フィルタリング、および効果的な介入が必要です。最終的に出力がユーザーに提供されるときは、それ自体にリスクがあることがわかった場合、それは明らかに安全ではありません。さらに、ユーザーの知る権利をより適切に保護するために、識別は明確かつ正確である必要があり、実名で追跡できることを保証する必要があります。

特に注意すべき点

重要なポイント

✅ 異なるアプリケーション製品で同じアルゴリズムが使用される場合は、登録は 1 件だけで済みますが、同じ製品に複数種類のアルゴリズムが含まれる場合は、複数のアルゴリズムの登録が必要です。

✅ 他人のAPIアルゴリズムを使用する深層合成型の場合は、それも登録する必要がありますので、登録するアイデンティティは「サービスサポーター」ではなく「サービスプロバイダー」を選択してください。

✅ 登録番号は一括で発行されます。実際の経験から言えば、不承認の通知のみが通知され、承認しても明確な返答が得られないことがよくあります。

✅ 大規模なモデルプロジェクトを実施し、そのプロジェクトでは依然として生成アルゴリズムを使用している企業は、アルゴリズムのファイリングに加えて、インターネット上でセキュリティ評価を実施する必要もあります。セキュリティ評価の主なプロセスは、評価レポートのレビューです。プロジェクトのモニタリングビジネス、ブラックボックス、アルゴリズムの脆弱性テストなどが含まれます。このプロセスを実行するには、最初にアルゴリズムの登録を実行する必要があります。

✅ 対象認定期間中は、北京市を例に挙げると、固定電話番号には中国サイバースペース局の市外局番を付けて応答するよう注意し、電話に出ないと対象認定の失格に直結し、その後、次の段階のアルゴリズムファイリングの進行に影響を与えます。

✅ 主要な認証期間中は、大規模な製品の反復を避け、申告レポートが製品と 1 つずつ一致していることを確認してください。そうしないと、申請に影響します。

おすすめ

転載: blog.csdn.net/richerg85/article/details/134940840