人工知能の基本常識: ディープラーニング技術をより人間らしくする

近年、人工知能技術はますます成熟してきています。現在、多くの製品やサービスが人工知能技術に依存して自動化や知能化を実現しており、私たちの日常生活と密接に関係しています。私たちにさまざまな利便性をもたらすホームデバイスであれ、いつも使用する製品の製造方法であれ、人工知能の影響はあらゆるところにあり、私たちの生活のほぼすべての側面でイノベーションを推進しています。しかし、エンドユーザーのフラストレーションにつながる可能性のある欠点や、人工知能テクノロジーのパフォーマンスを向上させようとする研究者にとっての重大な課題につながる可能性のある欠点がまだあります。

常識的なアプローチ

Microsoft の共同創設者 Paul Allen は、2018 年に亡くなる前に、人工知能テクノロジーに関する基本的な常識の欠如という、終わりのない巨大な課題の解決に多くの時間とリソースを費やしました。アレン氏のアレン人工知能研究所(AI2)は、この問題の解決を続けるためにモザイクプロジェクトを立ち上げた。彼の概念は次のとおりです: 「人工知能研究の初期の頃、人々は常識に大きな注意を払っていましたが、この研究は停滞しています。人工知能は依然として「ほとんどの 10 歳児が理解できる常識が欠如しています。私たちはこの研究を皮切りに、この分野で大きな進歩を遂げたいと考えています。」 アレン氏の比喩は、現在の深層学習テクノロジーの大きな問題を浮き彫りにしています。当社の AI 製品は賢いことが多いですが、私たちが同僚やパートナーに尋ねるかもしれない非常に単純な質問にはまだ答えることができません。たとえば、「この壁を赤く塗ったら、明日も赤のままでしょうか?」この問題をどの程度解決するかを説明するために、AI2 CEO のオーレン・エツィオーニ氏は次の例を挙げています。 「2016 年に世界ナンバーワンの囲碁プレイヤーだった彼は、囲碁がボードゲームであるとは思いもしませんでした。」これは非常に重要な詳細であることに誰もが同意できると思いますが、この問題を解決できなければ、AI の成功の可能性は低くなります。狭い適用領域に限定されます。

常識的な問題に対する複雑な解決策

明らかに、常識的な AI には、その限界を克服するために多角的な戦略が必要です。この目的を達成するために、アレン氏のモザイク プロジェクトは、「機械の読み取りと推論、自然言語理解、コンピューター ビジョン、およびクラウドソーシングのテクノロジーを統合して、将来の人工知能システムのための幅広い基本的な常識知識の新しいソースを確立します。」これは研究レベルのようですか?

  • 視覚的常識推論 (VCR) は、認知レベルの視覚的理解のための新しいタスクであり、大規模なデータセットです。この研究は、人工知能ベースの視覚システムのための高次の認知と常識的推論の作成に焦点を当てています。 VCR は、ワシントン大学の研究者と AI2 の共同研究の成果です。 VCR は、クラウドソーシングの作業員のチームを利用して、 プロジェクトのデータに注釈を付けました。
  • 常識知識グラフは、常識概念を表現するための半構造化された方法を提供します。この構造は他の知識源とは異なる視点を提供しますが、どのような種類の知識が表現されるのか、そしてそれを現代のニューラル手法に理想的に組み込む方法は、この分野の研究が直面する重要な問題のままです。これに対処するために、チームは現在社会状況、精神状態、因果関係情報などの常識の側面を調査するためのリソースを構築および公開中です。 。
  • これは、常識的な推論、統一された自然言語による推論、および物理ベースの推論を可能にする大規模なデータ セットです。このデータセットには、シナリオに関する 113,000 件の多肢選択式の質問が含まれています。各質問は、大規模映画説明理解チャレンジ (LSMDC) または大規模で高密度なイベント説明データベース ActivityNet Captions からのビデオ キャプションであり、4 つの回答から選択でき、問題のシーンで次に何が起こるかを判断することを目的としています。 . .正解は、ビデオ内の次のイベントの (実際の) ビデオの字幕です。3 つの不正解は、人間以外のマシンを混乱させるために、人間によって敵対的に生成および検証されます。チームの目標は、SWAG を常識に基づいた NLI と学習表現の評価のベンチマークにすることです。

おすすめ

転載: blog.csdn.net/Appen_China/article/details/134971594