チューリングテストは70年前に生まれましたが、解雇される時が来ましたか?

チューリングテストは70年前に生まれましたが、解雇される時が来ましたか?

著者:リンゴ

2020年はチューリングテストの70年目です。人間はまだチューリングテストに合格するマシンを構築できていませんが、これは、マシンインテリジェンスの分野を支配するこのテストが現在古くなっているかどうかを疑問視する一部の声には影響しません。

「都市伝説」の70年

チューリングテストは人工知能の元々の概念であり、「人工知能」という言葉自体よりも前のものです。

1950年には、最初の商用コンピュータはまだ販売されておらず、光ファイバーケーブルは発売されるまで4年待たなければなりませんでした。しかし、アメリカのコンピューター科学者チューリングが、コンピューティングマシナリーアンドインテリジェンスと呼ばれる彼の論文で、マシンがインテリジェントであるかどうかを判断するための一連の方法を提案したのは今年でした。この方法の誕生から6年後、人工知能という用語が提案されました。

画像

画像ソース:manhattanrarebooks

チューリングテストは、「機械は考えることができるか」という質問に答える最も初期の試みの1つです。複雑ではありません。テスターである人間を被検者である機械から分離し、機械で一連のランダムな質問と回答を行うだけです。複数のテストを行った後、人間のテスターの30%以上が、被検者が人間であると確信できない場合まだ機械なので、この機械はテストに合格しており、人工知能を持っていると見なすことができます。

誕生後、チューリングテストはAIの世界でほぼ「ポラリス」になりました。1960年代と1970年代の初期のチャットボットELIZAとPARRYは、このテストに合格することを中心に展開しました。今日まで、チューリングテストはまだ輝いていて、フィールドの想像力を促進し続けています。2019年の年次開発会議でGoogleが発表したDuplex音声アシスタントと2020年に発表されたOpenAIGPT-3言語モデルはすべて、チューリングテストに合格する可能性が高いという激しい議論を引き起こしました。

チューリングがチューリングテストに関する論文を発表した後、彼はまた、2000年までにこの模倣ゲームが実現するだろうと予測しました。

明らかに、2020年を経験した人間として、私たちはすでにこの予測を否定することができます。20年が経過し、業界全体はまだこの目標を達成していません。現時点では、携帯電話の計算能力はアポロ11号の10万倍ですが、クラウドコンピューティングと高帯域幅を組み合わせると、アルゴリズムは数秒。大量のデータに基づいて、24時間以内に決定が行われます。

一部のAI科学者を困惑させるのは、チューリングテストが「有用な」ターゲットにますます似ていないことです。

実際のアプリケーションでは時代遅れですか?

最近、Amazonの音声アシスタントのAlexa部門のチーフサイエンティストであるRohit Prasadは、Alexaの作成者の1人として、「Alexaはいつチューリングテストに合格するのか」とよく尋ねられると共有しました。

彼を悩ませているのは、チューリングテストが確かにAlexaの知性を測定するための方法論であるということですが、この定規には対応する意味と関連性がありますか?

彼は、人工知能が前例のない速度でユビキタスになると、人々が機械との相互作用が有用でスムーズであるかどうか(つまり、機械の存在が最小限に抑えられるかどうか)についてますます懸念するようになることを発見しました。非機械と人間の違い。言い換えれば、70年前に行われたチューリングの発言は現実とは無関係です。

チューリングテストは、人工知能の機械属性、特に現代の人工知能の最も効果的な部分である迅速な計算と情報クエリをほぼ完全に否定します。

Rohit Prasadは、例として単純なシナリオを使用して、チューリングテストが人間を欺くことはほとんど価値がないことを意味することを強調していることを否定します。マシンがチューリングテストに合格するには、「3434756の立方根を知っていますか? "または"シアトルはボストンからどれくらい離れていますか? "質問を待つときは、一時停止を追加します。

人工知能の真の能力は、これらの答えを瞬時に知ることであるとしても、人間のようになるためには、やめなければなりません。しかし、一時停止は明らかにそのスキルを最大限に活用するものではありません。さらに、チューリングテストでは、人工知能がセンサーを使用して外界が強くなるのを聞いたり、見たり、感じたりすることを考慮していません。それどころか、それは言語の物語に限定されています。

AI製品の責任者の一人として、RohitPrasadの「告発」は無理ではありません。人工知能が人々の日常生活に深く浸透するとき、私たちが期待するのは、これらのシステムが多くの日常業務を効率的に完了することができるということです。

AIアシスタントにガレージのライトをオフにするように依頼した場合、AIアシスタントと会話したくない場合があります。代わりに、リクエストが完了し、「OK」や「完了」などの簡単な確認が返送されて通知されることが期待されます。AIアシスタントと話題の話題について話したり、子供に話を読んだりしても、それが人間ではなくAIであることを知りたいと思うでしょう。実際、人間になりすましてユーザーを「だます」ことは、実際のリスクをもたらします。

チューリングの当初のビジョンは依然として刺激的ですが、このテストを人工知能の進歩の究極の兆候として解釈することの限界は何ですか?

チューリングテストに関するいくつかの質問

チューリングテストは当然完璧な製品ではなく、その制限のいくつかもあります。チューリング自身も彼の独創的な論文で論じています。

上記のマシン属性を含みます。マシンはQAパフォーマンスにおいて人間とほぼ同じように動作する必要があるため、間違いを犯すことになります。彼の元の論文で自分自身をチューリング

この点は、記事に明確に述べられています。「このマシンは、算術の質問に正しい答えを出そうとはしません。それは、質問者を故意に混乱させる方法でエラーを導入します。」

ここで、Turingは特に算術問題を指摘していますが、彼の論理を他のタイプのエラーに拡張できることに注意してください。チューリングが予見していなかったかもしれない「エラー」もあります。つまり、機械は人間の直感によって作られた言葉や行為を過度に明確に説明しました。エディンバラ大学で世界初の人工知能学科を設立したD.ミッキーは、1992年のチューリングテストと意識的思考の記事で、このタイプのエラーを「超関節性」と呼んでいます。道江の視点は、言葉や形式化が難しい人間の潜在意識の存在であり、プログラムやコードに従って動作する機械は正反対です。

「テストが候補者に知性を隠すことによって知性を証明することを強制するならば、人々は間違いなくテストに欠陥があると思うでしょう」と彼は書いた。

チューリングテストの批評もあります。これは、テストに合格するのが最も簡単なマシンのタイプを定義すること、つまり、チューリングテストによって最も推奨されるマシンのタイプを見つけることに基づいています。この見方では、ブルートフォースマシンが大きな勝者になります。

興味深いことに、この音のほとんどは、マシンの出力をチェックするだけがチューリングテストの大きな欠陥であると信じている哲学者からのものです。これらの批判の中で、最も有名な理論は、アメリカの哲学者ジョン・サールによる「中国の部屋の議論」です。

1980年代、サールは1980年の論文「行動と脳の科学」でこの有名な思考実験を設計し、チューリングテストの設計に対抗しようとしました。具体的な実験内容は、中国語が全くわからない人がいる部屋があるが、その人と彼が外の世界とコミュニケーションをとるための窓もあるとしよう。方法はメモを渡すことです。部屋には漢字カード一式と漢字ルールブックもあり、漢字カードの使い方や組み合わせ方を教えてくれます。この時点で、家の外の誰かがその人にメモを渡すように手配し、そのメモに中国語で書かれた質問を添付します。家の人は完璧なルールブックを持っているので、ルールブックのガイダンスに従って漢字カードを正しく選択して組み合わせることができ、中国語を知らなくても流暢に質問に答えることができます。そうすれば、家の外の人々は、家の中の人々が中国語に堪能でなければならないと信じる十分な理由があります。

「チャイナハウスの議論」は、実際には人工知能の分野における哲学者の機能主義に対する批判です。

哲学者からの疑いの他のカテゴリーは、主に彼ら自身の知性の人間の認識を中心に展開します。

チューリングテストでは、人間のテスターは言語を介してのみマシンと対話します。言語には視覚的または物理的な接触は含まれません。一方で、この相互作用の方法は公正であるように思われます。人間のように見えないという理由だけで、機械を非インテリジェントとしてラベル付けするべきではありません。一方、言語は人間が持つあらゆる種類の知性を捉えるのに十分ですか?言語がすべての人間の知性に等しいわけではないという証拠はすでにたくさんあります。これらの質問が拡大された場合、チューリングテストは人間以外の知性を検出できますか?

画像画像ソース:GoogleAIが生成

これらの質問はまだ進行中の段階です。これらの論争の存在はまた、チューリングテストが依然として非常に価値があることを証明しています。結局のところ、それはそのような確かな基本的事実に基づいています:言語は私たちが持っている最高の知性の外部の現れかもしれません。

70年間この分野に影響を与えてきたこの「都市伝説」を引退する時が来ましたか?これは未解決の質問です。次の10年が始まると、チューリングテストのバトンを勝ち取ることができる本当に新しい課題があれば、それは朗報です。

参考資料:
1、https://www.fastcompany.com/90590042/turing-test-obsolete-ai-benchmark-amazon-alexa
2、https://academic.oup.com/mind/article/LIX/236/433 / 986238

データ戦闘派について

データ実務者は、実際のデータと業界の実際の事例を使用して、読者がビジネス能力を向上させ、興味深いビッグデータコミュニティを構築できるようにしたいと考えています。

画像

おすすめ

転載: blog.csdn.net/shujushizhanpai/article/details/112848304