私たちは人工知能について(もっと真剣に)話す必要がある

誇大宣伝、希望、傲慢— ソフトウェア業界の内外で人工知能 (AI)の最新の進歩を探求してきたこの 6 か月間は、まさにそんな感じでした。

私たちはデモから良い点を推測し、潜在的な有用性を誇張し、ソフトウェア エンジニアリングに通常適用する厳密さを放棄することがよくあります

作業をスピードアップするために、私たちは一般に「研究」と呼ばれるものと日常的な開発との境界線を曖昧にし、製品化や生産時の生産準備の基準を軽視することがよくあります。

でも、言いたいのですよね?厳密さ、ソフトウェアの正確さ、品質、価値に重点を置くことは、これまでの 3 年間のキャリアを通じて私が知ってきた世界です。

しかし、赤ちゃんをお風呂のお湯と一緒に捨てたという思いが今でもぬぐえません。

人工知能はまだ単なるソフトウェアです。実際、これは私たちがこれまでに開発したソフトウェアの中で最も複雑なソフトウェアの 1 つであり、主に手作業ではなくトレーニング アルゴリズムによって作成されていますが、確かにその動作を推論するのは最も困難です。

人工知能の最新の波における私たちの成功は、人工知能を積極的に受け入れるかどうかよりも、それを私たちがどれほど批判的に適用できるか*とビジネス*思考の程度に依存している可能性があります

誇大広告から抜け出し、人工知能を含む完全で安定したリリース可能で商業的に価値のあるソフトウェアの構築についてもっと真剣に議論する時期が来たのでしょうか?

画像-20230731163443189

別の AI ではなく、この AI

人工知能は、多くの分野とテクノロジーをカバーする巨大な包括的な用語です。紛らわしいことに、これらのテクノロジーのいずれかまたはすべてを意味するために、同じ意味で使用されることがよくあります。

最近、大規模言語モデル (LLM) が再び注目を集めているようです。

ここでは LLM に関する具体的な点について多くのことを話していますが、私の話の多くは、AI を実際のソフトウェア製品に統合するというより一般的な課題にも当てはまります。

私たち自身の最大の敵でしょうか?

この新しいテクノロジーを習得する以外に、私たちが直面する最大の障害のいくつかは、AI に対する私たち自身の誤用不信、または誤解に起因しているように見えます。

私たちは興奮して、このテーマについて有意義かつ批判的に話すことができないことに集団的に苦しんでいるように思えます。AIが何に向いているのか(向いていないのか)、何ができるのか(できないのか)、他のソフトウェアと同じように理解しているのかなども含めて。

いくつかの注目に値する例外、つまり一貫して常識について話す人々がいることは認めますが、それらは時々かき消されているように見えます。

残りの私たちにとって、人工知能はタバスコソースのようなもので、少しの量で大いに効果があることも覚えておく価値があります。でもタバスコは初めてなので全部あります。アイスクリームにも。

** 明らかな潜在的可能性と隠れた限界

*すべてのテクノロジー、テクニック、さらには物理的な材料について普遍的に言えることは、それらができることを真に理解するには、それらが「できない」ことを知る必要があるということです。

エンターテイメント(AI は私たちを楽しませるだけの答えを返しますが、その正しさは重要ではありません) や情報発見(AI は既存のデータ ソースに対するよりスマートな会話型検索メカニズムとして機能します) を超えて、私たちはより批判的である必要があります。 。

具体的には、LLM の場合、知的であるように見える彼らの能力が、限界や適用可能性について話す私たち自身の能力、あるいはおそらくそうしようとする私たちの意欲を損なっているように見えます。

すべてのソフトウェアと同様に、制限を理解しなければ、後でその制限に驚かされることになると予想する必要があります。

場合によっては、 AI が人間に見える能力が、単なるソフトウェアではないという私たちの混乱の根源になっている可能性があります。価値のある問題を解決する限り、AI が人間のように見えることを望むべきでしょうか?

私たちは、膨大な量のトレーニング資料を消化するLL.M.の驚異的な能力に驚嘆します。しかし、おそらくそれが最初の危険信号であるべきでした。

人間に似たものを発明しようとするには、まず明らかに人間ではない能力をそれに与えます

彼らの知性について言えば...LLM は言語のみを消化することを思い出してください

これから、トピックに含まれるいくつかの考えられる意味論を推測することが可能です。椅子の適切な使用法、ロリポップを冷凍しなければならない理由、ソラマメはさやの中で成長するかどうかなどについて、LLM に質問するには十分です。

しかし、この明らかな理解は、言語を超えた知覚、知性、または現実世界の概念の本能的な理解からではなく、単語とその使用法に関する統計的研究から得られます。それは、はるかに洗練された方法と膨大なテキストのコーパスによるものではありますが、それらを表しています。

彼らの反応性は、トレーニング資料の外挿、削減、調整によって達成されます。当然のことながら、これは私たちが尋ねる可能性のあるすべてを表しているわけではありませんが、未知のことを感知する人間とは異なり、AI はその能力の限界を逸脱していることを私たちに伝えるのがまだ得意ではありません。

また、人間がどのように知識を獲得するかについての貴重な視点も見逃しています。

はい、読みました。しかし、私たちはまた、現実世界で得た知識を使用し社会化して、それが何を意味するのか、それが現実世界のどのような概念を指すのかを理解します。次に、他のテキストを読み直したり読んだりして、読んだ内容とその背後にある(非言語的な)概念とのつながりをさらに強化します。

これらの現実世界の意味論は言語だけから常に推論できるわけではないため、LLM によって推論された概念はその意味の代理にすぎない可能性があります。それらは現実を正確に反映していない可能性があり、そうでない場合、その上にさらに多くの知識を積み上げるだけで、得られる疑似理解を悪化させることがよくあります。

私が車の運転を学んだのは、実際の車に概念と理論を適用するのに 100 時間以上費やしたことでした。運転に関する 300,000 件の文書による説明を吸収したことではありません。私が学ぶことのほとんどは、純粋にトレーニング資料からではなく、実際の車に理論を適用する経験を通じて概念を推定することによって得られます。

私がケーキを焼くことを学んだのは、何百ものケーキを作って(しばしば焼きながら)味わい、フィードバックを得ることによってでした。卵に触れずに 347,000 のケーキのレシピを吸収したことではありません。

LLM は現実世界で使用することなく、メンタル モデルを調整し強化するために人間の知性の出発点を単純に消化します。これは説得力があるように見えますが、結局のところ理論的であり、やや単純です

ソフトウェアとしての AI のこれらの側面に対処したり改善したりするために、避けたり無視したりするのではなく、それについて話し合う必要があります。

**自然言語はコミュニケーションの一形態であり、問​​題領域ではありません

* AI は最も効果的な場所で使用する必要がありますが、場合によってはAI を使用しないか*、特定の場所でのみ使用することを意味します。

奇妙な例をいくつか挙げると、想像上のコマンド シーケンス、物理オブジェクトの配置、Linux シェルでの数学を推論するために人々が LLM を使用し続けているのは、少し悲しいことです。

これらの領域は単なる言語を超えており、複雑な抽象領域とそれらの間の関係があり、そのセマンティクスは実際には他の (主に非人工知能) ソフトウェアによって適切に処理されますが、自然言語はその間接的なモデルにすぎませ

これは私にとって悲しいことです。なぜなら、丸い穴に四角い杭を打ち込んでいるように感じられ、結果として生じるやや誇張されたプレゼンテーションで問題がごまかされていることが多いからです。

「LLM」の真ん中の「L」は言語を表していることを覚えておいてください。言語は人間のコミュニケーション方法ですが、通常、言語は私たちが頭の中でモデル化して問題を解決する領域ではありません。

私たちは数学の問題を解くのに数学的な言葉を使うのではなく、数字、法則、公式を想像します。あるいは、単に物理学を物理学の観点から考えて、原理を想像します。

では、なぜ AI は自然言語の分野で訓練されたメカニズムを使用して非言語問題を解決できると考えるのでしょうか? たぶんそうすべきではないでしょう。

LLM は、他の問題領域への非常に雄弁な自然言語インターフェイスとして見なされるべきであり、そのセマンティクスは最終的には他の接続されたシステムによってモデル化されます。私たちはこれらのフィールドと対話し、それらについて複雑な質問をするためのコミュニケーションメカニズムとしてそれらを使用する必要があります...しかし、自然言語の形式で私たちとコミュニケーションすること以外に、それらがフィールドで推論を推進することを期待しない(または許可しない)。

LLM は、物理学、数学、財務会計、法律などの世界をすでに堅牢に扱っているシステムと統合する必要があります。私たちの核心的な質問が何を要求するものでも。これには、AI が問題を解決するための最強のツールであることが判明した場合、他の非言語 AI モデルが含まれる可能性があります。そうでない場合は、非 AI システムが含まれる可能性があります。

LLM を使用して文書を分析する場合、LLM は、文書全体 (法律、会計など) の意味論をより効果的にモデル化するために、非言語領域でさらに処理するために意味論的なチャンクまたはマイクロファクトを抽出するための優れたメカニズムを提供します

システムの各部分に適切なツール、および各問題領域に最適な選択、構成、オーケストレーション。

誇大宣伝する価値はそれほどないかもしれません。しかし、おそらくより正確で信頼できるので、それについて話しましょう?

ケーキか正確さ AI をエンターテイメント以外で使用する場合は、他のソフトウェアと同じ高い正確性基準を維持する必要があります。

**

Siri の答えが間違っていても、生命を脅かすものではありませんが、間違った答えが悪影響を与える可能性がある場合には、AI を真剣に活用してほしいと考えています。

したがって、純粋にエンターテイメントのために AI を使用することを受け入れるか、より本格的な用途のソフトウェアとして AI を使用することを正当化できるテクノロジーを開発するというタスクを受け入れるかのどちらかにしましょう。これには、現在精度が不足している部分と、それをどのように改善できるかについての話し合いが含まれます。

そうでなければ、この場合、AI は単なるエンターテイメント、軽薄な...ケーキになってしまいます。これは無駄な大きな機会のように思えます。

**説明してください!

**AI から得られる答えは、正しいだけでなく、混乱を招く可能性もあります。

通常のソフトウェアとは異なり、AI の動作を説明するコードやアルゴリズムを簡単に示すことはできず、モデルが大きすぎることがよくあります。

モデルが与える答えは正しいかもしれませんが、予想外ですしたがって、何らかの形式の解釈可能性が必要です。

AIは製品ではなく、一連の技術と技術です最近の AI の探求の多くは、何が可能なのかを解明することに向けられています。しかし、迅速な生産の実行では、ソフトウェア製品を実際に出荷可能または使用可能にする他の要素を忘れてしまうことがよくあります。

※確実に立ち上がることができますか?それは私たちの期待に応えられるでしょうか?安全で承認されていますか? それは誰かにとって価値があるのでしょうか?*これらは後付けで得られるものではなく、多くの場合、私たちが何を構築するか、そしてそれが可能かどうかを根本的に決定します。それらはピボットにつながりますが、時には行き止まりにつながることもあります。

実証できるユースケースに関しては、品質、セキュリティ、信頼性が大幅に制限される可能性があります。おそらく、当社は風評リスクを抱えているか、業界で厳しく規制されている可能性があります。

AI はこれらのソフトウェア製品の問題を解決するものではなく、一部の問題を悪化させます。

商業化に関して言えば、スタートアップは痛いほど知っていることですが、価値あるユースケースを追跡することは簡単なことではなく、思いつきではありません...それは実際にテクノロジーを構築するのと同じくらい難しい場合があります。

これらの質問に対する答えは、AI を含むソフトウェアを探索して構築する反復プロセスに反映される必要があります。

AI で構築されたチームの多くは、当然のことながら新しい可能性に執着しすぎているのではないかと思います。しかし、多くの人は、後でこれらの他の製品基準を検討し、自分の作品を示すデモまたはプロトタイプしかなく、おそらく方向転換、あるいはそれ以上の状況に直面しているため、行き詰まっていることに気づくでしょう。

そうならないことを心から願っているので、この記事を書きました。

私たちはこの人工知能の新しい波を活用して、本物で信頼性の高い価値のあるソフトウェア ソリューションを提供できます。

しかし、誇大宣伝をやめて、業界としてそこにどうやって到達するかについてもっと真剣に話し合う時期が来ています。

顧客はそれを期待するでしょう。当局はこれを許可するでしょう。最終的には、ソフトウェア プロバイダーとしての当社の評判はそれにかかっています。

おすすめ

転載: blog.csdn.net/shupan/article/details/132048559