[編集者注] 大規模な言語モデルは、人間の創造性を高め、問題を解決するための貴重な資産となることが期待されています。
元のリンク: https://www.stride.build/blog/the-llm-hype-curve
許可なく再配布しないでください!
著者 | アコ・ガガーリン 翻訳者 | Crescent Moon
担当編集者 | Xia Meng
出品 | CSDN(ID:CSDNnews)
ここ数カ月、大規模言語モデルが世界中で注目を集めており、主要ニュースの見出しを頻繁に取り上げています。OpenAI の GPT-4 や Meta の LLaMA などのこれらの複雑なモデルは、研究者、開発者、一般の人々の想像力を魅了してきました。
ただし、他の革新的なテクノロジーと同様に、大規模な言語モデルでも誇大広告、それに伴う期待の変動、恐怖が生じます。人工知能と生成 AI への期待が最高潮に達したため、2022 年末にガートナーはハイプ サイクル レポートを発表しました。
GPT-4 の発表から 1 年も経たないうちに新しい AI 製品の開発が爆発的に増えていますが、私たちは現在、大規模言語モデルの誇大宣伝曲線のどの位置にいるのでしょうか?
大規模言語モデルとは正確には何ですか?
ハイプカーブについて説明する前に、まず大規模な言語モデルが実際にどのようなものかを紹介しましょう。このようなモデルは、テキストを生成するために最適化された生成 AI のサブセットであり、特に、手がかりと関連するコンテキストが与えられた場合に文内の次の単語を予測します。これらのモデルは、10 億を超えるパラメーターを含む非常に大規模なデータセットでトレーニングされ、人間 (または他の大規模な言語モデル) によって微調整されます。このようなモデルには、BERT、GPT、T5 などが含まれます。
結局のところ、大規模な言語モデルは、与えられた手がかりから人間が理解できるテキストを作成する方法を知っているテキスト計算機です。
ハイプカーブ: 興奮から現実主義へ
新しいテクノロジーが登場すると、誇大宣伝曲線がよく観察されます。初期段階では、高尚な約束と先見の明のある予測によって、大きな興奮と期待が高まります。
大規模な言語モデルの場合、一貫性があり文脈に関連したテキストを生成する機能が最初の誇大宣伝の原動力となりました。メディアはこれらのモデルの驚くべき機能について報道し、あらゆる階層の無数の人々の想像力を魅了しました。同時に、そのようなツールに対する誤解が生じるのではないかという懸念から、多くの論争が巻き起こっています。
期待が高まるピークの時期
大規模な言語モデルへの注目が高まるにつれ、その機能に対する期待はかつてないほど高まっています。人々は、AI が生成したコンテンツがジャーナリズム、顧客サービス、コンテンツ作成、さらにはパーソナル アシスタントにまで革命をもたらす未来を思い描いています。ただし、このピーク段階では、これらのモデルは完璧には程遠く、限界があることに留意する必要があります。
バブルの谷
予想されたピークを過ぎ、大規模言語モデルの実態が徐々に表面化し、谷期に入った。これらのモデルは印象的なテキストや画像を生成できますが、不正確で偏った、または無意味な出力を生成する可能性もあります。さらに、現段階では、AI を取り巻く倫理的問題とそのようなテクノロジーの潜在的な悪用が拡大しています。
その結果、熱意は薄れ、国民感情は疑惑と恐怖に傾いています。
今日はその段階にあると思います。膨らんだ期待のピークを超えて加速しています。
多くの個人や企業がこのテクノロジーを活用して莫大な価値を生み出していますが、その数はほんのわずかで、多くはまだバブルの谷間にいます。
明るい着実な上昇期
最初の誇大宣伝が薄れるにつれて、大規模な言語モデルの理解がより現実的に感じられ始めます。研究者と開発者は、これらのモデルに関連する制限と課題に対処するために積極的に取り組んでいます。微調整技術、データ品質、バイアスの削減において改善が行われました。
焦点は高い期待から、実用化に向けた技術の改良へと移ってきました。着実な上昇を踏まえると、大規模言語モデルの真の可能性と価値が現実化し始めています。
大規模な言語モデルですべての問題を解決できるわけではありませんが、かなり近い問題は解決できます。パレートの法則 (別名 80/20 ルール、要素の約 20% のみが結果の 80% に影響する) によれば、これらのツールが価値の 80% の創出に役立つ可能性は 20% のみであり、ユースケースに応じて異なります。 。これらのモデルは、人間と機械の間でこれまで不可能だった方法で創造性を解き放ちます。アイデア出しのプロセスがスピードアップするだけでなく、問題解決の障壁の多くも取り除かれます。
実際の生産の停滞期
最終的には、大規模な言語モデルが独自の足場を確立し、複数の業界にわたって有意義な貢献を行うようになるでしょう。導入戦略を改善し、自分自身の強みと限界をより深く理解し、適切な倫理的考慮を組み合わせることで、これらのモデルは貴重なツールになります。
大規模な言語モデルは、コンテンツ作成、言語翻訳、チャットボットなどのタスクを完了するのに役立つだけでなく、研究者の研究開発を支援することもできます。実質的な生産の停滞期は、私たちの生活にシームレスにフィットし、生活をサポートするツールとなる大規模な言語モデルの成熟を示しています。これらすべてがいつ実現するかはまだわかりませんが、私たちが思っているよりも早いかもしれません。
要約する
大規模な言語モデルが人工知能の分野に一石を投じたことは疑いの余地がありません。これらのモデルの誇大広告曲線は、あらゆる革新的なテクノロジーが通過する自然な過程です。当初の高い期待が低下を引き起こす可能性がありますが、これらのモデルには大きな可能性があることを認識する必要があります。
テクノロジーが成熟し続け、困難な問題が克服され、アプリケーションが改善されるにつれて、大規模な言語モデルは人間の創造性と問題解決を強化するための貴重な資産になることが期待されています。
ハイプカーブを理解して管理することは、これらの強力なツールを責任を持って活用し、社会を改善するために使用するのに役立ちます。