ChatGPT のカーニバルの裏側: 欠点はまだありますが、インスピレーションはたくさんあります。2023 年にできることは次のとおりです...

ChatGPT の強力な機能は固有のものですか? 欠点は何ですか? 将来的には検索エンジンに取って代わるのでしょうか?その出現は私たちの AI 研究にどのようなインスピレーションをもたらしますか? こうした問題に対し、複数のAI研究者が綿密な議論を行った。

2022 年の最後の月、OpenAI は、待望の GPT-4 ではありませんが、人気の会話ロボット ChatGPT で 1 年間の人々の期待に応えました。

ChatGPT を使用したことがある人なら誰でも、それが本物の「六角戦士」であることを理解できるでしょう。チャット、検索、翻訳に使用できるだけでなく、ストーリーの作成、コード、デバッグ、さらには小規模なゲームの開発にも使用できます。そして、米国の大学入学試験に参加する...今後、人工知能モデルは ChatGPT とその他の 2 種類だけになるだろうと冗談を言う人もいます。

ChatGPT は、その驚くべき機能により、開始後わずか 5 日で 100 万人のユーザーを獲得しました。この傾向が続けば、近いうちに ChatGPT が Google などの検索エンジンや、Stack Overflow などのプログラミングに関する質問と回答のコミュニティに取って代わられるだろうと、多くの人が大胆に予測しています。

しかし、ChatGPT が生成する回答は間違っているものが多く、よく見ないと分からないため、質問に対する回答が混乱する原因となります。この「非常に強力だが間違いが起こりやすい」という属性は、外部の世界に多くの議論の余地を与えています。

  • ChatGPT の強力な機能はどこから来ているのでしょうか?

  • ChatGPT の欠点は何ですか?

  • 将来的には検索エンジンに取って代わるのでしょうか?

  • その出現は私たちの AI 研究にどのようなインスピレーションをもたらしますか?

Xiaohongshu の技術チームが主催する 6 回目の「REDtech is coming」テクニカル ライブ ブロードキャストでは、NLP 分野の専門家でカリフォルニア大学サンタバーバラ校の助教授である Li Lei 氏と、Xiaohongshu テクノロジー担当副社長の Zhang Lei 氏が主催します。 Xiaohonshu のコミュニティ部門のマルチメディア インテリジェンスであるアルゴリズム責任者の Zhang Debing 氏が会話を開始し、ChatGPT に関する熱い質問を交換して答えました。

Li Lei は、Baidu の米国ディープラーニング研究所で若手科学者として、また ByteDance の人工知能研究所でシニアディレクターを務めてきました。機械学習、データマイニング、自然言語処理の分野で主要な国際学会で 100 以上の論文を発表し、2021 年の ACL Best Paper Award を受賞しました。2017年、Li Lei氏はAI執筆ロボットXiaomingbotの功績により、呉文君人工知能技術発明賞の2等賞を受賞した。Xiaomingbot は強力なコンテンツ理解力とテキスト作成機能も備えており、スポーツ イベントの放送や経済ニュースの作成をスムーズに行うことができます。

Xiaohongshu のテクノロジー担当副社長である Zhang Lei 氏は、中国における IBM の Deep Question Answering (DeepQA) プロジェクトのテクニカル ディレクターであり、質疑応答ロボットや検索広告 CTR 機械学習アルゴリズムなどの分野で広範な開発経験を持っています。Zhang Debing 氏はかつて Green Eye の主任科学者であり、権威ある国際的な顔認識コンテストの FRVT 世界選手権を含む多くの学術大会で優勝するチームを率いました。

3 人のゲストによるディスカッションは、ChatGPT の現在の機能と問題点に焦点を当てただけでなく、将来の傾向と展望にも焦点を当てました。以下、そのやりとりの内容を整理して要約する。

OpenAIの共同創設者であるグレッグ・ブロックマン氏は最近、2023年はAIの進歩と導入にとって2022年は退屈な年になるだろうとツイートした。

ChatGPT の強力な機能はどこから来ているのでしょうか?

ChatGPT を試した多くの人々と同様に、3 人のゲストも ChatGPT の強力な機能に感銘を受けました。

その中で、Zhang Debing 氏は、ChatGPT を Linux ターミナルとして機能させる例を示し、ChatGPT におおよそのマシン構成を伝え、それに基づいていくつかの命令を実行させました。前後の関係は非常に一貫しています (たとえば、ファイルに数行の文字を書き込み、ファイルにどの文字が書き込まれているかを表示するように要求すると、その文字が表示されます)。

DeepMind 研究者の Jonas Degrave は、ChatGPT を Linux ターミナルの例として使用しています。

この結果を見て、Zhang Debing 氏らは、ChatGPT がユーザーを欺くためにバックグラウンドでターミナルを開いたのだろうかと疑問に思いました。そこで彼らはいくつかのテストを実施しました: ChatGPT にいくつかの非常に複雑な命令 (それぞれ 10 億回の 2 つの for ループなど) を実行させます ChatGPT が実際にターミナルを開いた場合、しばらくスタックします。結果は予期せぬものでした。ChatGPT はこのプロセスをすぐにスキップし、このコマンドの後に次の結果を表示しました。これにより、Zhang Debing 氏らは、ChatGPT がデモ全体のロジックを大まかに理解しており、一定の「思考」能力を備えていることに気づきました。

では、この強力な能力はどこから来るのでしょうか? 張磊は 2 つの仮説を提唱しました。1 つの仮説は、この能力自体は大型モデルに組み込まれているが、これまで適切にリリースされていなかったというものであり、もう 1 つの仮説は、大型モデルに組み込まれた能力は実際にはそれほど強力ではなく、人力を使用する必要があるというものです。調整してください。

Zhang Debing 氏と Li Lei 氏は両方とも最初の仮説に同意します。なぜなら、大規模なモデルのトレーニングと微調整に必要なデータ量には数桁の違いがあることが直感的にわかるからです。GPT-3 以降のモデルで使用される「事前トレーニング + プロンプト」パラダイムでは、この違いはデータ量の違いはさらに明らかです。さらに、彼らが使用するインコンテキスト学習では、モデルのパラメーターを更新する必要さえなく、入力テキストのコンテキストに少数のラベル付きサンプルを配置して、モデルに回答を出力させるだけで済みます。これは、ChatGPT の強力な機能が実際に内在的なものであることを示しているようです。

従来の微調整手法と GPT-3 のインコンテキスト学習手法の比較。

さらに、ChatGPT の能力は、RLHF (ヒューマン フィードバックによる強化学習) と呼ばれる秘密兵器にも依存しています。

OpenAIが公開した公式情報によると、このトレーニング方法は次の3つの段階に分けられます。

  1. コールド スタート段階の監督戦略モデル: テスト ユーザーによって送信されたプロンプトのバッチをランダムに選択し、プロのアノテーターに頼って指定されたプロンプトに対して質の高い回答を提供します。次に、手動でラベル付けされたこれらの < プロンプト、回答 > データを使用して、Fine - GPT 3.5 モデルを調整して、GPT 3.5 が命令に含まれる意図を理解できる初期機能を備えます。

  2. トレーニング報酬モデル (RM): ユーザーが送信したプロンプトのバッチをランダムにサンプリングし、第 1 段階の微調整グッド コールド スタート モデルを使用してプロンプトごとに K 個の異なる回答を生成し、アノテーターに K 個の回答を評価させます。結果は次のとおりです。並べ替えられ、ランク モードへのペアワイズ学習を通じて報酬モデルをトレーニングするためのトレーニング データとして使用されます。

  3. 強化学習を使用して事前トレーニング モデルの機能を強化します。前の段階で学習した RM モデルを使用し、RM スコアリングの結果に基づいて事前トレーニング モデルのパラメーターを更新します。

これら 3 つの段階のうち 2 つは、RLHF におけるいわゆる「人間によるフィードバック」である手動アノテーションを使用します。

Li Lei 氏は、この方法によってもたらされた結果は予想外であったと述べました。以前に機械翻訳の研究をするときは、通常、BLEU スコア (人間の判断と強い相関関係を持つ、高速かつ安価で言語に依存しない自動機械翻訳評価方法) をモデルの指針として使用していましたが、この方法は効果的な場合もありますが、モデルが大きくなるにつれて、その効果は弱まり続けます。

したがって、フィードバックを利用して GPT-3 のような非常に大規模なモデルをトレーニングしても、理論的にはあまり改善されないというのが彼らの経験です。しかし、ChatGPT の驚くべき結果は、この経験を覆します。Li Lei 氏は、これが ChatGPT について誰もに衝撃を与え、研究の概念を変えるよう思い出させるものだと信じています。

ChatGPT の欠点は何ですか?

しかし、ショックを受けながらも、ゲスト 3 人は ChatGPT の現在の欠点もいくつか指摘しました。

まず、前述したように、生成される答えの一部は十分に正確ではなく、時折「重大なナンセンス」が表示され、論理的推論があまり得意ではありません。

第二に、ChatGPT のような大規模モデルの実用化に必要な導入コストは非常に高額です。そして現時点では、モデルのサイズを 1 ~ 2 桁小さくすることでそのような強力な機能を維持できるという明確な証拠はありません。このような驚くべき機能が非常に大規模な場合にのみ維持できるとしても、応用にはまだ程遠いです」とZhang Debing氏は述べた。

最後に、ChatGPT は、一部の特定のタスク (翻訳など) について SOTA に到達しない可能性があります。ChatGPT の API はまだリリースされておらず、一部のベンチマークでその機能を知ることはできませんが、Li Lei の学生たちは、GPT-3 のテスト中に、GPT-3 は翻訳タスクを優れて完了できるものの、翻訳タスクには及ばないことを発見しました。個別にトレーニングされたバイリンガル モデルはさらに悪いです (BLEU スコアは 5 ~ 10 ポイント異なります)。これに基づいて、Li Lei 氏は、ChatGPT は特定のベンチマークで SOTA に達しない可能性があり、さらには SOTA から少し離れている可能性があると推測しました。

ChatGPT は Google などの検索エンジンを置き換えることができますか? AI研究にどのようなインスピレーションを与えますか?

ChatGPT に関するさまざまな議論の中で、「検索エンジンを置き換えることはできるか」というトピックが最も人気があるかもしれません。最近、ニューヨーク タイムズ紙は、ChatGPT の人気により Google が強力な敵のように感じられていると報じ、皆が ChatGPT のようなチャットボットを使用すれば、誰も広告付きの Google リンクをクリックしなくなるのではないかと懸念しています (2021 年には、Google の広告収益が総収益の 81.4%)。ニューヨーク・タイムズ紙が入手したメモと録音によると、グーグルのサンダー・ピチャイ最高経営責任者(CEO)は「グーグルのAI戦略を定義する」ため、「ChatGPTの脅威に対応して社内の多数のチームの作業を混乱させる」ため会議を行っている。

この点に関して、Li Lei 氏は、今交換について話すのは少し早いかもしれないと考えています。まず第一に、新技術の人気と商業的成功の間には大きな隔たりがあることが多く、当初は Google Glass も新世代のインタラクション手法になると言われていましたが、その約束は果たせていません。これまでのところ。第 2 に、ChatGPT は一部の質問と回答のタスクでは検索エンジンよりも優れたパフォーマンスを発揮しますが、検索エンジンの要件はこれらのタスクに限定されません。したがって、必ずしも既存の成熟した製品を置き換えることを目指すのではなく、ChatGPT 独自の利点に基づいて製品を構築する必要があると彼は考えていますが、後者は非常に難しいことです。

多くの AI 研究者は、ChatGPT と検索エンジンは連携できると信じていますが、最近人気の「youChat」からも分かるように、両者の関係は、取って代わられるものではありません。

Zhang Debing 氏も同様の見解を持っており、ChatGPT が短期的に検索エンジンに取って代わることは非現実的であり、結局のところ、インターネット リソースにアクセスできない、誤解を招く情報を生成するなど、依然として多くの問題を抱えていると考えています。さらに、その機能がマルチモーダル検索シナリオに一般化できるかどうかはまだ不明です。

しかし、ChatGPT の登場が AI 研究者に確かに多くのインスピレーションを与えたことは否定できません。

Li Lei 氏は、最初の注目すべき点は、状況に応じた学習能力であると指摘しましたこれまでの多くの研究では、何らかの方法で既存のモデルの可能性を活用する方法を誰もが無視してきました(たとえば、機械翻訳モデルは翻訳のためにのみ使用され、より良い翻訳を生成できるかどうかを確認するためのヒントを与えようとはしませんでした)。しかし、GPT-3 と ChatGPT はそれを実現しました。したがって、Li Lei 氏は、以前のすべてのモデルをこの形式のコンテキスト内学習に変更し、テキスト、画像、またはその他の形式のプロンプトを与えて、能力を最大限に発揮できるようにできないかと考えています。これは非常に有望な研究となるでしょう。方向。

2 番目の注目すべき点は、人間のフィードバックが ChatGPT で果たす重要な役割ですLi Lei 氏は、Google 検索の成功は、実際には人間のフィードバック (検索結果をクリックするかどうか) が得られやすいことに大きく起因すると述べました。ChatGPT は、人々に回答を書いてもらい、モデルによって生成された回答をランク付けすることで、人間による多くのフィードバックを取得しますが、この取得方法は比較的高価です (最近の研究では、この問題が指摘されています)。したがって、今後は人による大量のフィードバックを低コストかつ効率的に取得する方法を検討する必要があると Li Lei 氏は考えています。

小紅樹の新技術「草を植える」

Xiaohonshu でマルチモーダルな知的創造の研究に従事している Zhang Debing 氏にとっても、ChatGPT は多くのインスピレーションを与えてくれます。

まず、このモデルは、複雑なマルチラウンド対話、さまざまなクエリの一般化、思考の連鎖などのさまざまなシナリオにおいて、小規模モデルと比較して大規模 NLP モデルの大幅な改善を直感的に示しています。モデルがありません。

Zhang Debing 氏は、NLP 大規模モデルのこれらの関連機能もクロスモーダル生成で試行および検証できる可能性があると考えています。現時点では、クロスモーダル モデルはモデル スケールにおいて GPT-3 や ChatGPT と比較して依然として大きなギャップがあり、NLP 分岐表現機能の向上を実証するクロスモーダル シナリオの作品も多数あり、これにより精度が向上します。ビジュアル生成結果の評価。学位は非常に役立ちます。クロスモーダルモデルの規模がさらに拡大できれば、モデル機能の「出現」も期待できるかもしれない。

第二に、第一世代 GPT-3 と同様に、現在のマルチモーダル生成結果は、選択すると非常に優れた素晴らしい結果が得られることがよくありますが、生成の制御性にはまだ改善の余地がたくさんあります。ChatGPT ではこの問題がある程度改善されているようで、生成されるものはより人間の希望に沿ったものになっています。したがって、Zhang Debing氏は、高品質のデータに基づく微調整や強化学習など、ChatGPTの多くのアイデアを参照することでクロスモーダル生成が試みられる可能性があると指摘しました。

これらの研究結果は、電子商取引やその他のシナリオにおけるインテリジェントな顧客サービス、検索シナリオにおけるユーザーのクエリとユーザーのメモのより正確な理解、スマートな作成シナリオにおけるユーザー素材のインテリジェントなサウンドトラッキングなど、Xiaohongshu の多くのビジネスに適用されます。生成、クロスモーダル変換、生成生成など。各シナリオでは、モデルのサイズが圧縮され、モデルの精度が向上し続けるにつれて、アプリケーションの深みと幅が引き続き強化および拡張されます。

Xiaohongshu は、月間アクティブ ユーザー数 2 億人の UGC コミュニティとして、コミュニティ コンテンツの豊富さと多様性を備えた膨大な量のマルチモーダル データ コレクションを作成しました。特に知的創造関連技術を中心とした情報検索、情報推奨、情報理解、その基盤となるマルチモーダル学習や統一表現学習においては、リアルデータが大量に蓄積されており、これらの分野においてユニークかつ実用的なイノベーションを提供しています。 . 広大な着陸シーン。

小紅書は依然として力強い成長の勢いを維持している数少ないインターネット製品の 1 つですが、グラフィックとビデオの両方のコンテンツを重視した製品形態により、小紅書はマルチモダリティ、オーディオとビデオ、検索と広告の分野で課題に直面することになります。そして多くの最先端の応用問題を生み出します。また、これにより多くの技術人材が集まり、Xiaohongshu 技術チームのメンバーの多くは Google、Facebook、BAT など国内外の一流メーカーでの勤務経験を持っています。

これらの技術的な課題は、技術者に新しい分野に本格的に参加し、重要な役割を果たす機会も与えます。将来的には、Xiaohongshu の技術チームが提供できる人材育成の余地はこれまで以上に広くなり、より優れた AI 技術人材の参加も待っています。

同時に、Xiaohongshu は業界とのコミュニケーションも非常に重視しています。「REDtech is coming」は、Xiaohongshu の技術チームが業界最前線のために作成したテクノロジー ライブ ブロードキャスト コラムです。今年の初め以来、Xiaohongshu技術チームは、マルチモダリティ、NLP、機械学習、推奨アルゴリズムなどの分野のリーダー、専門家、学者と綿密な交流と対話を実施し、ソリューションの探索と実装に努めてきました。学術研究とXiaohongshuの実践経験という二重の視点から貴重な技術的問題について議論します。

Supongo que te gusta

Origin blog.csdn.net/REDtech_1024/article/details/130196923
Recomendado
Clasificación