レコメンドと検索が大きなモデルに出会ったとき、どのような火花が起こるのでしょうか?

近年、レコメンドと検索は情報配信の重要な手段となっていますが、Xiaohongshu の UGC コミュニティは印象的ですが、レコメンデーション システムの何が特別なのでしょうか? 検索および推奨システムのリコール段階に関して、学術コミュニティでの主な進歩と主流の方法は何ですか? 大規模な言語モデルの台頭に直面して、レコメンデーションと検索の開発にはどのような機会と課題があるのでしょうか?

企業の技術幹部とコンピューティング技術分野の専門家や学者を結び付けて技術開発の動向について話し合うため、CCF CTO クラブが主催する CCF C3 イベントが 3 月 30 日に小紅樹に入りました。業界の多くの専門家や学者が「賢明な推奨事項」を活用しました。 「探求」をテーマに 、40名を超えるゲストと濃密な議論と交流を行いました。同時に、イベント全体は「Computer Society of China」、「Xiaohongshu Technology REDtech」、「Heart of the Machine」、「Qubit」などの複数のプラットフォームで同時にライブ中継され、合計16,000人以上が参加しました。多くの人々がオンラインで視聴し、ライブ ブロードキャスト データは CCF C3 イベントの歴史を新たに記録しました。

CCFの事務次長、企業活動委員会のディレクター、イーバンパワーのCEOであるWang Chao氏がイベントを主催した。

このイベントは、CCFの事務次長、エンタープライズ作業委員会のディレクター、イーバンパワーのCEOである Wang Chao氏が主催しました。CCFの副会長、Sinovation Venturesの主任研究員、蘭州科技の創設者兼最高経営責任者(CEO)の周明氏、 小紅樹科技の副社長の馮迪氏がそれぞれスピーチを行い、CCFを代表して周明氏はCCF C3イベント主催者感謝楯を発行した。イベント主催者のXiaohongshuさんに。このイベントでは、バグパイプと武漢大学国立サイバーセキュリティ学校のLi Chenliang教授を招待し、「小紅書レコメンデーションシステムの技術革新と実践」「検索およびレコメンデーションシステムのリコールフェーズにおける最前線の進歩」に関する基調報告を行った。ラウンドテーブルフォーラム「インテリジェントレコメンデーションの将来展望」では、バグパイプ氏がモデレータを務め、中国人民大学特別学者徐軍教授、北京知源人工知能研究所志源奨学生、天津大学准教授、ファーウェイが登壇した。ノアの箱舟 決断推理実験室長Hao Jianye 氏中国科学院計算技術研究所准研究員Ao Xiang 氏、Mobvista Technology人工知能最高責任者Zhu Xiaoqiang 氏、  Xiaohongshu 技術リーダーXia Hou 氏コミュニティで対話を行い、洞察を共有し、レコメンデーションと検索の未来を模索しました。

CCFの副会長でSinovation Venturesの主任研究員、Lanzhou Technologyの創設者兼最高経営責任者(CEO)である周明氏が講演した。

急速に発展するモバイル インターネット プラットフォームとして、Xiaohongshu は世代を超えた人々にとっての人生百科事典になりつつあります。コミュニティでは、写真、テキスト、ビデオ、コメント、インタラクションなどの大量の情報が毎日生成されており、これらのマルチモーダル データにより、Xiaohongshu アプリは推奨と検索のベスト プラクティスの場所となっていますが、かなりの技術的な課題も抱えています。バグパイプ氏は「小紅書推薦システムの技術革新と実践」というテーマレポートを共有した際、まず小紅書推薦システムの背後にある中核概念を企業全体の観点から解釈し、次に技術的問題と対処戦略について詳しく説明した。

Xiaohonshu - Bagpipe の技術担当副社長

小紅酒の事業を紹介する際、バグパイプ氏は、小紅酒の主なターゲットユーザーは当初の「高額支出の女性グループ」から、さまざまな事業開発段階を経て拡大し、より幅広い人々にサービスを提供したいと考えていると述べた。過去3年間で小紅書ユーザー数は急速に増加し、昨年末時点で月間アクティブユーザー数は2億6000万人、月間アクティブクリエイター数は2000万人を超えた。現在、小紅書は、 「世界の素晴らしさを共有し、発見するためのInspire Lives」を核コンセプトとして、多様なライフスタイルを集めた、一般人を助けるための一般人のためのコンテンツ共有コミュニティとして位置付けられています。小紅書は、コンテンツ豊富な UGC コミュニティとして、すべてのユーザーが世界中で見られるコンテンツを公開することを奨励しており、その推奨システムは業界の従来の慣行とは異なり、効率を追求するだけではなく、平等な配信に重点を置いています。 . . これには、より分散化されたトラフィック分散メカニズムが必要ですが、これはアルゴリズム モデルにとって大きな課題です。

Fengdi 氏は、Xiaohongshu のビジネス特性と組み合わせて、レコメンデーション システムの 4 つの主な課題、つまりマルチモードの異種コンテンツ レコメンデーション、分散型配信、関心の多様性とグループ分けコスト管理とコンピューティング能力の最適化について詳しく説明しました。小紅書人の仕事のやり方は「ユーザーに入り込む」ことであり、ユーザーエクスペリエンスを重視する姿勢は小紅書アプリにも反映されており、例えば2カラムの商品フォームにこだわるのは、ユーザーに権利を与えることである。自由に選ぶこと。従来の手動で定義された階層型タグでは、画像、テキスト、およびビデオ コンテンツを完全に記述することができません。Xiaohongshu の技術チームは、10 億枚の画像、テキスト、およびビデオ ノートに基づいて推奨システムにマルチモーダル事前トレーニングを適用して、コンテンツ ベクトル表現を取得します。コンテンツ表現と動作表現が接続され、2 つのドメインが共同でモデル化されます。

バランスの取れた全体的な効率制約の下で潜在的な推定とトラフィックの割り当てを行うにはどうすればよいでしょうか? 業界で認識されているコールド スタートの問題に対処するために、Xiaohongshu の適時性の高いレコメンデーション システムが「日レベルの更新」から「分レベルの更新」にアップグレードされました。これにより、新しいノートのコールド スタートとノートのサポートの両方にメリットがもたらされます。ニッチなコンテンツ。ユーザーエクスペリエンスを最適化し、ユーザーが情報の繭に陥るのを防ぐために、バグパイプ氏は、ユーザーのリアルタイムの興味を減らし、興味の多様性を確保し、集中的な追求を軽減するためのさまざまなインデックス忘れ戦略を設定すると述べた。これにより、ユーザーの長期的利益と短期的利益のバランスをとることができるだけでなく、群集生態学の繁栄も促進できます。

また、小紅書レコメンデーションシステムは、共通の興味を持つユーザーが十分にコミュニケーションできるように、非グローバル効率の最適化を追求しており、一言で言えば、「人々をグループにグループ化する」ことで、各ノートの内容と各ユーザーが自由に共有できるようになります。独自の方法で分類し、関心のあるサークル内でコミュニケーションを図ります。小紅書コミュニティでは、ユーザーと友達になり、誠実さを発揮し、ニッチなコンテンツを成長させ、人々をより緊密に結び付けます。Bagpipe は共有の最後に、業界が考えるべき 2 つの小さな質問、つまり効率的な関心調査の方法と維持のモデル化の方法についても提起しました。

データ爆発の時代には、誰もが情報検索を行う必要があります。推奨と検索が最も重要な方法であり、人間とコンピュータの対話が徐々に主流になってきました。産業界でも同様で、検索・推奨システムのリコール段階は非常に重要で、実際のビジネスシーンでは、数億の製品の中からユーザーが興味を持つ候補製品をいかに早く見つけ出すかが重要です。このステップにより、改良段階の成功が決まります。武漢大学のLi Chenliang教授は、「検索および推奨システムのリコール段階における最前線の進歩」について基調報告を行った報告書では、近年の検索およびプッシュシステムのリコールフェーズにおける主な進歩と主流の手法を、関連する最先端の研究と合わせて紹介し、今後の開発動向について議論した。

武漢大学国立サイバーセキュリティ大学教授 - 李晨良

リコール段階では、応答待ち時間に対する業界の厳しい要件により、より強力な機能を備えたモデル手法の適用が妨げられていますが、計算オーバーヘッドが大きくなります。Li Chenliang教授は、「リコールの主な目標は、効率とパフォーマンスを満たしながら低遅延を確保することです。これは、現在の研究にとって依然として克服できない課題です。これは技術ではなく、芸術です。」と指摘しました。同氏は、表現学習と対話型学習の2つの手法に焦点を当て、「ツインタワーモデル/ディープネットワークモデル、マルチインタレストモデリング、ロングテールデータ処理、シーンセマンティクスを強化するための外部データ」の4つの方向に焦点を当てて洗練させた。製品とユーザーの特性評価を行い、ユーザーのニーズを正確に特定します。その中で、ロングテール データの扱い方は、Xiaohongshu コミュニティの概念の背後にある推奨メカニズムと一致します。

基調報告を共有した後、バグパイプ氏は円卓会議の司会者を務め、中国人民大学の徐軍教授、天津大学の郝建業教授、アオ・シャン氏、中国科学院研究員の朱暁強氏らと議論した。 Mobvista Technology の最高人工知能責任者、Xiaohongshuコミュニティのテクニカル ディレクターであるXia Hou 氏、および現場ゲストが「インテリジェント レコメンデーションの将来展望」について徹底的なディスカッションを行いました。インテリジェントな推奨と検索は、産業実務と最先端の探査の両方において非常に重要な古典的な問題です。最近、ChatGPT の人気により、大規模言語モデルや AIGC などのホットなトピックが各界から注目を集めています。バグパイプ氏は、「彼らの流行は、推奨と検索の発展にどのような機会と課題をもたらすのでしょうか?」と質問し、ラウンドテーブルディスカッションが始まりました。ゲストたちは自身の経験をもとに意見を述べた。

中国人民大学の著名な学者教授、北京知源人工知能研究所の知源奨学生 - Xu Jun

主に検索を研究しているXu Jun教授は、Microsoft New Bingの例を用いて、大規模な言語モデルの台頭により、従来のインターネットの検索習慣と広告収益モデルが変化すると説明しました。Hao Jianye教授は、従来のレコメンデーションシステムは限られたユーザーデータに基づいており、過剰適合によって同様のコンテンツを配信するが、実際にはユーザーの心の変化を真に理解することはできないと指摘し、レコメンデーションと大規模モデルの組み合わせに期待していると述べた。将来的には、レコメンデーションが真の「インテリジェント」「パーソナライズ」「人間化」を実現できるようになります。Ao Xiang 氏は、新しいツールを積極的に採用すべきであると提案しました。一方で、モデルによって得られた結果を完全に信じるべきではなく、さまざまなシナリオに基づいて評価する必要があります。他方では、モデルによって得られる結果をどのように評価するかをもっと考える必要があります。大きなモデルを使用してより多くの価値を実現します。

天津大学准教授、ファーウェイ・ノアの方舟意思決定推論研究所所長 - Hao Jianye

レコメンドと検索テクノロジーの本質は、より良い世界を構築するという本来の目的を達成するために、より正確で質の高い情報を消費者に提供することです。バグパイプが共有したように、ニッチ コミュニティにはより効果的な露出と一貫したユーザー グループが必要ですしかし、大規模な言語モデルがレコメンダー システムに取って代わるのでしょうか? 業界出身の朱暁強氏は、短期的には保守的、長期的には急進的な態度をとっている。短期的には、大規模な言語モデルは企業に個人データを超えた常識を提供しますが、長期的には、人々が情報を入手する方法が変化すると、情報配信テクノロジーは新たな影響に直面し、元の推奨フォームやモデルの再構築が必要になる可能性があります。 . ビルド、これは私たちの頭上にぶら下がっている剣です。Xia Hou 氏は、今後 3 ~ 5 年で直面する課題を提案しました。従来の検索とレコメンデーションは、ユーザーのクリックによって引き起こされる行動パターンに基づいています。以前は、アルゴリズム配信モデルはユーザーのクリックのみによって駆動されていましたが、現在はユーザーの行動 + コンテンツ理解によって駆動される配信モデルに移行しつつあります。検索とプッシュの統合を真に実現し、ユーザーの効率をさらに向上させることができるでしょうか。行動?

中国科学院計算技術研究所准研究員 - Ao Xiang

その後、バグパイプは各ゲストに特別な質問を用意し、全員に 1 つずつ共有するよう求めました。Xu Jun教授は、産業界、学界、研究において豊富な経験を持ち、インテリジェントな情報検索の分野における最新の進歩、つまりユーザーのフィードバックのバイアスを発見して除去する方法について共有しました。ChatGPT は RLHF (ヒューマン フィードバックに基づく強化学習) の人気を高めました。Hao Jianye教授は、RLHF と従来の強化学習の違い、および推奨事項のインスピレーションについて説明しました。データ品質のキャプチャから始めて、まず非常に正確な大規模な長期学習を確立します。ユーザー関心モデルという用語を使用し、これに基づいて革新的な作業を行います。「ユーザーのプライバシーとセキュリティを保護しながら、金融詐欺対策の経験をレコメンデーション システムにおける AICG の悪用に対処する方法」について語る際、Ao Xiang 氏はまた、正確なユーザー行動モデルを確立することが非常に重要であると考えています。ユーザーの行動と意図をより深く理解するために、社内のデータの壁を打ち破り、データをオープンにし、マルチモーダルで長期にわたる完全なユーザーデータ分析を実現する必要があります。Zhu Xiaoqiang 氏は、推奨アルゴリズムとデータ モデリングにおける DAU が 1 億を超える大規模 APP と DAU 数百万の小規模 APP の違いについて詳しく説明しました。レコメンデーション システムを設計するときは、法律、プライバシー、セキュリティ、データ、その他の問題を考慮する必要があります。「高品質のデータがなければ、テクノロジーについて話すだけでは間違いなく空中の城に過ぎません。」彼は良質なデータの重要性を強調し、実践的な洞察を共有しました。大規模なモデルは、国境や言語の壁を取り除き、さまざまな国や地域のユーザーの行動や文化を理解し、ユーザーにレコメンデーション サービスをより適切に提供できます。ユーザー規模、コミュニティの閉鎖性、商業的オープン性の間でトレードオフを図るために、Xia Hou 氏は、Xiaohongshu のインテリジェント レコメンデーション ビジネスが直面する 3 つの主要な課題、つまりシステムの複雑さ、ターゲットの多様性、コンテンツの多様性について話しました。

Mobvista Technology 最高人工知能責任者 - Zhu Xiaoqiang

最後に、ゲストらは「統合された次世代レコメンドシステム技術の可能性」と「インテリジェントレコメンドの産業構造に対するデータ、コンピューティングパワーなどのリソースの影響」について深い議論を行いました。大規模な言語モデルに直面して、私たちは新しいものを積極的に受け入れ、注意深く検討し、よりパーソナライズされたインテリジェントな推奨事項や検索を行う必要があります。おそらく、インテリジェント レコメンデーション テクノロジーが将来のオペレーティング システムの基礎となり、AI 分野が他の分野に輸出される日が来るでしょう。

CCFはCCF C3活動を通じて中国企業向けの技術交流プラットフォームを構築したいと考えており、2年間で18回のイベントの取り組みを通じて、コンピューター、インターネット、AIおよび関連分野で高い評価を確立している。第18回CCF C3イベントが小紅樹で開催され、多くの講演者やラウンドテーブルのゲストの方々の素晴らしい講演に大変感謝しており、活発な雰囲気の交流が行われました。イベント全体の録画および再生ビデオがありますので、「REDtech」ビデオ アカウント、Station B、および「CCF Digital Library」でぜひチェックしてください。小紅書は長年にわたり技術開発と人材育成を重視しており、業界全体と協力して進歩していきたいと考えておりますので、次回お会いできるのを楽しみにしています。

おすすめ

転載: blog.csdn.net/REDtech_1024/article/details/130241648