07プレフィックス-適応型で時間に敏感なパーソナライズされたクエリのオートコンプリート

1.
タイトル:Prefix
-Adaptive and Time-Sensitive Personalized Query Auto Completion
Prefix -Adaptive and Time-Sensitive Personalized Query Auto Completion
キーワード:
Query auto complete ;
Personalization
;
ロングテール;
ウェブ検索

2.概要
要—クエリオートコンプリート(QAC)メソッドは、検索エンジンユーザーがクエリの入力を開始するときに、クエリを推奨します。現在のQACメソッドは、ほとんどの場合、過去の人気度、つまり以前にクエリとして送信された回数に基づいてクエリの完了をラ​​ンク付けします。ただし、クエリの人気は時間の経過とともに変化し、ユーザーによって大幅に異なる場合があります。したがって、クエリ完了のランキングを調整する必要があります。以前の時間に敏感でユーザー固有のQACメソッドが開発されました
これとは別に、時間に敏感でもパーソナライズされていない方法よりも大幅に改善されています。時間に敏感でパーソナライズされたハイブリッドQACメソッドを提案します。ロングテールプレフィックスを処理するように拡張します。これは、時間感度とパーソナライズからの寄与に最適な重みを割り当てることで実現します。実際の検索ログデータセットを使用して、人気の傾向と周期的な人気行動から推定された予測人気によってランク付けされた上位N個のクエリ候補を返します。ユーザーの以前のクエリ(現在のセッションと以前のセッションの両方)との類似性を統合することにより、それらを再ランク付けしました。私たちの方法は、最先端の時間に敏感なQACベースラインを上回り、平均相互ランク(MRR)に関して3〜7%の全体的な改善を達成しています。重みを最適化した後、

検索エンジンのユーザーがクエリの入力を開始すると、クエリ自動完了(QAC)メソッドがユーザーにクエリを推奨します。現在のQACメソッドは、主に過去の人気(つまり、以前にクエリとして送信された回数)に基づいてクエリの完了をラ​​ンク付けします。ただし、クエリの人気は時間の経過とともに変化し、ユーザーごとに異なる場合があります。したがって、クエリの完了順序を調整する必要があります。以前の時間に敏感な方法とユーザー固有のQAC方法は別々に開発されたため、時間に敏感でもパーソナライズされていない方法と比較して大幅に改善されました。時間に敏感でパーソナライズされたハイブリッドQACメソッドを提案します。時間に敏感でパーソナライズされた貢献に最適な重みを割り当てることにより、ロングテールプレフィックスを処理するように拡張します。実際の検索ログデータセットを使用して、人気の傾向と定期的な人気のある行動に従って、予測された人気で並べ替えられた上位N個のクエリ候補を返します。類似性をユーザーの以前のクエリ(現在のセッションと前のセッション)と統合します。それらを再配置します。私たちの方法は、最先端の時間に敏感なQACベースラインを上回り、平均相互ランキング(MRR)で全体的に3%から7%の改善を達成しています。重みを最適化した後、拡張モデルは4%から8%のMRRの改善を達成しました。

3.イノベーションと学術的価値
時間に敏感なクエリの人気とユーザー固有の
コンテキストの両方を考慮することにより、クエリの自動完了の課題に斬新な方法で対処します。(1)時間に敏感なクエリの人気とユーザー固有のコンテキストを考慮することによって自動クエリ完了の課題を解決します。
クエリ人気の周期的振る舞いと最近の傾向を調査する新しいクエリ人気予測方法を提案します。
(2)クエリ人気の周期的動作と最近の傾向を調査できる新しいクエリ人気予測方法を提案します
ハイブリッドQACモデルを拡張して、クエリの人気とユーザー
固有のコンテキストからの寄与を最適化することにより、ロングテールプレフィックスを処理します。(3)クエリの人気とユーザー固有のコンテキストの寄与を最適化することにより、ハイブリッドQACモデルを拡張して処理します。ロングテールプレフィックス。

4.学習作業に関する結論と啓発の理解これ
まで、自動クエリ完了に関する作業のほとんどは、時間に敏感な最大尤度推定またはコンテキスト認識の類似性に焦点を合わせていました。この論文では、QAC問題の両方の側面を組み合わせています。ユーザーの検索意図を理解するために、時間に敏感なQACメソッドは、パーソナライズされたQACによって拡張されます。これにより、現在のクエリと、現在の検索セッションおよび前の検索タスクでの前のクエリとの間の文字の類似性を推測できます。さらに、この論文では、ロングテールプレフィックスのモデルも調整しました。また、ロングテールプレフィックスの人気を確認した後、固定の重みを使用する代わりに、それに最適な重みを割り当てるように最適化されました。

今後の調査作業:
今後の作業では、人気ベースのランク付け方法によって返される上位N個のクエリの完了を慎重に調査する予定です。N> 10:下位のクエリの完了からどのくらいのメリットが得られますか?さらに、目標は、長期クエリログを使用してメソッドを他のデータセットに転送することです。これは、現在の作業で使用されているAOLおよびSnVログよりもアクセス時間が長い定期的なクエリの恩恵を受けるのに役立ちます。QACの結果を多様化することはどの程度有益ですか?さらに、提案のすべてのプレフィックスに最適な重みを使用することを検討し、トレーニング期間中に同様のユーザーログのセットを使用して、長期のユーザー検索ログを取得できないことによって引き起こされるコールドスタートの問題を解決できます。もう1つの可能なステップは、アクティブユーザー、特にプロの検索者向けにパーソナライズされた時間パターンを確立することです。これには、実際のクエリ用語からトピックまたは意図への一般化が必要です。これにより、クエリ完了ランキングが向上する可能性があります。

おすすめ

転載: blog.csdn.net/weixin_37996254/article/details/108901929