タオバオのVOCデータインサイトの応用と実践詳細ページ

9006ba1626729976521daf902b22cd5e.gif

このトピックには 10 件の記事があり、過去 1 年間のユーザー エクスペリエンス データ サイエンス (ビジネスの詳細、物流、パフォーマンス、ニュース、カスタマー サービス、ジャーニーなどを含む) の分野における淘宝 APP の基本リンクの探索と実践的な経験が含まれています。 . 記事。

ビジネス詳細ページでのユーザーの動線とVOCに基づいたユーザーの意思決定要因のマイニングにより、閲覧エクスペリエンスが向上し、物流面では、ユーザーが助けを求める時間と実際の物流停滞時間の関係を洞察し、物流製品を改善するための表現戦略を策定します満足度; パフォーマンス最適化ドメインの構築 主観と客観の相関モデルにより、最適化目標を明確にするための起動時間と負のフィードバック指標のマジックナンバーを見つけます; ユーザーの行動とユーザー VOC の洞察を包括的に使用するマルチソース VOC ラベル システムを構築します、ランディング エクスペリエンス最適化戦略、および一連のユーザー エクスペリエンス分析方法論をまとめています。

この記事はこのシリーズの 2 番目の記事です。前回の記事を参照してください—

パート 1:タオバオのユーザー エクスペリエンス分析手法

900a60589a79df869917400c5bf42b56.png

序文

ユーザーエクスペリエンスとは、ユーザーが製品を使用する過程で確立される主観的な感覚であり、ユーザーの期待と強く関係しています。ユーザーが異なれば、同じ製品を異なるニーズで使用しても、異なるエクスペリエンスが得られます。これらの違いをデータを通じて認識し、形成できれば、製品最適化戦略を導入すれば、必ず製品のエクスペリエンスが向上します。

この記事では、データ サイエンスがユーザーの行動力学とユーザーの VOC (顧客の声) データに基づいて指標とラベルを構築する方法を簡単に紹介し、ユーザーの行動力学とユーザーの意図の違いを洞察し、影響を与える要因を掘り下げます。消費者の閲覧エクスペリエンスを詳細に把握する重要な要素が、製品実装の最適化戦略を導き、エクスペリエンス向上効果をもたらします。さらに、読者がケース全体の作業プロセスを明確に理解できるように、この記事は BPPISE 数学ケース フレームワークを使用して書かれます。

df06110d0ed97a32697ce4442753b701.png

ビジネスの背景

ユーザー満足度調査によると、消費者は赤ちゃんの詳細ページでの重要な情報の取得と情報のスクリーニングの効率性に対して大きな要求を持っており、当時、業界の重要な要素(規模、パラメーター、成分など)は分散しており、固定されたものでした。フロントデスクの精神表現を改善する必要がありました。消費者のブラウジングエクスペリエンスを詳細に改善するために、業界次元の違いによる意思決定要素に関連する製品のメイン画像やファーストスクリーン情報などの主要モジュールをアップグレードして、消費者の意思決定リンクと消費者の意思決定のスムーズさを向上させたいと考えています。ビジネスの成長をもたらします。

従来の商品に関する意思決定要素の提供は、業界の若手の経験入力に依存しており、一部の業界はユーザー調査に依存していますが、その調査は範囲が限られており、粒度が粗く、洗練された運用のためにカテゴリや人々のグループに絞り込むことができません。したがって、この場合、データサイエンスは主観的データと客観的データを包括的に使用して分析モデルを確立し、さまざまなグループやカテゴリの下でユーザーの詳細な行動、ニーズ、違いを洞察し、製品エクスペリエンスを最適化する提案を提供し、検証するためのAB実験を設計します。の効果。


9fb8663e1549048875f967da20ec312b.png

問題定義

データ サイエンスは、「実際のビジネス上の問題」を「データ世界の問題」に変換し、データ サイエンスの理論、技術、ツールを使用してデータを知識に変換し、ビジネス上の問題を解決するための直接的なガイダンスを提供する学問です。ビジネス上の問題に関しては、データで解決できる問題を正確に定義する必要があります。

▐データ  の選択

賢い女性はご飯がなければ料理ができない. データの問題を定義する前に、問題の測定可能性を確保するために、問題を解決するためにどのようなデータが必要かを明確にする必要があります。ビジネス上の問題の理解に基づいて、詳細な製品エクスペリエンスのアップグレードの背後にある中心的な前提を検討してください:ユーザーが異なれば、異なるニーズを持つ異なるカテゴリの製品を閲覧した後、異なる要素に注意を払う可能性があります。詳細な製品が柔軟な差別化を備えて構築されている場合、企業は、意思決定の効率性と取引変換率に成長の機会をもたらすに違いありません

この仮定に基づいて、次の 2 種類のデータを調査することが問題解決に重要な役割を果たすと推測できます。

  1. ユーザー移動データ: モジュールの露出、スライド、クリック、滞在などの詳細を含む、ユーザーの入場から退出までの一連の時系列行動データ。このタイプのデータは、ユーザーの特定のパフォーマンスを反映することができます。

特に、従来のページ レベルの埋め込みポイント データ (つまり、ページ ビュー、露出、クリック イベント) とは異なり、このシナリオは単一ページ内のモジュール レベルの埋め込みポイント データ (モジュールのスライディング、露出、クリックを含む) に調整する必要があります。 、滞在など)。

  1. ユーザーオリジナル音声データ(VOC): APP フィードバック チャネルを通じてユーザーが表現したオリジナルの音声 このタイプのデータは、さまざまな商品情報表現に対するさまざまなユーザーのさまざまなニーズを抽出できます。

特に、VOC のソースが多数あるため、テキスト情報の処理は複雑でコストがかかり、プロジェクトの方向性と焦点を維持するにはターゲット データを正確に選択する必要があります。

VOCチャンネル

データの特性と制限

販売者の顧客サービスに関するコンサルティング

製品・サービスの販売前・販売後のユーザーからの相談が活発化

APP ユーザーのフィードバック

ユーザーは、モバイル淘宝網を使用する過程で製品エクスペリエンスの問題に遭遇し、事前販売を好み、プロアクティブなサービスを好みました。

助けのためのプラットフォーム

注文後にユーザーが遭遇したサポートや紛争、部分的なアフターセールス、プロアクティブな対応を求める

製品レビュー

商品を受け取った後のユーザーの評価、部分的なアフターセールス、消極的

みんなに聞いてください

商品情報に関するユーザーの C2C コンサルティングは、販売前および事前対応に限定されます

タオバオのVOCデータソースと特徴の概要

タオバオ VOC データの特性と制限と組み合わせて、この場合、詳細な製品に対してユーザーが表明する差別化されたニーズを理解するために、販売者の顧客サービス コンサルティングがターゲット データ ソースとして選択されます。特に、このデータの選択は、店舗詳細入口からの消費者のオンライン相談の最初の効果的な文は、販売前の製品情報についてユーザーが最も関心がある可能性が高い、つまり、ユーザーのニーズを最もよく反映します。問題は、製品に関する疑問、情報の不足、コンサルティングに関するアドバイスなどです。

▐問題  の定義


ビジネス上の問題を解決するためのターゲット データがあることを確認した後、この場合のデータ上の問題の定義を示します。

ユーザーの動線と加盟店の顧客サービス相談VOCに基づいたデータモデルを確立し、ユーザーの意思決定に影響を与える重要な要素を詳細に分析および要約し、異なるグループの意思決定要素の違いを洞察する方法さまざまな業界で、詳細な製品の構造化された表現戦略を導き、閲覧の変換効率を向上させます。

9f4b0b2d65913d27e3c5744951b44dc3.png

データの準備

データの収集、処理、前処理はデータ サイエンスの重要な部分です。このセクションでは、プロジェクトがより正確な結果を得るのに役立つクリーンで一貫性のある使用可能な基本データを確保するために、モジュール レベルの埋め込みポイントと VOC ラベル データを準備する方法を紹介します。

▐ユーザーの  動的データ

モジュール

イベント

埋点名称

埋め込みパラメータ

価格モジュール

暴露

露出-ホームページ-価格コンポーネント-展示会

Page_Detail_Show-Price

クリック

コントロール - ホームページ - 価格コンポーネント - クリック

Page_Detail_Button-Price

タイトルモジュール

暴露

露出-ホームページ-ブランドビジネスロゴ-展示会

Page_Detail_Show-ブランド

クリック

コントロール - ホームページ - ブランド ビジネス ロゴ - クリック

Page_Detail_Button-ブランド

暴露

露出-ホームページ-タイトルコンポーネント-展示会

Page_Detail_Show-Title

クリック

コントロール-ホームページ-タイトル-長押し-共有

Page_Detail_Button-GoodsTitleShare

...

...



詳細イベント埋設ポイント図

ユーザー移動データは、次の埋め込みポイント収集リンクに焦点を当てています。 従来のクライアント ページの埋め込みポイントとは異なり、このケースではページ内のモジュール レベルでの正確な分析が必要です。そのため、埋め込みポイントの仕様のセットは、モジュール間のユーザーを認識するためにカスタマイズされています。 相違点に焦点を当てます。 。上表に示すように、タイトル、属性パラメータ、詳細内のグラフィック詳細など、複数のモジュールコンポーネントのクリック、表示、消失ポイントが定義および収集され、ユーザーのコア閲覧指標(露出率の制御)の出力をサポートします。 、クリック率、クローズ率、スリップ率、滞留時間など)。

▐ユーザー  VOCデータ

加盟店の顧客サービスコンサルティングセッションデータには、ユーザーの商品に対する魅力や意思決定情報が数多く隠されており、その後の構造分析をサポートするために、データの可用性と効率性を確保するためにVOCデータにラベルを付ける必要があります。

  • ラベルデザイン

レベル 1 ラベル

二次ラベル

三次ラベル

商品相談

製品パラメータ

産地、保存方法、原材料など…


製品包装

梱包方法、通常数量...


商品の用途

食べ方・注意点


...

...

在庫コンサルティング

在庫はありますか

...

...

...

...

VOCラベルのデザイン例

ラベル データ出力の一貫性を確保するには、ラベルの設計原則を明確にする必要があります。ラベルは 3 つのレベルに分かれています。

  1. レベル1:業界を超えて比較・分析でき、製品や業界の違いによるコンサルティングスキルの大きな差がない一般的なコンサルティングタイプ。

  2. レベル 2:食品業界におけるお茶と乳製品など、コンサルティング キーワードの 1 つのカテゴリ内で同様のセマンティクスを持つ、単一業界内の第 1 レベルのカテゴリ間で比較および分析できるコンサルティング タイプの場合。

  3. レベル 3:単一の第 1 レベル カテゴリ内のリーフ カテゴリ間で比較および分析でき、お茶のカテゴリ、プーアル茶とハーブ茶など、相談キーワードのカテゴリ内で同様のセマンティクスを持つ相談タイプの場合。3 番目のレベルには、摘み取り時期、適切な茶器セット、成長期などが含まれます。

  • ラベル抽出

61f2f0ec94b8704751121de04591b247.png

ラベル抽出プロセスの模式図

VOC ラベル抽出の本質はテキスト分類問題です。NLP 分類は Bert の提案と進化により成熟しました。分類効果に影響を与える重要な要素は、正確なトレーニング セットを構築する方法です。現在のビジネス状況の需要と組み合わせると、トレーニング セットを構築するための要件は次のとおりです。

  1. モデルの一般化能力を確保するために、トレーニング セットは可能な限りデータの状況をカバーする必要があります。

  2. トレーニング セットを構築するプロセスは、プロジェクトのリズムに合わせて処理コストを節約するために、できる限り効率的である必要があります。

上図に示すように、aとbの2つの問題を解決するため、その過程では、まずテキストクラスタリングを用いてユーザーの生の声を同じカテゴリーにまとめ、ユーザーの相談意図の構成を完全に把握します。ラベル作成の反復プロセスを短時間で実行できるため、ラベル定義について合意に達し、トレーニング セット構築の効率を向上させることができます。

実際のユーザーのオリジナル音声データでは、長文と短文の間で不整合が発生し、従来のテキスト クラスタリング手法 (TF-IDF/Word2Vec を使用して文ベクトルを生成する方法など) は非常に分散しており、精度が低いため、クラスタリングの結果も悪いため、結果としてマークできません。この場合、BIO+CRFの手法を使用してVOCからバイナリキーフレーズを抽出し、特徴抽出のための品詞判定と組み合わせて、動詞+動詞、動詞+名詞、形容詞+名詞などの組み合わせにまとめます。その後、DBSCAN によってクラスター化されます。このタイプの方法の特徴は次のとおりです。

  1. キー フレーズの抽出:中心的な意味を最もよく表す短いテキストはバイナリ フレーズの組み合わせである可能性が高く、動詞 + 動詞、動詞 + 名詞、名詞 + 形容詞などのフレーズの組み合わせは、短いテキストの中心的な概念を最もよく強調できます。 。例: ページ #開けません (n+adj)、#transaction (v+n) を閉じます。

  2. DBSCAN クラスタリング:新しい商品カテゴリの場合、設計できるタグの数と VOC の全体的な使用率を評価することは不可能です。密度ベースの DBSCAN クラスタリング手法は、VOC を自然に 2 つのカテゴリに分類します: 形成可能なクラスターと形成できないクラスター (ノイズ); ノイズ比インジケーターを使用して、VOC 利用率を評価し、生産チェーンのさまざまなパラメーターを継続的に最適化できます。

8d2790b3c131536104bf3e91139d99b8.png

分析的な洞察

必要なデータを準備した後、通常、分析目標の明確化、分析アイデアの設計、分析結論の形成、データ戦略の実行の 4 つのステップで分析を開始します。

▐分析の  目標

詳細動線分析の主な対象は「ユーザー」「商品」「閲覧行動」の3つであり、「どのようなユーザー」が「どのような商品」を入力することで「どのような閲覧行動」が発生し、各モジュールの閲覧とクリック、滞留時間データと動作タイミング。主流ユーザーの行動経路と注目情報を包括的に要約し、消費者の需要を満たすために製品エクスペリエンスをアップグレードすると同時に、一部のユーザーの行動と焦点の違いを掘り起こし、ビジネス増幅価値があるかどうかを判断します。

  1. どのようなユーザーか:客観的特徴(年齢、消費力、性別など)+主観的意図(購買・買い物)

  2. どのような商品: カテゴリ、決定サイクル、価格特性など。

  3. どのようなブラウジング行動か: モジュール露出のクリックスルー率、滞在時間、スキップ状況など。

▐分析の  アイデア

動線分析は、次の仮説に基づいています。さまざまなグループ、カテゴリ、シナリオのユーザーの意思決定要因を区別し、表現を強化することで、詳細なユーザーの閲覧エクスペリエンスが向上し、ショッピングの意思決定の効率が向上します。

  • 仮説ツリー

f12935640eb4f0fa15328d966d2b1c12.png

  • 分析次元

5e8a811162797d4c82e8fa4b9ad25be3.png

  • 分析指標

6c7ef57398ab0639742dc030c4f0c184.png

▐分析  結果(紳士服)

  • 動作解析

bc6d2904a224d32a0839b48bf60536f2.png

  • VOC分析

fa114e28ee7363176d75f4ed99970a85.png

▐戦略的  成果(紳士服)

  • 全体的な結論

紳士服カテゴリの詳細ページの場合、ユーザーはモジュール a、b、c にさらに注目し、モジュール a はより多くの顧客サービスをガイドします。主な理由は、既存の詳細には、詳細な画像/効果表示の欠如などの経験上の問題がある可能性があるためです。 、サイズコンポーネントに関する基本情報を見つけるのは困難です。紳士服の購入を決定する際、ユーザーは主にサイズ、品質など (季節の特性も考慮) に注目します。

ソースの観点から見ると、最初にソースを推測するユーザーはショッピングの明らかな特徴を持っており、ストアの推奨や店舗への入店を通じて興味のある商品を見つける傾向が高くなりますが、ライブ ページのソースを推測するユーザーの全体的な閲覧深度は低くなります。かなり浅くなっています…。

群衆の観点から見ると、男性はモジュール a の使用に積極的でスタイルに注意を払い、メンバーは x に注意を払い、新規顧客は y に注意を払い、高額商品を購入するユーザーは z に注意を払います。

カテゴリに関して言えば、ユーザーはカテゴリ x の a、b、c に注目します。

  • 最適化の提案

分析結果に基づいて製品の最適化を提案するには、ビジネスが採用されるかどうかを明確にし、導入ペースをフォローする必要があります。特に数学系学生は製品・事業に対する認識や理解に個人差があり、その最適化提案が毎回採用されるわけではなく、過去に打ち出された提案もあり、導入を進めるためには製品系学生との緊密なコミュニケーションが必要です。

449e128cd0caced607ea3ea59c2a7d90.png

64e25b97a009fdf001ae41b60c66df65.png

戦略の実行

9714a4aa12822dd9ce85926a6b4b8ccc.png

b56430d26f6da65ef2283e696257b3a0.png

31e634e530faca2106f50f7e2126dd68.png

効果評価

実験的層別化

d4e35dadbd0f022a8a25e1e1c8d5b715.png

実験データ:トランザクションのコンバージョン率は大幅に +x%、単一 UV 値は大幅に +y%、トランザクション UV コンバージョン率はわずかにプラス、1 人当たりの ipv は大幅に -a%、1 人当たりの滞在時間は大幅にプラス大幅に-b%となっています。

実験の解釈:この事例に基づく最適化手法は、詳細な商品の変換効率を大幅に向上させ(変換率を大幅に向上)、ユーザーの意思決定効率を向上させます(一人当たりの IPV と滞在時間を大幅に削減)が、同時により多くのユーザーがコンバージョンを獲得できていない(トランザクション UV のコンバージョン率の効果が弱い)ため、本質的に商品体験の向上につながり、その効果は期待に応えています。

efe345fa0d62c56cc4ec30c47fbbee04.png

チーム紹介

私たちは淘宝網テクノロジーのトランザクションパフォーマンスデータサイエンスチームであり、淘宝網のトランザクションパフォーマンスリンク(注文、支払い、ショッピングカート、物流、リバースなど)の膨大なデータからDAU、DAC、ユーザーエクスペリエンス成長の機会をマイニングする責任を負っています。チームは、ユーザーの行動経路とユーザー VOC に関するユーザーのニーズを理解し、人間と商品のマッチング ランディング トランザクション リンク、コンバージョン、再購入、およびエクスペリエンス戦略に基づいて消費者のショッピング エクスペリエンスを向上させることに取り組んでいます。
 現在、チームは人材を募集しています。消費者、商品、貿易、マーケティング、その他の関連分野でデータ分析/データ サイエンスのバックグラウンドを持つ人材を歓迎します。ご興味のある方は、履歴書を [email protected] までお送りください。

¤ 拡張読書 ¤

3DXR技術 | 端末技術 | オーディオおよびビデオ技術

サーバーテクノロジー | 技術品質 | データアルゴリズム

おすすめ

転載: blog.csdn.net/Taobaojishu/article/details/131297864