ユーザーフィードバックがDouyin製品エクスペリエンスの最適化の実践を促進

概要

Douyinアプリは、毎日大量のユーザーフィードバックを受け取ります。NLPインテリジェントフィードバックマーキングモデルは、フィードバックデータシーンラベルの構築を可能にし、ビジネスの観点からのエクスペリエンスインジケーターの集約を実現します。単語クラスタリングアルゴリズムは、毎日のフィードバックホットスポットをリアルタイムで改善し、問題の発見にすばやく焦点を合わせます。インテリジェントアルゴリズムに基づいて構築されたエクスペリエンス管理プラットフォームは、フィードバックからDouyinベースの製品の保持、成長、または口コミの改善の可能性のあるポイントを掘り起こし、テクノロジープラットフォームを通じてエクスペリエンス問題のガバナンスの改善を促進することを目的としています-ベースのアプローチとフィードバック主導のメカニズム。、製品体験を向上させるため。

プラットフォームの背景紹介

Douyinアプリには1日あたり1億人のアクティブユーザーがいて、毎日大量のユーザーフィードバックを受け取ります。ユーザーフィードバックは、将来の製品開発、カスタマーエクスペリエンスの向上、および全体的な顧客満足度にとって非常に重要です。ユーザーからの否定的なフィードバックを適切に処理することで、ユーザーの忠誠心を効果的に向上させることができます。大量のユーザーフィードバックデータから貴重なフィードバック情報を抽出することは、多くの場合、2つの問題点に直面します。

第1に、フィードバックにはコンテキスト化が欠けており、フィードバックデータをより細かく分類して属性付けし、段階的にシーンのエクスペリエンスを向上させることは不可能です。
2つ目は、フィードバックの有効性が低いことです。大量のフィードバックから効果的なユーザーフィードバック情報を抽出して、問題をさらに特定し、操作を改善し、フィードバックループを閉じてエクスペリエンスを向上させる方法。

このような問題点とビジネスの要求に基づいて、ユーザーエクスペリエンス管理プラットフォームが誕生しました。これは、テクノロジープラットフォームベースのアプローチをフィードバック駆動型メカニズムと組み合わせて使用し、製品化された方法でDouyinベースの製品のフィードバックをマイニングすることを目的としています。データ。成長または口コミの改善の潜在的なポイント、経験問題ガバナンスの改善を促進し、製品経験を改善します。プラットフォームシステムのアーキテクチャ図を次の図に示します。

フィードバックライフサイクル

ユーザーがフィードバックを送信すると、端末は指定されたパラメーターに従ってデータをフィードバックサーバーに報告して保存します。フィードバックバックグラウンドはデータベースからデータを取得し、フィードバックデータを処理および消費する役割ごとにコンソールに表示します。具体的な概略図は次のとおりです。

図に示すように、エクスペリエンス管理プラットフォームはフィードバックライフサイクルの最後のリンクにあります。技術アーキテクチャの設計に関しては、2つの部分に分割しました。1つは、マーキングの操作を中心に展開するフィードバックワークベンチです。、フィルタリング、および元のフィードバックデータの分類。2番目の部分はエクスペリエンス管理プラットフォームです。エクスペリエンス管理プラットフォームは、タグの分類に基づいてシーンマッピングを実行し、貴重なデータインジケーターを抽出し、インジケーターデータをドリルダウンして拡張し、ポートレートレベルの分析と要約を提供し、エクスペリエンス管理を提供します。特別な問題フォローアップし、作業指示書の解決を進め、経験の閉ループを完了します。上記の知識に基づいて、プラットフォームシステムを5つの主要なモジュール、つまりフィードバックワークベンチ、ラベリングシーン、エクスペリエンスインジケーターの概要、画像の元のサウンドの詳細な取得と分析、および特別なエクスペリエンス管理に分割します。

NLP赋能场景化标签构建

基于NLP技术的智能反馈打标模型

搭建一个反馈管理工作台是处理反馈进线数据的必备条件，旨在提供对用户反馈的查看、回复、分类、标记。同时维护对分类标签树内容以及逻辑个性化自定义配置。

面对海量用户反馈数据，人工打标是非常低效的。平台通过前置引入无效反馈打标模型，能够过滤无效的用户反馈，提升运营处理效率；通过引入预训练的神经网络技术，理解和识别用户反馈意图，显著提升了用户反馈分类的准确率和及时性。我们预训练模型训练步骤主要包括：

在用户反馈数据集进行领域自适应预训练，有效学习反馈领域中常用的语言知识；
在目标业务数据集上进行任务自适应预训练，有效学习该特定领域下的常用知识；
在目标数据集上训练分类模型，能够有效拟合具体业务的分类目标。采用了继续预训练方法之后，用户反馈打标模型效果得到显著提升。

为了解决长尾标签样本数量不均衡的问题，我们在预训练模型的基础上，采用了标签迁移学习与多标签分类技术，显著提高了长尾标签的预测效果；为了支持运营侧对不同粒度反馈场景进行分析的需求，同时引入了层次分类技术，能够有效学习标签间的树形结构关系，也在一定程度下缓解了标签样本不均衡的问题，提高了反馈打标模型的整体准确率。

业务场景标签映射

通过反馈管理工作台，对反馈进线数据完成了标签化分类，但是面临复杂的业务产品线以及跨渠道产品诉求，无法精准地将反馈数据和业务产品线关联起来，面向业务视角的体验指标将无法聚合实现。基于这样的诉求，搭建一个可视化控制台提供自主性业务标签配置管理关系，实现业务的可插拔式灵活配置，来完成业务到标签到元数据的底层关联，提升保障平台功能的可复用性。

实现一个业务场景标签映射配置模块，需要涵盖如下功能：对标签配置项的列表展示与检索，新增字段集、编辑与批量操作、发布上线、版本回滚等。

其中比较复杂的部分为新增字段集，归因是标签模型采用的是一级标签+二级标签+三级标签的树状级联结构方式，举例说明，一级标签为：广告相关；二级标签：吐槽广告多、内容不喜欢、体验不流畅；二级标签下的吐槽广告多又可以分拆为三级标签：吐槽卖货广告多、吐槽游戏广告多、吐槽借贷广告多。

而构建于标签之上的业务场景模型同样采用的是树状级联结构模型，如上图所示：业务定义为：抖音极速版。场景定义为：广告相关场景。所关联的标签有：吐槽卖货广告多、吐槽游戏广告多、吐槽借贷广告多等，文中所阐述的业务关系图如下图所示：

数据驱动问题发现

反馈标签场景化将业务场景和底层的数据进行了映射关联，为基于业务维度的聚合分析创造了条件，接下来我们把问题聚焦到如何将体验问题量化，找到合理的指标是问题的重中之重。NPS：NPS的核心就是调研用户是否愿意将这个产品推荐给其他人，以此体现用户是否对你的产品真正满意。虽然NPS是比较不错的体验指标，但是反馈数据源重点关注的是用户评论和产品建议，和NPS有一定差异，基于上面的背景，设计了求助率这个指标，旨在客观衡量体验问题。从平台设计的角度上看，期望随着产品体验问题的改进，求助率是应该不断降低的过程。

体验指标量化

我们定义求助率为：反馈总量/百万DAU。 DAU定义为：日活跃用户数量。百万DAU以百万日活用户做最小单元。原则上随着体验问题的不断改进，求助率会呈现下降趋势；反馈量TOP场景也是重点关注的体验指标。根据系统前置构建的场景标签化模型，技术上可以非常方便地聚合出反馈量TOP场景，与此同时可以附加一些体验指标，比如反馈变化率TOP场景、反馈变化量TOP场景。

反馈变化率定义为：对所选周期下最后一级问题进行周期环比，求出变化百分比，并正序取Top5展示。反馈变化量定义为：对所选周期下最后一级问题进行周期环比，求出变化量，并正序取Top5展示。与此同时，我们以天为维度，将求助率和反馈量TOP做关联，实现指标间的下钻和关联，提升数据指标的联动性。热点高频热点词，可以让运营同学直观地看到一定时间区间下的热点关键词，也是衡量体验指标的一个重要参考点，以下将重点介绍聚类下的实时热点高频词。

聚类下的实时热点高频词

为了能够实时展示反馈数据中用户描述的主要内容，我们开发了一款词云工具，能够在平台上实时展示用户反馈的关键词和关键短语。这款词云工具涉及的NLP技术包括智能分词、新词发现、关键词抽取和词聚类算法。传统分词算法分词粒度较细，会导致词云的信息量不足，难以直接观察出背后的主要问题，而我们提出的智能分词和关键词抽取算法，通过剔除反馈描述中的无效成分，仅保留有效文字内容，能够有效挖掘反馈描述中的关键短语，解决了词云信息量不足的问题。

为了避免分词算法不准确导致关键内容的缺失，我们提出了新词发现算法，它能够定时挖掘反馈数据中的新词，并及时将新词加入到智能分词模块中，从而支持统计新词的词频。词聚类算法是为了找到词云中的相似热词，将相似热词的出现频次进行汇总展示，能够帮助运营侧更准确和高效地发现问题。

画像原声检索提升体验问题分析定位

用户画像即建立在一系列真实数据之上的目标用户模型。面对每天数量庞大的反馈意见，从这些反馈中梳理出用户画像，能够帮助我们具体地、标签化地、有针对性地认识和挖掘出目标用户，定义他们的特征，聚类他们的诉求，并同步给到运营和产品人员，为后续进一步提升用户体验提供数据支撑。

体验指标可以宏观地、粗粒度地定位聚焦到场景问题，但是缺乏对相关原声的定位，追踪和分析。原声画像分析模块旨在构建一个原声数据索引分析查询系统，通过对各个维度的聚合分析、实时索引分类原声数据，为体验指标的问题分析提供了便利。以抖音侧为例，我们提供了性别、城市、年龄、手机品牌、手机价格、手机系统等多个维度的筛选条件和画像分析。

画像分析对体验指标分析与问题定位有着非常有效的帮助，举例说明以检索字体问题关键词得出的反馈用户画像中，Android的反馈量明显超过其他系统，基于此可以提出相应的体验专项治理方案来重点跟进Android版本等相关问题，此项优化可以大大减少该反馈的梳理，降低求助率体验指标。由此可以看出体验原声检索对体验问题排查、分析都有着不可缺少的作用。

体验管理形成闭环

从体验指标、原声分析中挖掘出的体验问题或改进点，需要被及时地反馈到对应的产研同学以制定方案执行改进，预期收获体验指标的正向反馈，提升用户满意度。

体验管理专项期望通过web平台化的能力，打通反馈驱动改进的业务闭环，在用户与产研之间形成有效连接。通过关联反馈关键词、标签或具体反馈ID，精准地提出体验专项需求；通过严格的流程，高效管理体验需求的执行进度；通过各环节的权限管控，更精细化地管理各个业务产品线的体验问题；通过操作记录，清晰地展示一个需求从提出到完结的执行周期。

体验管理专项作为反馈驱动业务的最后一环，预期收益为降低用户求助率。但业务不断迭代，新的feature可能给用户带来新的问题，因此整体/粗粒度场景下的反馈率、求助率并不一定能反映体验专项改进的效果，而细分标签下的反馈量变化趋势能更精确地评估体验专项的效果。此外，平台提供了红黑榜机制，统计各个业务场景下体验问题被提出后的响应率与解决率并进行排行，展示相关处理人，以激励推进体验业务改进。

定义响应率：最近双月内，在某一个场景下，「创建且接口人有过操作的专项数-废弃专项数」/「创建的总专项数-废弃专项数」。
定义解决率：最近双月内，在某一个场景下，「创建且状态为“已完成”状态的专项数」/「创建的总专项数-废弃专项数」。

目前的指标并不能足够精准地评估体验专项管理对于业务的改进程度，这也是一个日后努力的方向。

平台数据索引加速方案

构建于海量数据之上的数据检索系统，通常会面临比较大的计算耗时，如果不做合理的架构优化，对于平台本身使用起来体验会非常差，不利于运营人员分析和快速定位问题，为此设计一套数据加速方案，期望通过技术的手段来优化整体上网站的索引检索耗时，提升平台级的检索速度，减少不必要的计算资源消耗，提升平台稳定性、易用性。

为了尽可能提高接口响应速度，减少异常我们使用了一系列方法进行保障：

离线预处理：由于部分指标是T+1的，为了减少在接到用户请求时的计算量，我们使用离线的方式对数据进行了预处理。对于一些计算量大，耗时长，变化小的请求，我们使用天级别的离线任务计算出了每天的结果，在后续计算中直接使用预处理的数据进行计算，以减少计算量，加快接口响应。
缓存刷新：有一些常见的场景，比如整体的求助率趋势、词云、反馈重点问题等，存在大量的重复请求，如果缓存过期，无法命中缓存，这些请求的响应时长会明显增加，进而影响用户体验，为了对这部分请求进行更进一步的优化，我们定时对缓存进行刷新，确保常见请求直接命中缓存。
兜底数据维护：为了应对离线预处理数据和数据源都异常的极端情况，我们构建了兜底策略对极端场景进行兜底。兜底数据刷新任务会定时维护兜底数据，当正常请求异常的时候，我们会从兜底数据读取数据。
用户请求过程：一个完整的用户请求过程如下：后端接到用户请求之后，首先请求缓存，如果缓存命中，直接返回缓存的结果。如果没有命中缓存并且预处理数据存在，尝试根据离线任务预处理的数据进行计算，否则根据原始数据进行计算，计算成功后，更新缓存，返回结果。极端场景下，当缓存无数据、离线任务异常、数据源异常同时出现时，我们直接从兜底数据中查询数据。

总结

体验管理平台基于用户反馈数据，结合技术化的手段将体验管理线上化、平台化，旨在能有效改进抖音侧产品体验问题，真正落实让用户加入到字节的发展中来，让用户产生归属感。在实践过程中沉淀出反馈工作台、标签场景化、体验指标概览、画像原声检索分析、体验专项管理五大核心模块，支撑了抖音侧近几十个业务场景，为产品改进和体验提升保驾护航。更好地抽象平台系统能力，打造一个业界领先的体验管理平台，是我们的愿景和使命。

加入我们

我们是字节跳动互娱研发效能团队，互娱研发负责抖音、抖音火山版、剪映、FaceU、轻颜、直播、音乐等多款明星产品的研发，目前，抖音日活（DAU）已经突破6亿，并继续保持高速增长。

研发效能团队主打服务化+智能化, 旨在通过工具平台+算法，赋能互娱的各个业务场景，团队职能包括但不限于提升研发效能，保证内容质量，优化用户体验，保障业务安全等。

团队拥有算法，工程（前端、后台以及客户端）、数据（大数据、DA）、产品、测试等多种职能岗位，可以高效自闭环进行智能平台产品的设计研发，具有多个公司级影响力的智能化平台产品成功落地经验。

团队发展迅速，年轻富有朝气，注重技术氛围建设，积极参与国内外各顶尖行业技术会议，输出高质量技术专利和相关论文，工作Base地有深圳、杭州、北京多地可选。

加入我们，让你的每一行代码都能服务全球亿万用户。

简历投递邮箱：[email protected]；邮件标题：姓名 - 技术栈 - 研发效能。