背景

1. 共有変数の提案

少し前に、Amazon Prime Video チームによるケーススタディが開発者コミュニティで大騒ぎを引き起こしました。基本的に、プライムビデオはストリーミングプラットフォームとして、毎日何千ものライブストリームを顧客に提供します。顧客がコンテンツをシームレスに受信できるようにするために、Prime Video は顧客が視聴したすべてのストリームの品質問題を特定する監視ツールを構築する必要があり、これには非常に高いスケーラビリティ要件が課されました。

この点で、Prime Video チームはマイクロサービスアーキテクチャを優先しました。マイクロサービスは 1 つのアプリケーションを複数のモジュールに分解できるため、ツールの独立した開発と展開の問題が解決されるだけでなく、アプリケーションの可用性、信頼性、技術的多様性も向上します。最終的に、Prime Video のサービスは 3 つの部分で構成されます。メディアコンバータは、オーディオおよびビデオストリームを検出器のオーディオおよびビデオバッファに送信します。欠陥検出器はアルゴリズムを実行し、欠陥が見つかったときにリアルタイム通知を送信します。サービスプロセスのオーケストレーション。

サービスにフローが追加されると、過剰なコストの問題が発生し始めます。 AWS Step は機能の状態遷移に基づいてユーザーに料金を請求するため、大量のストリームを処理する必要がある場合、インフラストラクチャを大規模に実行するオーバーヘッドが非常に高くなり、すべての構成要素の合計コストが高くなりすぎるため、Prime Video を利用できなくなります。チームは最初の大規模なソリューションを受け入れません。最終的に、Prime Video チームはインフラストラクチャを再構築し、マイクロサービスからモノリシックアーキテクチャに移行しました。データによると、インフラストラクチャのコストは 90% 削減されました。

この出来事により、私たちは分散アーキテクチャにも単一サービスアーキテクチャと比較して欠点があることをさらに認識するようになりました。たとえば、Prime Video チームは問題に遭遇しました。分散アーキテクチャはモノリシックアーキテクチャのように変数を共有できないため、基盤となるサービスがより多くの同じリクエストを処理することになり、コストが高騰します。このジレンマは、iQiyi の海外アーキテクチャ、特に戦略エンジンの呼び出し関係にも存在します。

2. iQiyi海外戦略エンジン呼び出し関係

2.1 ポリシーエンジン呼び出し関係の概要

このうち、カードはページ内の各列を細分化したモジュールで、通常、テレビシリーズや映画などの列は 1 つのカードです。マーケティングから取得したマーケティングデータ、レコメンドから取得したコンテンツ、Chipから取得したプログラムコンテンツなど、各カード内のデータソースは異なります。たとえば、ページはナビゲーションの下に関連付けられ、カードはページの下に関連付けられ、カード内の特定のビジネスデータはカードの下に関連付けられます。

ポリシーエンジンは、人々のグループを識別するためのマッチングサービスです。たとえば、グループポリシーには、日本のゴールドメンバー、男性、7 日未満のメンバーシップ有効期限、および日本のアニメの好みが含まれています。ポリシーエンジンサービスは、ユーザーが上記のグループポリシーに属しているかどうかを識別できます。

「何でもあり」の技術変革の後、ナビゲーション、ページ、カード、カード内のデータのユーザープロファイルのサイズをカスタマイズする機能が実現されました。一般的な実装は次のとおりです。クライアントがリクエストを開始すると、最初にナビゲーション API をリクエストします。ナビゲーションデータ構成のバックグラウンドでは、運用学生がさまざまなナビゲーションデータを構成し、各ナビゲーションデータがポリシーに関連付けられていました。ナビゲーション API はすべてのナビゲーションデータを内部で取得し、ナビゲーション関連ポリシーとユーザー UID およびデバイス ID を入力パラメーターとして使用してポリシーエンジンに照合し、一致するポリシーを返します。要件を満たすポリシーを備えたナビゲーションがデータとして返されるため、異なるユーザーポートレートが異なるナビゲーションデータを表示できるようになります。ページ、カード、およびカード内のデータは、ほぼ同じ方法で実装されます。

上記の内容から、ポリシーエンジンの呼び出しリンクには次の特性があることが要約できます。

(1) ユーザーがページを開く 1 回の操作で、複数のポリシーエンジンサービスが連続して呼び出されます。

(2) ポリシーエンジンインターフェイスのパフォーマンスは、ユーザーエクスペリエンスに直接影響します。多くのページビジネスサービスに対するリクエストが関連付けられます。

(3) 戦略エンジンのデータには強力なリアルタイム性が必要です。ユーザーがメンバーシップを購入した後、データは直ちにメンバー関連の戦略に関連付けられる必要があります。

2.2 遭遇したジレンマ

前のセクションの呼び出し関係からわかるように、ポリシーエンジンは基盤となるサービスとして多くのビジネスパーティのトラフィックを引き受けます。ポリシーエンジンは、クラウドポリシーが一致するかどうかを判断するためにユーザーのポートレートデータを取得する必要があります。 Turn は DMP (データ管理プラットフォーム) サービスに大きく依存しています。 DMP サービスへのトラフィックを削減するために、ローカルキャッシュソリューションを検討しました。

ただし、これには明らかな問題があります。つまり、リアルタイムデータ要件を満たすことができないということです。ユーザーがメンバーシップを購入し、DMP サービスから返されるポートレートデータが変更されると、ユーザーはローカルキャッシュの遅延により最新のポリシー関連データを見ることができなくなりますが、これは明らかに許容できません。

分散キャッシュソリューションも検討しました。ユーザー ID がキーとして使用される場合、問題点はローカルキャッシュと同じであり、リアルタイム要件を満たすことができません。

したがって、データのリアルタイム要件を満たしながら、DMPサービスへのトラフィックをどのように最適化するかが、ポリシーエンジンプロジェクト全体の最適化に対する課題になります。

共有変数の夜明け

1。概要

このジレンマの核心は、分散サービスは変数を共有できないことです。ユーザーのページを開く動作には複数のバックエンドリクエストが伴います。これらの複数のバックエンドリクエストに関連付けられたユーザープロファイルデータは実際には 1 つです。つまり、DMP サービスから取得されるプロファイルデータは同じである必要があります。次に、ポリシーエンジンの呼び出しリンクの抽象分析を実行して、どのような機能があるかを確認します。

2. ポリシーエンジンコールリンク分析

ポリシーエンジンの呼び出し関係については、「1.2.1 ポリシーエンジンの呼び出し関係の概要」で紹介しましたが、今回は主にその呼び出しリンクを抽象的に分類します。

2.1 シリアル通話シナリオ

上の図からわかるように、ユーザーはリクエストを開始し、複数のノードサービスを通過します。ノードサービスはシリアル関係にあり、各ノードはポリシーエンジンサービスに依存してユーザーのポートレートを取得する必要があります。当然、T1 から Tn までのリクエストはすべて同じユーザーからのものであり、DMP サービスによって取得されるデータは同じである必要があります。その後、共有変数の考え方が使用される場合、DMP へのリクエストは同じになります。 T1 から Tn までのサービスは 1 アスクに最適化できます。ここではDMPサービスから取得したポートレートデータを分散シェア変数と名付けます。

2.2 並列呼び出しシナリオ

上記のシリアルコールチェーンとは異なり、シリアルコール T1 ～ Tn は時系列であり、T1 コールは T2 コールの前にある必要があります。並列呼び出しには時系列はありません。つまり、同じユーザーがリクエストを開始すると同時に、集約層ビジネスが依存サービスへのリクエストを開始する可能性があり、依存サービスはポリシーエンジンに依存します。同じユーザーによって開始されたリクエストは、ポリシーエンジンに対して同時に実行されます。次に、複数のリクエストがキューに配置され、最初のリクエストが実際に DMP サービスをリクエストし、残りのリクエストが最初のリクエストのデータをキューで待機する場合、n 個のリクエストを 1 つのリクエストに最適化できます。ここでは、DMP サービスから取得したポートレートデータをローカル共有変数と呼びます。

分散シェア変数の概要

1. 原理概要

ユーザーがページを開くと、クライアントはナビゲーションを要求し、機能ページ、特定のカード、および機能カードデータを順番に取得します。すべてのリンクにはポリシーエンジンサービスが関係します。通常の状況では、クライアント要求によりポリシーエンジンへの複数の呼び出しがトリガーされ、その結果 DMP サービスへの複数の呼び出しが発生します。ただし、当然のことながら、これは同じユーザーからのリクエストであり、DMP サービスへのこれらのリクエストによって取得されるユーザーのポートレートデータは同じである必要があります。

上記の分析に基づいて、分散共有変数の原理を簡単に説明すると、[Navigation] が初めてポートレートデータを取得したときに、そのコンテンツをリクエストリンクに入れて、完全なポートレートデータの TraceId と同様に渡します。リンク。これにより、[Page] などのダウンストリームが再度ポリシーエンジンを要求した場合、DMP サービスを要求せずに、リンクコンテキスト TraceContext 内のリンクデータを直接取得できます。 CARDについても、ページ事業についても同様です。

TraceContext はリクエストを通じてのみ渡されることに注意してください。このように、リンクデータが保存される場合、ポートレートデータは、[Navigation] がポリシーエンジンデータを取得した後にのみ、リンクコンテキスト TraceContext に配置できます。

如果导航没有关联策略数据，无需请求策略引擎，但是后面的页面、CARD等又关联了策略引擎，那该怎么处理呢？我们参考了TraceId的处理方式，在每个调用策略引擎服务的节点(不同业务如页面、CARD等)进行判断是否有链路数据，如果没有，则获取策略引擎数据后放置进去，如果有则忽略。这样就保证最前置的节点拿到画像数据后，进行向后传递，减少后续节点对于DMP服务的流量。很明显，这些逻辑有一些业务侵入性，所以我们将调用策略引擎的方式优化为SDK调用，在SDK内部做了一些统一的逻辑处理，让业务调用方无感知。

2、全链路追踪 — 基于SkyWalking

skywalking 是分布式系统的应用程序性能监视工具，专为微服务、云原生架构和基于容器化技术（docker、K8s、Mesos）架构而设计，它是一款优秀的 APM（Application Performance Management）工具。skywalking 是观察性分析平台和应用性能管理系统。提供分布式追踪、服务网格遥测分析、度量聚合和可视化一体化解决方案。对于为什么选择skywalking，除去skywalking本身的优势以外，业务上的理由是爱奇艺海外项目目前已经接入SkyWalking，开发成本最低，维护更加便利。所以，使用skywalking传递分布式共享变量只需要引入一个Maven依赖，调用其特有的方法，就可以将数据进行链路传递。

分布式共享变量的方案会增加网络传递数据的大小，增加网络开销；当链路数据足够大的时候甚至会影响服务响应性能。因此控制链路数据大小、链路数据的控制和评估链路数据对网络性能造成影响是尤为重要的。下面将详细介绍。

3、链路传输优化 — 压缩解压缩

3.1 压缩基本原理

目前用处最为广泛的压缩算法包括Gzip等大多是基于DEFLATE，而DEFLATE 是同时使用了 LZ77 算法与哈夫曼编码（Huffman Coding）的一种无损数据压缩算法。其中 LZ77 算法是先通过前向缓冲区预读取数据，然后再向滑动窗口移入（滑动窗口有一定的长度)，不断寻找能与字典中短语匹配的最长短语，然后通过标记符标记，依次来缩短字符串的长度。哈夫曼编码主要是用较短的编码代替较常用的字母，用较长的编码代替较少用的字母，从而减少了文本的总长度，其较少的编码通常使用构造二叉树来实现。

3.2 压缩选型

由于BI获取的用户画像TAG固定且个数较少，因此这里选择DMP数据作为实验对比数据。以下是不同场景下压缩大小对比数据

由上表分析可得

方案3得到的数据最小，因此选择方案3作为分布式共享变量的压缩方案。

4、数据大小导致的网络消耗分析和极端情况控制

4.1 背景概述

这种方案也存在一些弊端，即需要把用户画像数据通过网络传递，显然这增加了网络开销。理论上，网络数据量与传输速度成正比，但是在工程实践中，带宽肯定是有上限的，因此，对于DMP画像数据存入大小进行压测试验，以确定分布式共享变量对于网络性能的影响。

4.2 压测方案

1.测试网络，画像数据不被策略引擎使用，策略引擎依然请求DMP服务。

实验组是请求策略引擎服务的时候带入压缩后的画像数据，对照组是请求策略引擎服务的时候不带入压缩后的画像数据。调整并发值，比较在不同QPS场景下两者的接口性能。

2.分布式共享变量的画像数据被策略引擎使用，策略引擎在有分布式共享变量画像数据的时候，不再请求DMP服务。

4.3结论

网络链路上存放数据大小在2000以下，对网络性能的影响可以忽略不计。
因为分布式共享变量的存在而减少对DMP服务的请求，接口性能可以有比较大的提升。具体数值为P99从25ms提升到2.96ms。

4.4 极端情况控制

因为DMP数据与用户行为相关，比如一个用户在海外站点所有站点都有购买会员的行为，那么其DMP画像数据就会很大。为了防止这种极端情况所以在判断压缩后的用户画像数据足够大的时候，将自动舍弃，而不是放入网络当中，防止大数据对整个网路数据的性能损耗。

5、线上运行情况

5.1 性能优化

P99	P90

P99 由之前的43ms下降到22ms。下降幅度 48.8%	P90由之前19ms下降到14ms，下降幅度26.3%

5.2 对DMP服务的流量优化

监控	结论
	分布式共享变量使用率即为对不同DMP服务优化流量。 A业务节约大约25%的流量，B业务节约约10% 的流量， C业务节约约2%的流量

6、结论

分布式共享变量在满足数据实时性要求的前提下，减少了对DMP服务的流量，同时提高了策略引擎服务的接口性能，具体优化指标见上节。

本地共享变量介绍

1、原理概述

在2.2.2 并行调用场景章节对本地共享变量解决的调用场景进行了阐述，主要解决的是同一个用户并发请求策略引擎带来的多次请求DMP服务问题。如何区分是同一个用户的同一次请求呢？答案是TraceId。在一个请求下，TraceId一定是相同的，如果TraceId相同，那么策略引擎则可以认为是同一个用户的一次请求。

如上图，如果同时多个TraceId3的请求到达策略引擎，将这些请求放入队列，只要其中一个去获取用户画像数据（此处为TraceId3''），其余的请求TraceId3和TraceId3'在队列中等待TraceId3''的结果拿来用即可。

这种思路可以很好的优化并发请求的数据，符合策略引擎调用特性。实现起来有点类似AQS，开发落地有一些难点，比如Trace3''什么时候去请求DMP服务，当拿到数据后，后面仍然有其他trace3进来该如何处理，等待多少时间？这么一思考，这个组件的实现将会耗费我们很多的开发时长，那么有没有现成的中间件可以用呢？答案是本地缓存框架。

无论是本地缓存Caffeine 还是Guava Cache，有相同key的多个请求，只有一个key会请求下游服务，而其他请求会等待拿现成的结果。另外存放的时间可以通过配置缓存的失效时间来确定，至于失效时间的计算方法，将在下面章节会介绍。

2、网关层Hash路由方式的支持

目前，主流的服务一般都是多机房多机器部署，这样有水平扩展能力可以应对业务增长带来的流量增加的问题。但同一个用户的同一个请求，很可能到不同的服务实例，这样上一次获取到的本地缓存数据在下一次请求当中就无法获取。

如上图，同一个用户的同一次请求，被聚合层并发请求到不同业务节点1到节点n。由于策略引擎服务是多实例部署，那么不同节点的请求可能到不同实例，那么本地共享变量的命中率就会大大降低，对DMP服务的流量节约数据就会小很多。因此，需要一个方案使得用户的多次请求能到同一个机房的同一个实例。

最终落地的方案是网关支持按照业务自定义字段Hash路由。策略引擎使用qyid进行hash路由，即同一个设备的所有请求到策略引擎服务，那么路由到的机器实例一定是同一个。这样可以很好的提升本地共享变量的命中率。这里提一下，相比轮询请求，字段Hash方式存在如流量偏移的问题，需要配合服务实例流量的监控和报警，避免某些实例流量过多而导致不可用。由于和本次主题无关，实例流量的监控和报警在这里就不做介绍。

3、本地共享变量个数和有效时间设计

和本地缓存不同，本地共享变量的最大个数和过期时间与命中率不成正比，这和具体业务指标相关。

假设策略引擎服务QPS10000，服务实例有50台，那么每台实例的QPS是200，即一台服务实例每秒的请求是200个。只需要保证，同一个TraceId的一批请求，在个数区间内不被淘汰，在时间区间内不被过期即可。我们通过网关日志查找历史上同一个traceId的请求时间戳，几乎都在100ms内。

那么过期时间设置为1s，最大个数设置为200个就可以保证绝大多数同一个TraceId的批次请求，只有一个请求下游服务，其余从缓存获取数据。我们为此也进行了实验，设置不同的过期时间和缓存最大个数，结论和以上分析完全一致。

本地共享变量命中率与接口QPS和相同TraceId并发时间相关。

4、结论

本地共享变量上线后，优化数据如下

对于DMP服务1，优化流量15.8%。对于DMP服务2，优化流量 16.7%。对于DMP服务3，优化流量16.2%。
与分布式共享变量一样，本地共享变量同样可以满足数据实时性要求，即不会存在1.2.2 遇到的困境所遇到的缓存导致的数据实时性不够的问题。

总结和展望

本次优化是比较典型的技术创新项目。是先从社区看到一篇技术博客，然后想到爱奇艺海外遇到相同痛点问题的的项目，从而提出优化因为微服务导致的策略引擎对于DMP服务流量压力的目标。

在落地过程中，遇到使用本地缓存进行优化而无法克服数据实效性问题的挑战。最终沉下心分析策略引擎的调用链路，将调用链路一分为二：串行调用和并行调用，最终提出了共享变量的解决方案。因为串行调用和并行调用的特点迥异，依次针对两者进行分期优化，其中第一期通过分布式共享变量优化了串行调用DMP服务的流量，在第二期通过本地共享变量优化了并行调用DMP服务的流量。

由于作者水平有限，疏漏之处欢迎读者批评指正。

参考文章：

也许你还想看

低代码、中台化：爱奇艺号微服务工作流实践

揭秘内存暴涨：解决大模型分布式训练OOM纪实

分布式系统日志打印优化方案的探索与实践

本文分享自微信公众号 - 爱奇艺技术产品团队（iQIYI-TP）。
如有侵权，请联系 [email protected] 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

マイクロサービスは不滅です — ポリシーエンジンプロジェクトにおける共有変数の実装の詳細な説明

背景

1. 共有変数の提案