分散トランザクションの基本的な考え方

1つの基本的な考え方

1.1。トランザクションは何ですか

トランザクションとは何ですか?人生の例として:あなたが何かを買うために食堂に行く、「代引き」取引、賃金および配信の一例である成功するために、すべての業務で成功する必要があり、いずれかの活性が失敗し、トランザクションはすべて削除されますそれは成功したイベントとなっています。
上記の例を理解し、取引の定義を見て:
トランザクションは大きなイベントとして見ることができ、それは別の小さな活動で構成されており、これらの活動は、いずれかのすべての成功、またはすべて失敗しています。

1.2。ローカル総務

コンピュータシステムにおいて、より多くの、それ自体が達成するために、データベースのトランザクション機能の使用は、そう主として制御トランザクションにリレーショナルデータベースでアプリケーションに、データベーストランザクションと呼ばれるリレーショナルデータベースを介してトランザクションを制御するものであり、アプリケーションとデータベースが同じで典型的にサーバは、トランザクションベースのリレーショナルデータベースは、ローカルトランザクションとして知られています。
:データベーストランザクションACIDの四大特徴を見てください
A(アトミック):アトミック、すべての操作は、問題を構成する、または実行されている、またはすべての実行されていない、部分的な障害部分的な成功は不可能。
C(一貫性):一貫性、トランザクションの実行前と後に、データベースの整合性制約が破損していません。たとえば:ジョー・スミスがジョン・ドウ100に転送し、前と転送の転送後のデータは、あなたは、100元ジョー・スミスは、ジョン・ドウアカウントは100元にこのデータエラーを高めるためには表示されませんが判明した場合、コヒーレンスと呼ばれる正しい状態でありますこれは、一貫性に到達しませんでした。
I(分離):単離は、通常、データベース・トランザクションの同時実行において、分離は、トランザクションが実行されている中間状態他のトランザクションを見ることができない、同時トランザクションの2つの非干渉実行を指します。トランザクション分離レベルを設定することで、盗まれた回避は、反復可能読み取り他の問題をお読みください。
D(耐久性):トランザクションが完了した後に永続化、トランザクションがデータをデータベースに永続化され、ロールバックされません変更されます。
操作では、トランザクションデータベースは、積分全体の実行ユニットに取引に応じて実施されるとき、すべてのオペレーティングユニットの実行は、どちらか成功するか失敗する限り、どちらかの操作が失敗すると、トランザクションは全体の原因となりますされていますロールバック。

1.3。分散トランザクション

インターネットの急速な発展に伴い、変更分散アプリケーションのための元のアプリケーションからのモノマーのシステムソフトウェアは、マイクロ・サービスの進化に次の図の説明単一のアプリケーションは:
ここに画像を挿入説明
分散システムは、独立の以上展開することができるアプリケーションシステムに分割されますサービスは、リモートコラボレーションは、そのようなユーザ登録送信統合業務など、さまざまなサービス、間の遠隔コラボレーションにより、トランザクションを完了するために、ネットワーク上のサービスおよびサービス分散システム環境と呼ばれる操作、分散トランザクション間のトランザクションを完了するのに必要な作成受注マイナス在庫が分散トランザクション取引、銀行振込やその他の取引です。
私たちは、特性はデータベース自体に依存して、トランザクションがローカル業務を制御するために、次のロジックを実現するために、ローカル・トランザクションを提供することを知っています:

begin transaction;
	// 1. 本地数据库操作 :张三减少金额
	// 2. 本地数据库操作 :李四增加金额
commit transation;

しかし、分散環境では、これは次のようになります:

begin transaction;
	// 1. 本地数据库操作 :张三减少金额
	// 2. 远程调用 :让李四增加金额
commit transation;	

今回はジョー・スミスとジョン・ドウ上でのデータ、ジョン・ドウがリモートで呼び出すと返されませんでしたネットワークの問題により、成功の量を増やすために、リモート呼び出しを行う際にすることを想定し、この時、ローカル・トランザクション・ロールバックが張操作の量を減らす提出しなかったです矛盾。
そのため、分散型アーキテクチャに基づいて、従来のデータベーストランザクションを使用することができない、ジョー・スミスとジョン・ドウアカウントには、データベースアプリケーションでない場合でもない、ネットワークの問題のために長距離通話を通じて転送トランザクションのニーズを達成するためのシステムは、ディストリビューションにつながることができますトランザクションの問題。

生成されたシーン1.4分散トランザクション

図1は、典型的なシナリオでは、操作することによって、トランザクションを完了するために、マイクロサービスアーキテクチャ、マイクロリモートサービスコールの間です。たとえば、次のようにマイクロサービスの注文や在庫のマイクロサービス、受注、マイクロマイクロインベントリサービスリクエストサービスの在庫削減のための受注中。要するに:クロスJVMプロセスは、分散トランザクションを生成します。
ここに画像を挿入説明
2、モノマーシステムは、アクセス、複数のデータベース(例)のモノマー系のニーズが分散トランザクションを生成するときに、複数のデータベース・インスタンスにアクセスします。たとえば、次の2つのMySQLインスタンスストレージでユーザ情報および注文情報をそれぞれ削除、ユーザ情報、ユーザ管理システムのデータを別のデータ・インスタンスに分散されているので、あなたは、それぞれ、削除、ユーザー情報とユーザーの注文情報を必要とする、さまざまなデータベース・リンクを操作する必要性この時間の分散トランザクションで生成されたデータ。要するに:クロスデータベースインスタンスは、分散トランザクションを生成します。
ここに画像を挿入説明
など3、マルチサービスアクセス同一のデータベース・インスタンス、:マイクロサービスの注文、在庫サービスもマイクロも同じデータベース分散トランザクションにアクセスすることが、その理由は、クロスJVMプロセスである、2つのマイクロサービスは、異なるデータベース・リンクデータベースを保持しています操作は、この時間は、分散トランザクションを生成します。
ここに画像を挿入説明

2. 分布式事务基础理论

我们了解到分布式事务的基础概念。与本地事务不同的是,分布式系统之所以叫分布式,是因为提供服务的各个节点分布在不同的机器上,相互之间通过网络交互。不能因为有一点网络问题就导致整个系统无法提供服务,网络因素成为了分布式事务的考量标准之一。因此分布式事务需要更进一步的理论支持。
在了解分布式事务控制解决方案之前先了解一些基础理论,通过理论知识指导我们确定分布式事务控制的目标,从而帮助我们理解解决方案。

2.1. CAP理论

2.1.1. 理解CAP

CAP是Consistency、Availability、Parition tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性。
下边我们分别来解释 :
为了方便对CAP理论的理解,我们结合电商系统中的一些业务场景来理解CAP。
如下图,是商品信息管理的执行流程 :
ここに画像を挿入説明
整体执行流程如下 :
1、商品服务请求主数据库写入商品信息(添加商品、修改商品、删除商品)。
2、主数据库向商品服务响应写入成功。
3、商品服务请求从数据库读取商品信息。

C-Consistency :
一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意节点读取到的数据都是最新的状态。
上图中,商品信息的读写要满足一致性就是要实现如下目标 :
1、商品服务写入主数据库成功,则向从数据库查询新数据也成功。
2、商品服务写入主数据库失败,则向从数据库查询新数据也失败。
如何实现一致性?
1、写入主数据库后要将数据同步到从数据库。
2、写入主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入成功后,向从数据库查询到旧的数据。

分布式系统一致性的特点 :
1、由于存在数据同步的过程,写操作的响应会有一定的延迟。
2、为了保证数据一致性会对资源暂时锁定,待数据同步完成释放锁定资源。
3、如果请求数据同步失败的节点则会返回错误信息,一定不会返回旧数据。

A-Availability:
可用性是指任何事务操作都可以得到响应结果,且不会出现响应超时或响应错误。
上图中,商品信息读取满足可用性就是要实现如下目标 :
1、从数据库接收到数据查询的请求则立即能够响应数据查询结果。
2、从数据库不允许出现响应超时或响应错误。
如何实现可用性?
1、写入主数据库后要将数据同步到从数据库。
2、由于要保证从数据库的可用性,不可将从数据库中的资源进行锁定。
3、即使数据还没有同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,如果连旧数据也没有则可以按照约定返回一个默认信息,但不能返回错误或者响应超时。

分布式系统可用性的特点 :
1、所有请求都有响应,且不会出现响应超时或响应错误。

P-Partition tolerance :
通常分布式系统的各个节点部署在不同的子网,这就是网络分区,不可避免的会出现由于网络问题而导致节点之间通讯失败,此时仍可对外提供服务,这叫分区容忍性。
上图中,商品信息读写满足分区容忍性就是要实现如下目标 :
1、主数据库向从数据库同步数据失败不影响读写操作。
2、其一个节点挂掉不影响另一个节点对外提供服务。

如何实现分区容忍性?
1、尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据,这样节点之间能有效的实现松耦合。
2、添加从数据库节点,其中一个从节点挂掉其它从节点提供服务。

分布式分区容忍性的特点 :
1、分区容忍性是分布式系统具备的基本能力。

2.1.2. CAP组合方式

1、上边商品管理的例子是否同时具备CAP呢?
在所有分布式事务场景中不会同时具备CAP三特性,因为在具备了P的前提下C和A是不能共存的。
比如 :
下图满足了P即表示实现分区容忍 :
ここに画像を挿入説明
本图分区容忍的含义是 :
1)主数据库通过网络向从数据同步数据,可以认为主从数据库部署在不同的分区,通过网络进行交互。
2)当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
3)其一个节点挂掉不影响另一个节点对外提供服务。
如果要实现C则必须保证数据一致性,在数据同步的时候为防止向从数据库查询不一致的数据则需要将从数据库数据锁定,待同步完成后解锁,如果同步失败从数据库要返回错误信息或超时信息。
如果要实现A则必须保证数据可用性,不管任何时候都可以向从数据库查询数据,则不会响应超时或返回错误信息。
通过分析发现在满足P的前提下C和A存在矛盾性。

2、CAP有那些组合方式呢?
在生产中对分布式事务处理时要根据需求来确定满足CAP的那两个方面。
1)AP:
放弃一致性,追求分区容忍性和可用性。这是很多分布式系统设计时的选择。
例如 :
上边的商品管理,完全可以实现AP,前提是只要用户可以接收所查询的到数据在一定时间内不是最新的即可。
通常实现AP都会保证最终一致性,后面讲的BASE理论就是根据AP来扩展的,一些业务场景 比如 :订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
2)CP:
放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致性,又比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成。
3)CA:
放弃分区容忍性,既不进行分区,不考虑由于网络不通或节点挂掉的问题,则可以实现一致性和可用性。那么系统将不是一个标准的分布式系统,我们最常用的关系型数据就满足了CA。
上边的商品管理,如果要实现CA则架构如下 :
ここに画像を挿入説明
主数据库和从数据库中间不再进行数据同步,数据库可以响应每次的查询请求,通过事务隔离级别实现每个查询请求都可以返回最新的数据。

2.1.3 总结

通过上面的学习,CAP是一个已经被证实的理论 :一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三项中的两项。它可以作为我们架构设计、技术选型的考量标准。对于多数大型互联网应用的场景,节点众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9(99.99.%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选择 :保证P和A,舍弃C强一致性,保证最终一致性。

2.2. BASE理论

1、理解强一致性和最终一致性
CAP理论告诉我们一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance)这三项中的两项,其中AP在实际应用中较多,AP既舍弃一致性,保证可用性和分区容忍性,但是在实际生产中很多场景都要实现一致性,比如前边我们举的例子,AP即舍弃一致性,保证可用性和分区容忍性,但是在实际产生中很多场景都要实现一致性,比如前边我们觉得例子主数据库向从数据库同步数据,即使不要一致性,但是最终也要将数据同步成功来保证数据一致,这种一致性和CAP中的一致性不同,CAP中的一致性要求在任何时间查询每个节点数据都必须一致,它强调的是强一致性,但是最终一致性是允许可以在一段时间内每个节点的数据不一致,但是经过一段时间每个节点的数据必须一致,它强调的是最终数据的一致性。
2、Base理论介绍
BASE是Basically Availbale(基本可用)、Soft state(软状态)和Eventually consistent(最终一致性)三个短语的缩写。BASE理论是对CAP中AP的一个扩展,通过牺牲强一致性来获得可用性,当出现故障允许部分不可用但要保证核心功能可用,允许数据在一段时间内是不一致的,但最终达到一致状态。满足BASE理论的事务,我们称之为“柔性事务”。

  • 基本可用 :分布式系统在出现故障时,允许损失部分可用功能,保证核心功能可用。如电商网址交易付款出现问题来,商品依然可以正常浏览。
  • 软状态:由于不要求强一致性,所以BASE允许系统中存在中间状态(也叫软状态),这个状态不影响系统可用性,如订单中的“支付中”、“数据同步中”等状态,待数据最终一致后状态改为“成功”状态。
  • 結果整合性:時間をかけて、すべてのノードはすべて同じデータを持っていることを、最終的な合意手段の後。「賃金」状態の順序は、最終的に「成功のための賃金」や「給与に失敗」に変更される場合は、注文状況や実際の取引結果は同意するが、一定の時間遅延、待ち時間が必要です。

おすすめ

転載: www.cnblogs.com/haizai/p/11829677.html