高伸缩-分布式java应用读书笔记

通过升级和增加机器硬件来支撑增加的访问量和数据量的方式称为垂直伸缩。
通过增加机器来支撑增加的访问量和数据量的方式称为水平伸缩。
垂直伸缩，很容易达到瓶颈，增加到一定的程度后再增加硬件，成本会成指数级增长。水平伸缩面临的问题是机房，网络带宽，以及机器多了以后频繁的机器故障，维护和管理的成本问题。
通常采用水平伸缩方式，一匹马拉不动的时候，应该找两匹马拉，而不是找一头更强壮的马拉，水平伸缩对软件有一定的要求。
成本通常包括1.增加硬件的成本 2.修改软件的成本。
7.1垂直伸缩
7.1.1支撑高访问量
通常对于web应用来说，CPU和内容容易达到瓶颈。
增加CPU数量后，要考虑锁竞争、线程数以及是否单线程任务等。
增加内存后，要考虑集合的容量限制，以及jvm内存容量的设置。
7.1.2支撑大数据量
通常除了数据库硬件的提升外，要做的就是要分表。
分表会造成应用复杂度的提升，另外可能会涉及到跨表的操作。
7.1.3提升计算能力
要根据cpu数量对任务进行拆分和合并。

7.2水平伸缩
7.2.1支撑高访问量
水平伸缩对系统有要求，因为系统通常是有状态的，通常将状态放入缓存和数据库中，一般数据库是集中存储的，放入缓存中实现方式有2种。
1.广播式。将缓存发送到集群中其余的机器中，这种方式的缺点是如果单机的缓存比较大容易溢出，另外就是如果机器节点非常多的话，会带来较大的网络消耗和网络延迟。
2.分布式缓存。例如memcached。一致性hash算法。

文件存储：
1.直连式存储，缺点是水平伸缩能力差。
2.网络存储，NAS和SAN。
3.分布式文件系统。GFS，划分为多个block，有一台主服务器，负责分配和记录文件的位置，为了保证高可靠，通常会同时备份到多个机器上。但GFS不适合存储小文件，因为小文件只能到一台服务器上读取。

应用的水平伸缩方法：拆分。应用拆分后如何应对数据库压力：缓存分库异步数据库 DAL(data access layer)

7.2.2 支撑大数据量
读写分离：读写分离适合读多写少，并允许一定延时的业务中。

7.2.3 提升计算能力

MapReduce和MPI

《分布式Java应用-基础与实践》-林昊

高伸缩-分布式java应用读书笔记

猜你喜欢