8年资深测试总结，性能测试基础知识（大全）你的进阶之路...

目录：导读

前言

性能测试，大家经常聊的是高并发、高可用、性能优化、全链路压测等Topic，听起来都挺高大上，但这些概念追本溯源，还是要落到性能测试基础的东西上。

知识体系（基础指标）

简单来说，性能测试实际上主要关注如下三点：

速度：TPS、RT ；
容量：吞吐量、PV、Hit；
资源：CPU、Memory、DiskIO、Network、文件句柄数；

性能分层
性能测试领域，要在评估调研阶段就考虑性能分层的影响。在性能分析和优化阶段，也要考虑不同层级对整体性能的影响。

将它们分为如下六层：
网络层：主要指带宽、网段、防火墙等设施，当然，CND之类的资源，也可以划分在这一领域；
网关层：网关是请求入口和业务接入层，一般登录验签调用、加解密鉴权、限流等操作，都是在网关进行；
应用层：无论是前端的渲染展示还是后端的逻辑处理，都可以理解为应用层；
中间件：中间件包含缓存、MQ、JOB、DTS/DRC/DAL、配置中心等一系列组件；
存储层：一般指数据存储和文件存储层级，典型的组件有MySQL、HDFS；
物理层：无论是云服务还是自建机房，物理硬件层面都可以归纳到这一层；

需求调研
项目背景：版本迭代&独立项目&新建服务&系统重构&性能优化；

测试目的
超卖&高并发&扩容性&配置验证&资源耗用；

系统架构
技术架构：服务间的依赖关系，包含缓存，MQ等信息；
网络拓扑：请求-域名-SLB/HA/Nginx-web-app-DB以及外部依赖；

场景模型
业务场景：业务场景的多样性和特殊性以及对脚本开发联调&数据预埋的影响；
业务模型：只读、读写、批处理、定时Job；
业务配比：被测场景占总体场景的业务量占比（公式：被测场景/总业务量*100%）
选取业务峰值的数据，单独统计；如果各业务占比类似，则按照比例转化；如果比例差距大，则按照区间单独统计分析；

环境配置
PRE&PERF、app&Redis&MQ&DB&网络&网段&&带宽&防火墙，是否独享资源隔离等；

性能指标
业务指标：DAU、GMV、注册用户数、在线用户数、活跃用户数、增长趋势等；
系统指标：协议类型、长短链接、同步策略、加解密、JVM内存分配、容器线程数&连接数&Timeout、MQ-Cousumer数量；
压测指标：QPS、TPS、ART、99%RT、Success%；

数据类型
数据铺底量；
是否有敏感数据需脱敏；
限制条件(时间&次数&权限)；
自增、唯一、UUID、加解密、幂等；

关键时间
提测时间、验收时间、上线时间；

模型场景
业务模型：业务场景、流量转化漏斗；
测试模型：关注核心场景，过滤无关及非核心业务；
场景模型：从系统架构设计层面出发，关注不同层面，提升性能！
基准：单机单服务单接口；
并发：设定阈值，观察水位；
容量：阶梯式加压、性能拐点、资源瓶颈；
异常：容错处理、监控告警、容灾恢复演练；
稳定性：长期稳定正确提供服务的能力，可用性SLA；

测试方案
项目背景：说明项目开展的背景及目的；
测试方案：针对项目涉及的场景，测试实施的大体方案；
实施准则：任何项目，都要有准入准出和暂停中止准则；
性能模型：针对具体的场景，设计的性能模型最好经过评估验证；
测试策略：针对测试模型所采用的不同的测试策略，同步的测试策略要达成什么样的目的；
性能指标：业务指标是多少？转化的技术指标是多少？冗余范围有多大？
准备工作：其中包含环境、数据、脚本、监控等准备事项；
组织结构：整个项目中涉及哪些事项？不同事项的负责人是谁？交付时间是什么时候？

结果评估
在性能测试实施过程中，准确定义和描述性能测试结果，及针对不同结果进行模型分析，是很重要的一项能力。

性能实施方法论
基于指标构建；
建模是分析的过程和结果；
基于真实环境的系统模拟；
压测实施过程是整体的核心；
需要设定统一的目标、流程、分析方法、组织结构；

正确描述性能结果和过程的术语
瓶颈描述：什么场景执行了什么策略/操作，因为什么原因导致了什么结果；
解决方案：优化了哪里？验证的方式及结果？是否满足预期&是否解决了发现的问题？

性能分析层级
业务分级：业务-场景-数据-架构-参数；
技术分级：引擎-网络-应用-中间件-数据库；
工具：关注指标，从结果反推过程；
配置：线程、连接数、Timeout、长短链接、同步异步、路由转发；
应用：日志、硬件配置、资源使用率；
中间件：Job、缓存命中、消息堆积、Consumer配置；
数据库：资源耗用、库表结构、表锁行锁、活跃连接数、最大连接数；

性能拐点
TPS增长放缓，RT快速上升；

性能交叉点
模型上的TPS和RT交叉节点；

性能平衡点
重点关注业务可接受的最大RT；

性能衰减点
timeout参数&TPS急剧恶化抖降&RT快速飙升；

脚本设计
1、什么时候需要做脚本关联？
服务端结果动态返回，非幂等；
response body的参数需要向下透传；
2、如何理解并发和事务的区别？
并发指的是同一时刻服务端接收到的请求数，而非压测引擎的并发线程/RPS；
3、thinktime怎么用？
它有什么效果？
是否存在真实的业务场景？
是否影响整体的压测场景和服务资源？
4、主要关注哪些指标？
并发数、TPS、ART、99%RT、CPU%、Memory%、systemLoad%；

典型特例
文件存储优化
原理：文件/图片存储在源节点，利用CDN缓存各种变更和路径。CDN未命中，回源节点处理并返回，同时同步最新的变更和路径到CDN。
优点：节省存储成本，提高查询展示渲染性能，灵活满足业务。
注意事项：大文件分块存储，避免局部过热导致单机磁盘IO过载，分块有助于整体系统资源调度。

秒杀超卖场景
适用场景：秒杀、限时抢购、限量抢购等。
单用户单端多次抢购；
单用户单端限量抢购；
单用户多端抢购→低并发；
单用户多端抢购→高并发；

当我们开始做性能测试的时候，一定要得出结论，并且能给出优化方案和具体实施才可以，否则都是空谈。

如何判断已经达到系统瓶颈？

做性能压测的时候，把并发线程数按照阶梯式不断累加上去，观察cpu是否有达到80%以上。

如果有，即已经达到系统瓶颈，此时也不用再压下去，压下去只会把系统打爆掉，应该去查看此时的TPS是否满足预期，如果满足预期设定的值，则可以不用考虑隐患（前提是预期值要设置的合理），如果不满足预期的TPS，就需要根据具体性能瓶颈，提出优化改进建议。

而优化改进建议就通过观察是哪个地方的瓶颈最明显，最值得修改，就对该地方作出优化，比如RDS、连接池、Redis、代码逻辑、系统配置、JVM服务等等。

粗略几个影响点：
系统内存容量太小–影响系统性能；
算法过于繁琐–影响系统性能；
慢sql–影响RDS性能；
数据库连接过多，超出容量–影响系统的连接池性能；
redis请求过多–影响Redis性能；

如何分析瓶颈所在？

首先遇到TPS低于20，RT大于2000ms的压测结果，那么肯定不是一个正常的结果，此时要观察各个服务的指标情况。

根据时间区间，在pinpoint上面看接口请求分布，拉到具体的接口分布列表，查看当前测试接口的详情，查看调用链路是有哪些。

根据调用链路，可以看到有做了数据库的连接（涉及到连接池），有查询redis，或者还有系统算法的内容。

根据每个环节的耗时，有没有耗时特别长的，比如大于100ms的那种，比如连接数据库时间特别长，那么就可能是在连接池连接的时候较慢，原因是并发数太多，容量不够，排队等待的时间太久了。

给出建议：需要增加连接池的容量。

也可以查看系统cpu的情况，根据cpu占比中的系统或者JVM的占比是否异常高，如果是系统的占比异常高，则可能是代码中算法复杂，比如if循环较多。除了cpu，还有可能是其他指数会有异常飙高。

下面是我整理的2023年最全的软件测试工程师学习知识架构体系图

一、Python编程入门到精通

请添加图片描述

二、接口自动化项目实战

请添加图片描述

三、Web自动化项目实战

请添加图片描述

四、App自动化项目实战

请添加图片描述

五、一线大厂简历

请添加图片描述

六、测试开发DevOps体系

请添加图片描述

七、常用自动化测试工具

请添加图片描述

八、JMeter性能测试

请添加图片描述

九、总结（尾部小惊喜）

每个人都有属于自己的舞台，只要肯努力拼搏，就一定会赢得成功。面对生活中的挑战和困难，我们不能畏惧，更不能放弃。要坚定信念，迎难而上，不断挑战自我！

每个人都有自己的梦想，只不过追逐的道路不同而已。奋斗的意义在于，让我们的生命更加精彩，让我们的未来更加光明。所以，不论遇到什么困难和挫折，我们都必须坚定地走下去！

生命里总有一些事情需要我们去拼搏奋斗，让自己变得更加强大。无论你现在身处何方，无论你遇到多少挫折和困难，永远不要放弃追求自己的目标。坚定地走下去，成功就在不远处！