8年资深测试总结,性能测试基础知识(大全)你的进阶之路...


前言

性能测试,大家经常聊的是高并发、高可用、性能优化、全链路压测等Topic,听起来都挺高大上,但这些概念追本溯源,还是要落到性能测试基础的东西上。

知识体系(基础指标)

简单来说,性能测试实际上主要关注如下三点:

速度:TPS、RT ;
容量:吞吐量、PV、Hit;
资源:CPU、Memory、DiskIO、Network、文件句柄数;

性能分层
性能测试领域,要在评估调研阶段就考虑性能分层的影响。在性能分析和优化阶段,也要考虑不同层级对整体性能的影响。

将它们分为如下六层:
网络层:主要指带宽、网段、防火墙等设施,当然,CND之类的资源,也可以划分在这一领域;
网关层:网关是请求入口和业务接入层,一般登录验签调用、加解密鉴权、限流等操作,都是在网关进行;
应用层:无论是前端的渲染展示还是后端的逻辑处理,都可以理解为应用层;
中间件:中间件包含缓存、MQ、JOB、DTS/DRC/DAL、配置中心等一系列组件;
存储层:一般指数据存储和文件存储层级,典型的组件有MySQL、HDFS;
物理层: 无论是云服务还是自建机房,物理硬件层面都可以归纳到这一层;

需求调研
项目背景:版本迭代&独立项目&新建服务&系统重构&性能优化;

测试目的
超卖&高并发&扩容性&配置验证&资源耗用;

系统架构
技术架构:服务间的依赖关系,包含缓存,MQ等信息;
网络拓扑:请求-域名-SLB/HA/Nginx-web-app-DB以及外部依赖;

场景模型
业务场景:业务场景的多样性和特殊性以及对脚本开发联调&数据预埋的影响;
业务模型:只读、读写、批处理、定时Job;
业务配比:被测场景占总体场景的业务量占比(公式:被测场景/总业务量*100%)
选取业务峰值的数据,单独统计;如果各业务占比类似,则按照比例转化;如果比例差距大,则按照区间单独统计分析;

环境配置
PRE&PERF、app&Redis&MQ&DB&网络&网段&&带宽&防火墙,是否独享资源隔离等;

性能指标
业务指标:DAU、GMV、注册用户数、在线用户数、活跃用户数、增长趋势等;
系统指标:协议类型、长短链接、同步策略、加解密、JVM内存分配、容器线程数&连接数&Timeout、MQ-Cousumer数量;
压测指标:QPS、TPS、ART、99%RT、Success%;

数据类型
数据铺底量;
是否有敏感数据需脱敏;
限制条件(时间&次数&权限);
自增、唯一、UUID、加解密、幂等;

关键时间
提测时间、验收时间、上线时间;

模型场景
业务模型:业务场景、流量转化漏斗;
测试模型:关注核心场景,过滤无关及非核心业务;
场景模型:从系统架构设计层面出发,关注不同层面,提升性能!
基准:单机单服务单接口;
并发:设定阈值,观察水位;
容量:阶梯式加压、性能拐点、资源瓶颈;
异常:容错处理、监控告警、容灾恢复演练;
稳定性:长期稳定正确提供服务的能力,可用性SLA;

测试方案
项目背景:说明项目开展的背景及目的;
测试方案:针对项目涉及的场景,测试实施的大体方案;
实施准则:任何项目,都要有准入准出和暂停中止准则;
性能模型:针对具体的场景,设计的性能模型最好经过评估验证;
测试策略:针对测试模型所采用的不同的测试策略,同步的测试策略要达成什么样的目的;
性能指标:业务指标是多少?转化的技术指标是多少?冗余范围有多大?
准备工作:其中包含环境、数据、脚本、监控等准备事项;
组织结构:整个项目中涉及哪些事项?不同事项的负责人是谁?交付时间是什么时候?

结果评估
在性能测试实施过程中,准确定义和描述性能测试结果,及针对不同结果进行模型分析,是很重要的一项能力。

性能实施方法论
基于指标构建;
建模是分析的过程和结果;
基于真实环境的系统模拟;
压测实施过程是整体的核心;
需要设定统一的目标、流程、分析方法、组织结构;

正确描述性能结果和过程的术语
瓶颈描述:什么场景执行了什么策略/操作,因为什么原因导致了什么结果;
解决方案:优化了哪里?验证的方式及结果?是否满足预期&是否解决了发现的问题?

性能分析层级
业务分级:业务-场景-数据-架构-参数;
技术分级:引擎-网络-应用-中间件-数据库;
工具:关注指标,从结果反推过程;
配置:线程、连接数、Timeout、长短链接、同步异步、路由转发;
应用:日志、硬件配置、资源使用率;
中间件:Job、缓存命中、消息堆积、Consumer配置;
数据库:资源耗用、库表结构、表锁行锁、活跃连接数、最大连接数;

性能拐点
TPS增长放缓,RT快速上升;

性能交叉点
模型上的TPS和RT交叉节点;

性能平衡点
重点关注业务可接受的最大RT;

性能衰减点
timeout参数&TPS急剧恶化抖降&RT快速飙升;

脚本设计
1、什么时候需要做脚本关联?
服务端结果动态返回,非幂等;
response body的参数需要向下透传;
2、如何理解并发和事务的区别?
并发指的是同一时刻服务端接收到的请求数,而非压测引擎的并发线程/RPS;
3、thinktime怎么用?
它有什么效果?
是否存在真实的业务场景?
是否影响整体的压测场景和服务资源?
4、主要关注哪些指标?
并发数、TPS、ART、99%RT、CPU%、Memory%、systemLoad%;

典型特例
文件存储优化
原理:文件/图片存储在源节点,利用CDN缓存各种变更和路径。CDN未命中,回源节点处理并返回,同时同步最新的变更和路径到CDN。
优点:节省存储成本,提高查询展示渲染性能,灵活满足业务。
注意事项:大文件分块存储,避免局部过热导致单机磁盘IO过载,分块有助于整体系统资源调度。

秒杀超卖场景
适用场景:秒杀、限时抢购、限量抢购等。
单用户单端多次抢购;
单用户单端限量抢购;
单用户多端抢购→低并发;
单用户多端抢购→高并发;

当我们开始做性能测试的时候,一定要得出结论,并且能给出优化方案和具体实施才可以,否则都是空谈。

如何判断已经达到系统瓶颈?

做性能压测的时候,把并发线程数按照阶梯式不断累加上去,观察cpu是否有达到80%以上。

如果有,即已经达到系统瓶颈,此时也不用再压下去,压下去只会把系统打爆掉,应该去查看此时的TPS是否满足预期,如果满足预期设定的值,则可以不用考虑隐患(前提是预期值要设置的合理),如果不满足预期的TPS,就需要根据具体性能瓶颈,提出优化改进建议。

而优化改进建议就通过观察是哪个地方的瓶颈最明显,最值得修改,就对该地方作出优化,比如RDS、连接池、Redis、代码逻辑、系统配置、JVM服务等等。

粗略几个影响点:
系统内存容量太小–影响系统性能;
算法过于繁琐–影响系统性能;
慢sql–影响RDS性能;
数据库连接过多,超出容量–影响系统的连接池性能;
redis请求过多–影响Redis性能;

如何分析瓶颈所在?

首先遇到TPS低于20,RT大于2000ms的压测结果,那么肯定不是一个正常的结果,此时要观察各个服务的指标情况。

根据时间区间,在pinpoint上面看接口请求分布,拉到具体的接口分布列表,查看当前测试接口的详情,查看调用链路是有哪些。

根据调用链路,可以看到有做了数据库的连接(涉及到连接池),有查询redis,或者还有系统算法的内容。

根据每个环节的耗时,有没有耗时特别长的,比如大于100ms的那种,比如连接数据库时间特别长,那么就可能是在连接池连接的时候较慢,原因是并发数太多,容量不够,排队等待的时间太久了。

给出建议:需要增加连接池的容量。

也可以查看系统cpu的情况,根据cpu占比中的系统或者JVM的占比是否异常高,如果是系统的占比异常高,则可能是代码中算法复杂,比如if循环较多。除了cpu,还有可能是其他指数会有异常飙高。

下面是我整理的2023年最全的软件测试工程师学习知识架构体系图

一、Python编程入门到精通

请添加图片描述

二、接口自动化项目实战

请添加图片描述

三、Web自动化项目实战

请添加图片描述

四、App自动化项目实战

请添加图片描述

五、一线大厂简历

请添加图片描述

六、测试开发DevOps体系

请添加图片描述

七、常用自动化测试工具

请添加图片描述

八、JMeter性能测试

请添加图片描述

九、总结(尾部小惊喜)

每个人都有属于自己的舞台,只要肯努力拼搏,就一定会赢得成功。面对生活中的挑战和困难,我们不能畏惧,更不能放弃。要坚定信念,迎难而上,不断挑战自我!

每个人都有自己的梦想,只不过追逐的道路不同而已。奋斗的意义在于,让我们的生命更加精彩,让我们的未来更加光明。所以,不论遇到什么困难和挫折,我们都必须坚定地走下去!

生命里总有一些事情需要我们去拼搏奋斗,让自己变得更加强大。无论你现在身处何方,无论你遇到多少挫折和困难,永远不要放弃追求自己的目标。坚定地走下去,成功就在不远处!

猜你喜欢

转载自blog.csdn.net/shuang_waiwai/article/details/130543891