基于PCA的故障诊断方法（matlab）

1. PCA原理分析

PCA的原理主要是将原始数据进行降维。其具体工作原理参照：CodingLabs - PCA的数学原理

2. 数据预处理

训练数据集（只有正样本）为 $X_{n*m}$ 维数据，即有n个采样值，每个采样值有m个特征。

$\begin{pmatrix} x_{11} &x_{12} & \cdots & x_{1m}\\ x_{21}& x_{22} &\cdots &x_{2m} \\ \vdots&\vdots &\ddots &\vdots \\ x_{n1}&x_{n2} &\cdots &x_{nm} \end{pmatrix}$

2.1 数据归一化

将数据X针对每个特征归一化为均值为0，均方根为1的数据。

$x_{i,j}^*=\frac{x_{i,j}-\bar{x_i}}{\sqrt{s_{i}}}$

其中：

$\bar {x_i}=\frac{1}{n}\sum_{j=1}^n{x_{ji}},i=1,2,...,n$

$s_{i}=\frac{1}{n-1}\sum_{j=1}^n{(x_{ji}-\bar {x_i})^2}, i=1,2,...,n$

3. PCA降维

3.1 首先求取协方差矩阵

协方差矩阵的公式为：

$R=\frac{1}{n-1}X^TX$

计算出来的协方差矩阵为特征m*m维矩阵。

3.2 求取特征值和特征向量

求取协方差矩阵R的特征值和特征向量，并将特征值按照从大到小的顺序排列

$\lambda_1\geq\lambda_2\geq\lambda_3\cdots\geq\lambda_m$

将特征向量按照特征值重新排列后得到：

$P_{mm}=[p_1,p_2,\cdots,p_m]$

3.3 选择合适的k个特征进行PCA降维

可以选择特征值累计大于85%的前k个特征进行PCA降维

$\frac{\sum_{i=1}^k{\lambda_i}}{\sum_{i=1}^m{\lambda_i}}\geq 0.85$

令前k个从大到小的特征值构成对角矩阵 $S_{kk}$ ,k个对应的特征向量组成将为矩阵 $P_{mk}$ 。即：

$S_{kk}=diag(\lambda_1,\lambda_2,\cdots,\lambda_k)$

$P_{mk}=[p_1,p_2,\cdots,p_k]$

PCA降维后，样本数目仍为n个采样，但是特征数目变为k，降维公式为：

$\tilde{X}_{nk}=X_{nm}*P_{mk}$

将X进行重构后得到的X‘的矩阵的计算公式为：

$X'=\tilde{X}_{nk}P_{mk}^T=X_{nm}P_{mk}P_{mk}^T$

4. 求取统计量限值

4.1 $T^2$ 统计量

4.1.1 $T^2$ 统计量的计算公式：

$T_{\alpha}=\frac{k(n^2-1)}{n(n-k)}F_{\alpha}(k,n-k)$

其中 $1-\alpha$ 是置信度， $F_{\alpha}(k,n-k)$ 是服从第一自由度为k，第二自由度为n-k的F分布，通常 $\alpha$ 取0.01。

另外强调一点是：n是训练数据集的采样数，k为PCA后选择的特征的数量。

4.1.2 计算测试数据的 $T^2$ 统计量

计算测试数据每个采样值的 $T^2$ 值。假设测试样本中的一个采样值 $x_{new}$ 为1*m的一个采样值，该采样值同样经过训练样本的均值和方差进行归一化（注意此处均值和方差使用训练样本的均值和方差，而不是选择训练数据的样本和方差），其 $T^2$ 计算公式为：

$T^2=x_{new(1m)}*P_{mk}*S_{kk}^{-1}*P_{mk}^T*x_{new(1m)}^T$

另外 $T^2$ 的计算公式也可以简化为：

$T^2=||S_{kk}^{-1/2}*P_{mk}^T*x_{new(1m)}^T||_2^2$

其中 $S_{kk}^{-1/2}$ 表示对角矩阵中的每个元素取-1/2指数， $||\cdot ||_2^2$ 表示2范数的平方。

4.1.3 故障判定

如系统正常运行，则样本的 $T^2$ 值应该满足T $T^2<T_{\alpha}$ ，否则则认为出现故障。

4.2 SPE统计量（也称Q统计量）

4.2.1 SPE控制量限值的计算

$Q_{\alpha}=\theta_1[\frac{c_{\alpha}h_0\sqrt{2\theta_2}}{\theta_1}+1+\frac{\theta_2h_0(h_0-1)}{\theta_1^2}]^{1/h_0}$

其中：

$\theta_r=\sum_{j=k+1}^m{\lambda_j^r)}, r=1,2,3$

$h_0=1-\frac{2\theta_1\theta_3}{3\theta_2^2}$

$c_{\alpha}$ 是标准正态分布的置信极限。

4.2.2 计算测试数据的SPE值

测试数据选择和计算 $T^2$ 相同的采样值 $x_{new(1m)}$ ,同样做相同的归一化处理。

$Q=x_{new(1m)}*(I_{mm}-P_{mk}P_{mk}^T)x_{new(1m)}^T$

4.3.3 判断是否发生故障

如果系统正常运行，则样本的SPE值应满足 $Q<Q_{\alpha}$ ,否则，可认定发生故障。

5. matlab实现

clc;clear;
%% 1.导入数据
%产生训练数据
num_sample=100;
a=10*randn(num_sample,1);
x1=a+randn(num_sample,1);
x2=1*sin(a)+randn(num_sample,1);
x3=5*cos(5*a)+randn(num_sample,1);
x4=0.8*x2+0.1*x3+randn(num_sample,1);
xx_train=[x1,x2,x3,x4];

% 产生测试数据
a=10*randn(num_sample,1);
x1=a+randn(num_sample,1);
x2=1*sin(a)+randn(num_sample,1);
x3=5*cos(5*a)+randn(num_sample,1);
x4=0.8*x2+0.1*x3+randn(num_sample,1);
xx_test=[x1,x2,x3,x4];
xx_test(51:100,2)=xx_test(51:100,2)+15*ones(50,1);

%% 2.数据处理
Xtrain=xx_train;
Xtest=xx_test;
X_mean=mean(Xtrain);
X_std=std(Xtrain);
[X_row, X_col]=size(Xtrain);
Xtrain=(Xtrain-repmat(X_mean,X_row,1))./repmat(X_std,X_row,1); %标准化处理

%% 3.PCA降维
SXtrain = cov(Xtrain);%求协方差矩阵
[T,lm]=eig(SXtrain);%求特征值及特征向量,特征值排列顺序为从小到大
D=flipud(diag(lm));%将特征值从大到小排列
% 确定降维后的数量
num=1;
while sum(D(1:num))/sum(D)<0.85
    num = num+1;
end
P = T(:,X_col-num+1:X_col); %取对应的向量
P_=fliplr(P); %特征向量由大到小排列


%% 4.计算T2和Q的限值
%求置信度为99%时的T2统计控制限,T=k*(n^2-1)/n(n-k)*F(k,n-k)
%其中k对应num,n对应X_row
T2UCL1=num*(X_row-1)*(X_row+1)*finv(0.99,num,X_row - num)/(X_row*(X_row - num));%求置信度为99%时的T2统计控制限 

%求置信度为99%的Q统计控制限
for i = 1:3
    th(i) = sum((D(num+1:X_col)).^i);
end
h0 = 1 - 2*th(1)*th(3)/(3*th(2)^2);
ca = norminv(0.99,0,1);
QU = th(1)*(h0*ca*sqrt(2*th(2))/th(1) + 1 + th(2)*h0*(h0 - 1)/th(1)^2)^(1/h0); %置信度为99%的Q统计控制限 

%% 5.模型测试
n = size(Xtest,1);
Xtest=(Xtest-repmat(X_mean,n,1))./repmat(X_std,n,1);%标准化处理
%求T2统计量，Q统计量
[r,y] = size(P*P');
I = eye(r,y); 
T2 = zeros(n,1);
Q = zeros(n,1);
lm_=fliplr(flipud(lm));
%T2的计算公式Xtest.T*P_*inv(S)*P_*Xtest
for i = 1:n
    T2(i)=Xtest(i,:)*P_*inv(lm_(1:num,1:num))*P_'*Xtest(i,:)';    
    Q(i) = Xtest(i,:)*(I - P*P')*Xtest(i,:)';                                                                                    
end

%% 6.绘制T2和SPE图
figure('Name','PCA');
subplot(2,1,1);
plot(1:i,T2(1:i),'k');
hold on;
plot(i:n,T2(i:n),'k');
title('统计量变化图');
xlabel('采样数');
ylabel('T2');
hold on;
line([0,n],[T2UCL1,T2UCL1],'LineStyle','--','Color','r');

subplot(2,1,2);
plot(1:i,Q(1:i),'k');
hold on;
plot(i:n,Q(i:n),'k');
title('统计量变化图');
xlabel('采样数');
ylabel('SPE');
hold on;
line([0,n],[QU,QU],'LineStyle','--','Color','r');

%% 7.绘制贡献图
%7.1.确定造成失控状态的得分
S = Xtest(51,:)*P(:,1:num);
r = [ ];
for i = 1:num
    if S(i)^2/lm_(i) > T2UCL1/num
        r = cat(2,r,i);
    end
end
%7.2.计算每个变量相对于上述失控得分的贡献
cont = zeros(length(r),X_col);
for i = length(r)
    for j = 1:X_col
        cont(i,j) = abs(S(i)/D(i)*P(j,i)*Xtest(51,j));
    end
end
%7.3.计算每个变量的总贡献
CONTJ = zeros(X_col,1);
for j = 1:X_col
    CONTJ(j) = sum(cont(:,j));
end
%7.4.计算每个变量对Q的贡献
e = Xtest(51,:)*(I - P*P');%选取第60个样本来检测哪个变量出现问题。
contq = e.^2;
%5. 绘制贡献图
figure
subplot(2,1,1);
bar(contq,'g');
xlabel('变量号');
ylabel('SPE贡献率 %');
hold on;
subplot(2,1,2);
bar(CONTJ,'r');
xlabel('变量号');
ylabel('T^2贡献率 %');

训练数据为自己创建的x1,x2,x3和x4，其中x4是和x2,x3相关的变量。测试数据和训练数据完全一致，只不过在第50个数据后在x2上添加了故障。

得到的结果如下：

从上图可以明显看出测试数据在第50个数据开始，T2和SPE值都超限，证明发生故障。

通过贡献图分析，可以看出变量2为故障发生点，与实际情况相符。对于故障发生点还有更精细的方法。此处不做深究。

参考：基于PCA的线性监督分类的故障诊断方法-T2与SPE统计量的计算_And_ZJ的博客-CSDN博客_spe统计量