预测和健康管理原则(PHM)

介绍

预测和健康管理原则(PHM)
完整的 PHM 套件包括五个模块：数据采集、监控和异常检测、故障诊断、预测、规划和决策。通过适当的检测、诊断和预测以及缓解措施，强大的 PHM 系统将允许对核电厂的退化进行早期预警，并可能排除由于故障和故障而导致的严重后果，同时有助于减轻不必要的维护活动的负担。

在 PHM 中重点使用数据驱动的方法，而最新的数据驱动分析方法，主要以人工智能 (AI) 和机器学习 (ML) 为代表——增强了从稳健异常检测到复杂系统的自动化控制和自主操作的应用。

在这里插入图片描述
PHM 系统流程

实时检测：持续监控从目标 SSC 收集的数据是否存在与正常行为的偏差，这些行为是初期故障或异常的指标。
故障诊断：一旦检测到异常，重要的是诊断故障，将故障定位到结构的特定组件或区域（即故障隔离）；并确定故障的根本原因（即故障识别）。
预测未来：根据 SSC 将如何退化，然后应用适当的预后模型来估计其剩余使用寿命（RUL）。
运维：根据目标 SSC 当前和假定的未来健康状态，通过整合预测计算和拟定缓解行动的风险评估，为运营和维护（O&M）规划提供信息，以实现最佳（最终自主）控制和决策。

一些要点：
状态监控（CM）描述了一套提供状态估计和异常行为预警的活动，故障检测过程试图从检测数据中识别初期故障。
状态检测的从传感器收集的数据，不能直接使用，需要进行适当的数据处理。
大容量数据的多维性和数据属性之间的冗余是 CM 和故障检测面临的挑战。所以进行数据清洗理的一些过程：通常需要特征选择——包括选择高质量属性、去除共线特征以及从原始数据集中选择最优子集特征。选择的目标是从完整的原始传感器数据数组中找到一个变量子集，这些变量可以有效地描述输入数据流，同时减少错误/噪声或无关信息的影响（清洗后的可使用最佳数据）。

特征选择方法

特征选择方法可以分为三类：过滤器、包装器(wrappers)和嵌入方法。

过滤器方法采用单变量统计测量的特征的内在属性。一般来说，过滤方法使用变量排名技术作为变量选择的主要标准。使用合适的排名标准对输入变量进行评分，并应用阈值过滤掉不太相关的特征。一些变量相关性的各种定义和度量，如互信息、Fisher 分数、浮雕、可分离性和相关性等广泛使用的指标都在过滤器方法的范畴内。
优点：速度和扩展到大型数据集的能力，计算量轻，不易过拟合。
缺点：所选子集可能不是最优的，因为可能会获得冗余子集。此外，那些本身信息量较少但与其他特征结合时提供信息的基本特征可能会被错误地丢弃。

wrappers 使用预测器作为黑盒，将预测器性能作为目标函数来评估变量子集。他们使用学习算法搜索特征子集的空间，并为每个可以添加到特征子集或从特征子集中删除的特征计算学习算法的估计准确度。此外，它们依赖于用于评估由搜索算法生成的候选解决方案（即特征子集）的分类算法，因此计算成本更高。包装器方法通常比过滤器方法提供更准确的结果，但需要特别注意防止过度拟合，并且包装器通常无法很好地适应大型数据集。选择过程基于试图适应给定数据集的特定学习算法。通常，它遵循贪婪搜索方法，根据评估标准评估所有可能的特征组合。例如，分支定界算法、遗传算法、粒子群优化、自适应浮动搜索、递归特征消除、相似性度量都属于包装方法的范畴。

嵌入式方法在 ML 算法本身的构建中完成了特征选择过程。此方法类别结合了过滤器和包装器的质量。对最优特征子集的搜索嵌入到分类器构造中，可以看作是在特征子集和假设的组合空间中的搜索。嵌入式方法使用独立的度量来确定给定基数的最佳子集，并使用学习算法在不同基数的最佳子集中选择最佳子集。因此，它们特定于给定的学习算法，并且具有考虑特征与分类模型（如包装器方法）的相互作用的优势，同时计算量要小得多（如过滤器方法）。
正则化和基于树的模型是一些使用嵌入式特征选择的常用方法。分类器的权重也可以用来对特征进行排序以去除它们，并且可以通过对相应权重进行敏感性分析来选择特征。一些方法如使用支持向量机 (SVM) 作为分类器，优化 SVM 方程并为每个特征分配权重。

异常检测方法

物理模型：

当充分理解潜在的物理机制时，人们可以尝试推导出基于第一原理的分析模型来描述预期的标称或故障 SSC 行为。
基于物理的模型的优势在于：首先，它们明确考虑了机械、材料和操作特性；其次，它们甚至可以在系统构建和运行之前进行开发和评估；第三，它们可用于理解广泛的操作和物质条件下的行为。
但相对应的缺陷在于仅使用第一原理和数学函数来模拟复杂的非线性系统是具有挑战性的、耗时的，而且通常是不可能的。此外，使用简化（有时是不合理的）假设来弥补运行时性能或不完整的领域知识，不可避免地会削弱此类模型中的物理基础。
因此数据驱动的方法已经显示出表征系统操作和开发系统模型的潜力，因为它们在建模方面具有独立性，并且仅依赖于系统数据。

基于多变量统计的异常检测方法：

扫描二维码关注公众号，回复： 15285838 查看本文章

主成分分析(PCA) 和偏最小二乘法(PLS) 是两种基本的多元统计技术，已经应用于检测故障方面。一旦选择了检测方法，就需要一个用于识别故障的度量。【在基于 PCA 和 PLS 的方法中，Hotelling 的 t 平方统计量被广泛用于检测具有特定阈值的异常。预测误差的平方和也称为 Q 统计量，是表示主成分模型无法解释的事件变化的另一个指标。】
计算基于 PCA 或 PLS 的方法的监控统计数据和阈值是在假设来自传感器的数据是高斯分布和线性相关的并且该过程在单一静止条件下运行的假设下进行的。在实践中这些条件并不理想，因此一些其他的方法，以放松传统基于统计的方法中的假设。
独立分量分析(ICA)：发现统计上独立和非高斯分量，是故障检测的可靠替代方法。高斯混合模型（GMM）是另一种常用的非高斯数据处理技术。基于 k 近邻的模糊 SVM，以减少计算负担并解决数据不平衡和异常值的问题。

故障诊断

在 PHM 的总体区域内，故障诊断在状态监控过程中检测到故障后开始。诊断进一步分为故障隔离和故障识别，它试图识别故障发生的设备或组件，以及确定故障的原因。从逻辑上讲，故障诊断的这两个子任务通常作为单一分析执行。该分析基于故障征兆，其主要采取可用特征或故障特征的形式，以感测数据和测量的形式获得。

诊断问题的常见分类方案是建模方法，其中使用基于模型或数据驱动的方法来处理问题方法。然而，这并不是一个完全明确的区别，因为这两种方法之间可能存在一些重叠，并且可以开发各种混合方法。一个特定的重叠领域是使用基于规则的专家系统进行故障诊断。这些专家系统依靠“if-then”规则来根据故障症状诊断系统的状态。可以看出，“if-then”规则的开发可以通过基于模型或数据驱动的方法来完成。

基于模型的方法：

常见的基于模型的方法包括使用观察器或统计过滤器、检查工厂模型和传感器输出之间的奇偶性、生成残差在频域中，使用因果图模型（例如有符号有向图和故障树），以及基于定性物理学的方法（例如定性模拟和定性过程理论）。这些方法的常见分类方案是将滤波、奇偶校验和频率方法归为定量方法，而图形模型和定性物理方法则视为定性方法。

基于规则的方法：

基于规则的方法通过触发特定的“if-then”规则来确定与测量/检测到的故障症状相关的后果。传统上，规则库是使用专家判断和有关系统的先验知识开发的。尽管基于工程知识的系统可能很有吸引力，但基于规则的经典系统中的问题可能包括规则库增长到无法管理的规模以描述越来越多的场景，以及基于规则的系统在遇到目前没有规则情况时可能会失败。并且在不能完全确定给定测量症状的情况下应该激活哪个规则时进行操作，这些症状不能简单地分类为单一的定性类别，例如“低”或“高”。处理这种不确定性的最常用方法是使用基于模糊规则的系统。例如使用置信度或开发基于信念规则的专家系统。然而，基于模糊规则的故障诊断工具仍然是处理不确定性的最突出使用的方法。
模糊规则库，及运行的一般模糊逻辑，通过确定“清晰”输入属于“模糊”定性状态的隶属程度并使用模糊状态，充当输入和输出之间的非线性映射来确定给定输入的结果。

数据驱动的方法：

数据驱动的方法通常依赖于大量的过程数据，通常是历史数据，来开发模型和推理方法。传统上归类为数据驱动的方法包括人工神经网络——判别方法（用于传统神经网络）、基于贝叶斯统计或利用贝叶斯网络 (BN) 的模型——生成方法、SVM——判别和 PCA 生成（无监督）或判别（监督），以及使用这些方法的组合。

预测：

预测是 PHM 的主要任务之一，因为其结果直接用于支持维护实践的主动决策。预测模块通常被定义为在设备不再执行特定功能（即 RUL）之前预测剩余时间的过程（即预测设备部件的剩余使用寿命）。预测很大程度上取决于监测、检测和诊断阶段：这些阶段的准确性都会影响 RUL 估计。需要开发一种通用的预测方法，该方法可以在给定与设备当前状态相关的一组测量值的情况下准确预测未来的设备状态。方法大致分为四类：基于物理的方法、基于知识的方法方法、数据驱动方法和混合方法。

基于物理的方法：

基于物理的预测方法试图基于一个综合数学模型（通常以一系列常微分方程或偏微分方程的形式）来描述不断发展的 SSC 退化过程，该模型表示故障的基本物理并编码第一性原理输入-输出关系。导出的数学模型与 CM 数据相结合，识别模型参数，然后用于预测 SSC 健康状态的未来演变。例如常见的基于物理的方法示例是裂纹扩展模型，其中 Paris 定律（也称为 Paris-Erdogan 方程）或 Forman 方程组用于将疲劳裂纹的扩展速率与应力强度因子和疲劳循环次数联系起来。其他一些例子包括轴承退化、涡轮蠕变演化、管道退化、电池寿命和齿轮箱故障的预测。
缺陷：1. 无法建模：当导致故障的潜在物理过程通常没有被完全理解或无法明确建模时，必须进行简化假设和估计以促进模型开发，从而引发对模型在现实世界工程系统中的适用性的怀疑。2. 物理方法特异性：其特定于组件的性质，基于物理的方法很难重新配置以适应替代领域，并且其中大多数仅适用于组件或子系统级别。3. 应用于系统级预测问题或需要表示多种故障模式时（核设施中典型的 SSC ），模型复杂性和相关的计算成本可能会变得难以进行在线分析和决策。

基于统计的方法：

基于统计的预测方法，也称为经验预测方法，是一种灰盒方法，将资产退化视为一个随机过程，受不同来源的可变性和不确定性影响。在统计方法中，RUL 是一个随机变量，其概率密度函数是根据经验数据确定的。
基于统计的预测通常可以分为两个子类别。①第一个子类别中的模型基于时间序列 CM 数据，这些数据直接描述了受监控 SSC 的潜在退化过程。基于回归和马尔可夫的模型都属于这个子类别。在基于回归的在模型中，时间序列数据的预测是通过使用自回归移动平均过程实现的，该过程假设目标 SSC 的未来状态线性依赖于过去的观察和正态分布的随机噪声。这些模型易于实现，计算成本低，但其性能受历史观测趋势信息的严重影响，在初期失效阶段和长期预测中可能不可靠。在基于马尔可夫的模型中，假设退化过程在满足马尔可夫（或无记忆）属性的有限状态空间内进行转换，但此模型并没有被大量采用，因为所有的健康状态都需要直接观察。此外，无记忆假设可能不适用于某些实际退化过程，并且通常需要大量数据或经验知识来构建状态转移概率矩阵。②第二个子类别中的模型依赖于部分观察到的状态过程和间接的CM数据（即只能间接表明被监测SSC的潜在健康状态的数据，例如振动数据）。基于贝叶斯定理的基于随机过滤的方法属于这一子类别*。基于 DBN、卡尔曼滤波器和粒子滤波器*是两种最常见的过滤算法。卡尔曼滤波算法是为线性高斯问题设计的，并且已经提出了一些增强版本；粒子滤波算法是一种顺序蒙特卡罗方法，在非线性、非高斯系统中是更好的选择。由于它们能够通过更新在线测量的概率状态估计来表征退化过程的未来不确定性，这两种过滤方法在机械 RUL 预测中都有很多应用。

基于知识的方法：

基于知识（也称为基于经验或基于规则）的预测方法完全建立在专家知识之上。这种方法不依赖于系统的物理模型。它们的实现相对简单；但是，它们仅适用于存在专家知识以使用专家系统或模糊逻辑的算法族来模仿类人表示和推理的情况。
和上述用于故障诊断的专家系统类似，用于预测的专家系统旨在将来自专家的显式知识转化为人类编码的“if-then”规则；基于模糊逻辑的预测方法可以处理专家知识固有的不确定性；基于相似性的预测是另一种基于知识的方法，消除了对领域专家定性知识建模的要求，尽管这种方法有时被归类为数据驱动方法，但它实际上遵循基于规则的建模理念，即在受监控案例和先前已知故障库之间进行相似性评估。

数据驱动的方法：

数据驱动的预后方法直接使用目标 SSC 的 CM 数据，不包含第一性原理信息或专家知识。他们依靠观察到的数据中的趋势来构建数学模型来估计被监测设备的未来状态。
缺陷：1. 数据量大：使用数据驱动方法的预测模型通常需要覆盖广泛条件的大量数据，包括退化模型的运行到失败数据。特定 SSC 的运行到故障数据的可用性；2. 数据质量：RUL 预测的性能和置信水平与用于推断模型参数和确定故障阈值的可用数据的数量和质量有关；3. 参数限制：数据驱动的方法无法推断超出训练数据所跨越的领域。

一些机器学习的方法：

基于 ML 的预测方法尝试使用 ML 或 DL 技术直接从可用观察（或提取的特征）中学习退化模式并预测 RUL。在基于 ML 的方法中，不需要事先对分析的 SSC 进行物理理解。然而作为一种黑盒方法，由于缺乏透明度，结果难以解释。除非执行额外的不确定性量化（通常使用贝叶斯推理方法），否则基于 ML 的方法通常提供 RUL 的点估计而不是概率处理。多种 ML 算法已用于预测，可大致分为 ANN、高斯过程回归 (GPR) 和 SVM 的变体。

ANN是数据驱动的预测方法中最常见的建模技术，就像故障诊断一样。一些ANN方法，如FFNN和循环神经网络(RNN) 是最流行的。FFNN 是 ANN 的最简单形式，主要用于学习健康指数和 RUL 之间的关系。RNN 是 FFNN 的后代，其特点是能够显式处理时间序列数据。标准 RNN 在学习长期时间依赖性时会遭受梯度消失和爆炸的困扰；门控循环单元 (GRU) 和 LSTM 网络是 RNN 变体来解决这个问题。一般来说，GRU 的计算成本更低，更适合较小的数据集，而 LSTM 更适用于大型数据集。除了上述两种常用的人工神经网络之外，还有其他几种变体——例如小波神经网络、CNN 变体、生成对抗网络和强化学习等。

GPR模型基于高斯过程（具有联合多元高斯分布的随机变量的累积损伤过程）来预测未来的健康状态。与人工神经网络相比，这种方法适用于小型和大型数据集，尽管它在计算和存储方面通常具有很高的复杂性。正如故障检测（“状态监测和故障检测”部分）和诊断（“数据驱动方法”部分）模块中所详述的，SVM是基于支持向量核心概念的成熟的监督学习工具。不同的 SVM 变体已应用于机械 RUL 预测。

混合方法：

基于物理、基于知识和数据驱动的预测方法各有其优势和局限性。虽然适当的方法选择取决于对系统行为和可用数据的了解，但混合或融合方法试图整合不同方法类型的优势以改进 RUL 预测结果。此外，在现实世界中，没有一种方法被认为足以解释分析系统的所有可能故障和失效模式。混合方法可以由前述方法的任意组合组成。特别感兴趣的是基于物理和 ML/DL 的技术的集合，其中故障物理知识和实验数据都可以得到适当利用，通过这种方式，组合方法促进了对输入-输出关系的物理解释，而不是黑盒处理，同时不需要像独立对应物那样准确的物理理解或大尺寸数据。另一个流行的方向是在贝叶斯框架下开发混合预测工具（例如，卡尔曼滤波器和粒子滤波器），因为它们具有鲁棒性和在不确定性下推理的能力。该方向已成为多项研究的主题，并已应用于旋转机械、电池和电解电容器等各种应用。

决策：

一旦基于 CM 数据和诊断/预后模型确定了受监控 SSC 的当前和假定的未来健康状态，至关重要的是能够在可能的（初期）故障/故障发生之前及时和正确地采取行动。进展为紧急情况。因此，决策被认为是整个 PHM 套件中不可或缺的模块。在这种情况下，决策过程是指使用先前模块的输出——故障分析和故障概率 (POF) 诊断估计、RUL 预测来自预测——为 O&M 计划和在多个模块中选择最佳维护操作提供信息为获得最有利的运营绩效而执行的替代选项。该过程可以由具有不同运营商决策支持级别的人工执行，或者最终通过启用自主的技术来执行。如果实施得当，该模块将在资产完整性管理以及规划运维活动和人员配备水平方面发挥重要和有益的作用。

统计决策理论：

统计决策理论关注基于统计知识的决策，它揭示了决策问题中涉及的不确定性。经典统计领域旨在使用统计调查产生的样本信息来推断数据的使用；相反，统计决策理论试图将样本信息与问题的其他方面相结合，以做出最佳决策。除了样本信息之外，通常还有两种其他类型的信息是相关的。首先是对决策可能后果的了解。通常，这种知识可以通过确定每个可能的决定和各种可能的不确定性值所产生的损失来量化。第二种，先验信息，通常来自过去对涉及类似不确定性的类似情况的经验。寻求利用先验信息的统计方法称为贝叶斯分析。贝叶斯方法是最常被提及的数学方法之一，专门用于广泛应用中的决策过程。

基于规则的决策：

基于规则的模型 1) 识别系统状态，2) 将状态与任务相关联，以及 3) 访问存储的规则以执行任务。工厂操作程序(OP) 本质上是由人工操作员执行的基于规则的决策模块。OP 是为正常运行而开发的，以确保工厂在运行限制和条件内运行，并为安全进行所有正常运行模式提供指导。对于异常情况和基于设计的事故，创建基于事件或基于症状的程序。使工厂程序系统自动化的一种方法是通过决策表来实施规则，决策表将条件与要执行的动作相关联。

效用理论：

经济学家发展了效用理论来解释和预测人类在风险和不确定性下的决策。效用理论的基本假设是一个理性的决策者总是选择使效用的期望值最大化的替代方案。建立在这个假设中的是一个进一步的假设，即人类决策者接受和使用理性代码，从而可以构建允许预测人类行为的数学表示。效用理论可以作为用于实时自主控制的决策系统的基础构建块。给定一组看似可行的替代解决方案，可以比较为每个替代方案确定的实施风险，以找到风险最小的解决方案。与工厂 OP 或其他决策策略相关的独立损失和增益函数可以表述为非线性关系。NPP 效用理论的示例性实施见提出了一种基于影响图的咨询模型来为工厂人员提供决策支持。

马尔可夫决策过程：

对于随机环境中的顺序决策问题，最大预期效用的相同原则仍然适用，但最佳决策将需要对未来的行动和观察序列进行推理。马尔可夫决策过程(MDP) 提供了一个数学框架，用于在结果部分随机且部分受决策者控制的情况下对决策进行建模。MDP 已成功用于广泛的自动控制问题——尤其是自动驾驶，并且通常使用动态规划 (DP) 解决优化问题以选择正确的决定。部分可观察的MDP(POMDP) 是 MDP 的概括，它对决策过程进行建模，其中假设 MDP 表示系统动态，但并非所有状态都是可观察的。相反，模型接收到的测量结果是不完整的，并且通常是嘈杂的预测。因此，模型必须在可能的状态空间上估计后验分布。POMDP 在信念空间上计算价值函数。信念是整个概率分布的函数。POMDP 的精确解会为状态空间上的每个可能信念产生最优动作，从而最大化价值函数。然而，这个最大化过程需要一个远非实用的迭代算法。对于任何合理数量的状态、传感器和执行器，价值函数的复杂性都令人望而却步。针对该挑战的一个推荐解决方案是使用差分 DP（一种基于 DP 的轨迹优化类最优控制算法），因为它仅在不受约束的控制空间上进行优化。

离散事件模型：

许多人工设备和系统以及一些自然系统仅显示离散值或结果。这些类型的系统最好描述为离散事件系统(DES)。阀门的打开和关闭或泵启动过程的开始是 NPP 中离散事件过程的示例。这些流程通常与 OP 相关联，由工厂操作员处理他们的控制。DES 满足以下特性：1）状态空间是离散集；2）状态转换机制是事件驱动的。在这样的系统中，时间不是一个合适的自变量，传统的微分方程方法如现代控制理论不适用于它们。DES 通常由有限状态自动机或Petri 网建模. 这些模型使用定义的状态转换结构来描述系统每个状态中可能发生的事件，并且它们在表示状态信息的方式上有所不同。

总结

完整的 PHM 套件利用传感器技术来监控健康状况、检测异常、诊断故障、预测 RUL，并主动管理复杂工程系统（如 NPP）中的故障。一个完整的 PHM 系统分为五个模块/步骤。

1)数据采集：从感兴趣的 SSC 采集数据的过程对于准确、可靠地预测其健康状况是必要的。收集的数据可以是感官数据或事件数据。传感数据是通过目标设备上安装的传感器跟踪的测量结果，是“数据采集：新兴传感器技术”部分的重点，介绍了一些已用于核应用或被认为很快对 CM inside 有用的新兴传感技术核电厂。

2)监测与检测：持续监控从目标 SSC 收集的数据是否偏离正常行为，这是异常的指标。如“状态监测和故障检测”部分所述，故障检测过程试图识别初期故障和故障。传感器收集的多维、大容量原始数据还不能直接使用，需要适当的特征选择。“特征选择方法”部分描述了三类特征选择方法：过滤器、包装器和嵌入方法。在“异常检测方法”部分，重点介绍了使用数据驱动方法检测异常的研究工作。特别是，基于多元统计的各种故障检测方法受到了关注。

3)故障诊断：一旦检测到异常，诊断故障至关重要，换句话说，将故障定位到结构的特定组件或区域（即故障隔离）并确定故障的根本原因故障（即故障识别）。如“故障诊断”部分所述，可以使用基于模型的方法（“基于模型的方法”部分）、基于规则的方法（“基于规则的方法”部分）或数据驱动的方法进行诊断。方法（“数据驱动方法”部分）。然而，这些区别并不完全清楚，可以开发各种混合方法。

4)预后：根据 SSC 将如何退化，然后应用适当的预测模型来估计其 RUL。被视为 PHM 最有益的方面之一，预测是矛盾的模块，特别是在核工业中。没有针对所有预测问题的普遍接受的方法，并且已经开发了各种算法以应用于特定情况或组件类别。“Prognostics”部分基于最近的评论论文集，将这些算法分为四个模型类别：基于物理的（“Physics-Based Methods”部分）、基于知识的（“Knowledge-Based Methods”部分）、数据驱动的（“数据驱动方法”部分）和混合（“混合方法”部分）模型。数据驱动的预测模型——从传统的统计方法（“基于统计的预测”部分）到先进的 ML/DL 技术（“基于机器学习的预测”部分）——对大型复杂系统特别感兴趣，并且它们已经机械预测领域的大多数研究课题。混合方法进一步整合了不同模型类型的优势，以改进 RUL 预测结果。

5)决策：基于目标 SSC 当前和假定的未来健康状态，通过对所提议的缓解行动的预测计算和风险评估的整合，为 O&M 规划提供信息，以实现最佳（并最终自主）控制和决策。作为更广泛的 PHM 哲学不可或缺的一步，自主决策模块尚未在核领域得到广泛研究。鉴于核电厂的现状和明显差距，“决策”部分首先总结了决策中使用的一般方法（“决策方法”部分）。

预测和健康管理原则(PHM)

介绍

总结

猜你喜欢