首页 > 专利查询

基于分步时空JITL-MKPLS的间歇过程故障监测

2021 年 2 月 Journal of Chemical Engineering of Chinese Universities Feb. 2021文章编号：1003-9015(2021)01-0127-13

高学金1,2,3,4, 孟令军1,2,3,4, 王豪1,2,3,4, 高慧慧1,2,3,4

金属化膜(1. 北京工业大学信息学部, 北京 100124; 2. 数字社区教育部工程研究中心, 北京 100124;

3. 城市轨道交通北京实验室, 北京 100124;

4. 计算智能与智能系统北京市重点实验室, 北京 100124)

摘要：针对多阶段时变的间歇过程难以用全局模型准确描述生产过程的动态变化及传统局部建模每个工作点都需要

重新筛选样本建模导致计算量较大的问题，提出一种分步时空即时学习的局部建模策略。采用仿射传播(AP)聚类的方

故障检测式对历史数据样本集中的数据进行初步分类，在当前输入样本数据到达后，确定当前样本数据所属的类别，在此类别

所限定的子数据样本集中使用时间和空间相结合的即时学习策略确定出局部相似样本，建立多向核偏最小二乘监测模

净烟器型。将该算法在青霉素发酵仿真数据和大肠杆菌发酵过程生产数据上进行验证，结果表明，所提方法不仅减少了不必

扭剪型螺栓

要的计算量，还能够更加精准即时地进行故障监测。

关键词：时空即时学习；分步；多向核偏最小二乘；局部建模；故障监测

中图分类号：TH165.3文献标志码：A DOI：10.3969/j.issn.1003-9015.2021.01.015

Fault monitoring of batch processes based on substep time-space JITL-MKPLS

GAO Xue-jin1,2,3,4, MENG Ling-jun1,2,3,4, WANG Hao1,2,3,4, GAO Hui-hui1,2,3,4鹤嘴锤

(1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;

2. Engineering Research Center of Digital Community, Ministry of Education, Beijing 100124, China;

3. Beijing Laboratory for Urban Mass Transit, Beijing 100124, China;

4. Beijing Laboratory of Computational Intelligence and Intelligent System, Beijing 100124, China)

Abstract:It is difficult to accurately describe the dynamic characteristics of multi-stage time-varying batch processes with global models, while every working point of traditional local models needs to re-select samples that results in high requirement of computation. A local modeling strategy based on substep time-space just-in-time learning (JITL) was proposed. The data in the sample set of historical data were preliminarily classified by an affinity propagation (AP) clustering method. When the current input sample data arrived, the category of these data was determined. The JITL strategy combining time and space was used to determine local similar samples in the subsample of the category. A multi kernel partial least squares (MKPLS) monitoring model was established using local similar samples. The effectiveness of the proposed method was validated via simulation of penicillin fermentation and E. coli production of interleukin-2. The results demonstrate that the proposed method reduces unnecessary calculation and can detect faults more accurately and instantaneously.

Key words:time-space just-in-time learning; substep; multi kernel partial least squares; local modeling;

fault monitoring

收稿日期：2019-04-20；修订日期：2019-11-01。

基金项目：国家自然科学基金(61803005，61640312，61763037)；北京市自然科学基金(4192011，4172007)；山东省重点研发计划(2018CXGC0608)；北京市教育委员会资助。

作者简介：高学金(1973-)，男，河北唐山人，北京工业大学教授，博士。通信联系人：高学金，E-mail：******************

1 前言

间歇过程作为现代工业过程中极其重要的一种生产方式，已经被广泛应用于医药、食品、生物化工、半导体等多品种、高附加值产品的生产中[1]。但是在实际过程中，由于设备老化和外在环境突变等一系列问题，故障时有发生。因此，对间歇过程进行故障监测对于保证生产过程的安全以及提高产品质量变得至关重要[2]。

多路主成分分析(MPCA)和多路偏最小二乘(MPLS)通过将三维历史数据首先展开为二维矩阵再使用主成分分析(PCA)或偏最小二乘(PLS)方法对得到的二维矩阵进行分析，在间歇过程的故障监测领域得到广泛的应用[3-5]。然而，由于工业过程变量绝大多数是非线性的，而PLS 假设监测数据是线性的，因此不能很好地满足于工业实践。为了解决这个问题，Rosipal 等[6]将核技巧与PLS 结合提出了一种核P

LS(KPLS)算法，该算法可以有效解决监测数据的非线性问题[7-8]。但是传统的基于KPLS 的监测方法是对整个过程建立全局模型，而对于多阶段时变的间歇过程[9]，建立单一的全局模型通常难以精确描述动态过程的变化特性。因此，将整个运行过程划分为多个阶段区域，再在每个区域内建立局部模型显得尤为重要。过程在不断变化，模型需要不断地更新来适应过程的变化，从而才能更准确地分析新样本。为了建立局部模型，即时学习(just-in-time-learning ，JITL)策略近期被提出并被广泛应用于过程建模和监控[10-11]。已有学者在局部建模方面做出了贡献，Liu 等[12]提出即时递推核学习(just-in-time kernel learning)方法，通过构造累积相似度因子，选择相似的样本集建立核学习辨识模型，但是，根据数据样本间的空间欧氏距离和角度信息来选择学习集，而忽略了数据的时间特性；Chen 等[13]提出一种应用遗忘因子以降低在线JITL 选择数据量的方法，Hu 等[14-16]采用一系列滑动窗以及自适应相似性度量改进传统JITL ，尽管这些方法可以减小模型的计算负担，但是，这些方法有可能使部分历史数据丢失，而且遗忘因子或者窗口宽度的调整也存在问题。

在基于即时学习[17-18]的建模方法中，最为关键的是用以建立局部模型的学习集的选取。传统的即时学习算法一般根据数据样本间的空间欧氏距离和角度信息选择学习集，而不考虑数据的时间特性，因此当有异常数据出现时，就可能出现模型偏移的问题，同时，在进行局部建模时，对每个工作点都重新进行局部建模，建模计算量较大，耗时较长，模型输出的即时性也会受到影响。针对以上2个问题，本文提出一种分步的时空即时学习算法：首先，采用仿射传播(affinity propagation, AP)聚类[19]用于分

析经过展开及标准化的历史数据，计算出相对能够代表普通历史数据的聚类中心。在线监测阶段，计算采集到的当前时刻的数据与聚类中心的关系，并对历史数据进行初步筛选；之后用融入时间特性[20]的时空JITL 方法从这些初步筛选的数据中进一步进行精选以取得更精确的历史数据；最后，采用(multiway kernel partial least square, MKPLS)算法与选择的这些数据建立局部模型，并对当前的过程进行实时监测。

2 多向核偏最小二乘法

PLS 作为一种分析输入变量空间和输出变量空间的相互关系多元回归算法[21-22]，能够很好地将线性数据间的潜在特征提取出来，但是当这些数据是非线性时，由于PLS 的固有线性，很难显示出优越性。为了解决非线性问题，核方法被引入到PLS 算法中，它通过构造一个投影f 将原始空间中的数据投影到高维空间降低数据整体的非线性。

()():1,2,,n i i f i I ∈=⋅⋅⋅−−→∈R x f x F (1)

式中：i x 为第i 行输入数据，n R 为n 维实数空间，F 为高维特征空间，()i f x 为输入数据映射到特征空间的非线性映射函数。假设I M ⨯维矩阵()i f x 表示{}1I

i =i x 映射到F 空间后的矩阵，M 代表特征空间的维数，通过引入核方法，()()()T

=i j i j f x f x K x ,x ，其中K 为I I ⨯维核矩阵。输出数据的预测值为

()1T T -Y =KU T KU T Y (2)

式中：[]12,,,C u u u =⋅⋅⋅U 为输出数据Y 的得分矩阵，[]12,,,C t t t =⋅⋅⋅T 为高维数据的得分矩阵，C 为保留的隐变量的个数，虽然不知道f 的显示表达，但矩阵T 可表示为

第35卷第1期高学金等：基于分步时空JITL-MKPLS 的间歇过程故障监测 129

()1T -T =KU T KU (3)

此外，在建立KPLS 模型之前，通常还需要对核矩阵K 进行中心化处理。

由于间歇过程数据本身有批次数、变量数和采样数(时间数)3个维度，需要将原始的三维数据展开为二维数据进行建模，X (I ×J ×K )为正常工况下的间歇过程历史数据构成的三维矩阵，其中I 为生产批次个数，J 为观测变量个数，K 为采样数。本文采用一种基于变量方向的展开方式，展开成()I K J ⨯⨯X 的矩阵，相当于I K ⨯个J 维的数据组成的矩阵。具体展开步骤为将后一批次的第一个数据接在前一批次最后一个数据后面，组成沿时间轴上的样本点；这种算法能够保留过程变量的维数，能够较好地、快速地检测故障或扰动。将三维数据展开成二维数据后再利用KPLS 算法进行建模，即得到适合处理间

歇过程三维数据的多向核偏最小二乘法(MKPLS)。

3 分步时空JITL 局部样本筛选

3.1 分步历史数据样本筛选策略

分布历史数据样本选择策略的思想是保持模型精确度与一般算法处在相同水平的前提下，降低计算量需求，保留对全部历史数据进行筛选的可能性。在传统JITL 方法应用的阶段，需要对历史数据中每一个样本进行相似度的计算，然而这样的计算在一个具有n 个数据样本的历史数据中需要进行n 次。所提出的方法可以分为3步，即离线准备阶段、初步在线筛选阶段、在线精选阶段。首先，离线准备阶段需要利用AP 聚类方法取得历史样本的聚类中心，以供在线阶段使用；第2步，对新采集到的当前样本向量同初步筛选阶段得到的聚类中心计算新的隶属关系。最后，一个相关子数据集被选择出来，并进行在线精选之后这一组更小规模的数据会被用于局部的KPLS 建模过程当中。这种方法寻共同的基准点，从传统的大量的互为相对基准点计算转变为对有限个独立基准点进行的计算，从与全部历史样本进行对比到只与几个样本进行对比，因而在一定程度上可以减小算法的计算时间。

无石棉刹车片AP 聚类是基于数据点间的“信息传递”的一种聚类算法，最大的优势是不需要在运行算法之前人为指定聚类的个数，而经典的K-means 方法、模糊C 均值(fuzzy c-means ，FCM)方法都需要依据经验事先人为指定聚类个数，带有明显的人为因素，因而聚类的结果并不能保证真实有效，也无法反映实际生

产过程的阶段特性。AP 聚类算法将全部样本点看作网络的节点，自动地寻具有代表性的聚类中心，使得所有样本点到最近的类代表点的相似度之和最大[23]。

AP 算法定义了吸引度信息矩阵R 和归属度信息矩阵A : r (i,k )表示从i 到k 的消息，描述的是样本对象k 适合作为样本对象i 的聚类中心的程度；相反地，a (i,k )表示从k 到i 的消息，描述的是样本对象i 选择样本对象k 作为其据聚类中心的适合程度。AP 算法进行交替2个信息传递的步骤，以更新2个矩阵。

首先，吸引信息r t+1(i,k )按照式(4)迭代。

()()()(){}1',,max ,','t t k k

r i k s i k a i k s i k +≠=-+ (4) 式中：(),s i k 为样本点i 和k 之间的相似度，通过欧氏距离计算。(),'t a i k 为样本点'k 到i 的消息，(),'s i k 为样本点i 和'k 之间的相似度。然后，归属信息a t+1(i ,k )按照式(5)和(6)迭代。

()()(){}{}1',,min 0,,max 0,',,t t t i i k a i k r k k r i k i k +∉⎛⎫=+≠ ⎪ ⎪⎝⎭

∑ (5) ()(){}1',max 0,',t t i k

a k k r i k +≠=∑ (6)

式中：()',t r i k 为样本点'i 到k 的消息，r t (k, k )为样本点k 到k 的消息。

在进行迭代时，如果迭代次数超过设定的最大值或者当聚类中心在若干次迭代中不发生改变时停止计算并确定类中心及各类的样本点。

3.2 时空JITL 局部模型

JITL 是一种局部建模思想，主要目的是从历史数据库中选取与当前数据对应的最相似的历史采样，而全局建模利用的是历史数据库中的全部数据。因而利用JITL 策略选择相似样本建模，最大的优势是可

130 高校化学工程学报 2021年2月以提高模型的精度。传统的即时学习策略在从包含历史信息的数据库中选择相似样本，并构造学习集时采用的是基于欧氏距离和角度信息的相似度计算方法，相似度大小可以直接反映出x i 和x q 的靠近程度，选择建模数据时按照相似度由大到小依次选取若干数据，如式(7)所示：

()()()()()()()1112,,e 1cos ,,,...,q i i q i q q q k q d D D D D ααθ-⎧⎡⎤=+-⎪⎣⎦⎨⎪>>>⎩

x x x x x x x x x x x x (7) 式中：α1为加权因子，(),i q d x x 为x i 与x q 的距离，(),i q θx x 为其夹角大小，计算方法如式(8)所示

(

)()T 2

2,,arccos i q i q i q i q d θ⎧⎪⎪⎨=⎪⎪⎩x x x x x x x x (8) 传统的即时学习算法一般根据数据样本间的空间距离进行学习集的选择，而不考虑数据的时间特性。在间歇生产过程中，设备特性、生产状况等会随时间发生变化，导致测量的数据在时间维度上显示出差异，因此在选取学习集的时候有必要考虑数据的时间特性。因此本文借鉴牛大鹏等[20]的方法将数据的时间特性加入即时学习算法的相似度计算公式中，用于局部模型的建立。

融入时间特性的即时学习需要确定时间权重，首先假定所选择的学习集的时间权向量为

[]T

121[,,,]1,0,1，n

n m m m w w w w w ==⋅⋅⋅=∈∑W (9) 式中：12,,,n w w w ⋅⋅⋅为样本的时间权重。

为了充分反映样本中权重包含的信息程度，定义一个时间权向量的熵I w ，如式(10)所示。熵是度量信息大小的一个指标。熵值越大，则数据所含信息量越小。时间权向量的熵反映了对样本的集结过程中权重包含信息的程度。

w 1ln n

m m m I w w ==-∑ (10)

为了反映样本中不同时段数据的权重差异，定义一个时间度λ，取值在0到1之间，如式(11)所示。即λ=0.1时，表明越注重距离当前工作点较近的数据；当λ=0.5时，说明同样重视所有时期数据；当λ=0.9时，表明越注重远期的数据。

11n m m n m w n λ=-=-∑

(11) 本文中时间度λ根据赋值规则选取，w 的确定既要充分考虑主观的专家经验知识，也要兼顾时间样本点本身所包含的客观信息，所以w 的确定可转化为式(12)所示的非线性规划问题。

[]

1max 11,0,11,2,,n m m m n m m n m m m w w n m w n w w m n

λ===⎛⎫- ⎪⎝⎭

=-=∈=⋅⋅⋅∑∑∑ (12) 综上，基于时间和空间相结合的JITL 学习集选取规则为

()()()()()()()w 11w ,,e 1cos ,,,,q i i q i q i q i q i q i d x x D x x x x d x x d x x d x x rw ααθ-⎧⎡⎤=+-⎣⎦⎪⎪⎨⎪=+⎪⎩

(13)

第35卷第1期高学金等：基于分步时空JITL-MKPLS 的间歇过程故障监测 131

图1 分步时空JITL-MKPLS 监测流程图 Fig.1 Flow chart of substep time-space JITL-MKPLS monitoring 式中：r 为可以调节的参数。若输入样本x q 波动较小时可以选取较大的r 值；反之，则可以选取较小的r 值。

4 基于分步时空JITL-MKPLS 的间歇过程故障监测

间歇过程的数据一般呈三维矩阵，本文针对间歇过程的数据特性选取一种基于分步时空JITL-MKPLS 算法进行故障监测。在利用本文所提的分布时空JITL 算法从历史样本选择出与在线样本相似的样本后，采用MKPLS 算法对筛选出的样本进行建模，采用Hotelling 的T 2统计量和SPE 统计量作为监测指标，判断在线样本点是否发生故障。T 2统计量和SPE 统计量定义如下：

1T new,,,(1)~()k k k k

A n A A n F n n A α---=-T t Λt (14) 式中：new,k t 为新采集样本在k 时刻的得分向量，t k 为样本在k 时刻的得分向量，k Λ为对应时刻的得分矩阵的协方差矩阵，且T 2的控制限服从F 分布，A 为保留的隐变量的个数，n 为样本点数，α为置信区间。

T new,new,SPE k k k =e e (15)

()

T new,new,k k k k I P P =-e x (16)

式中：new,k x 为新批次k 时刻的过程数据，P k 为负载矩阵，SPE 统计量用于监测采样点偏离模型空间的残差信息，并服从加权2χ分布，SPE 的控制限通过它的近似分布来确定。

2,,SPE ~k k k h g αχ (17)

/2k k k g b a = (18)

22/k k k h a b = (19) 式中：g 为权重系数，h 为自由度，k a 和k b 分别为k 时刻的均值和方差。

本文提出的基于分步时空JITL-MKPLS 的间歇过程如图1所示，具体建模步骤如下：

本文发布于:2024-09-25 10:35:03，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/4/343100.html