机器学习预测叶片-网孔管线式高剪切混合器性能

Service

	把本文推荐给朋友
	加入我的书架


	加入引用管理器

	Email Alert

	RSS
作者相关文章
	王灵杰

	郭俊恒

	李文鹏

	程芹

	张金利

Abstract

PDF

Figures

Tables

引用本文

王灵杰, 郭俊恒, 李文鹏, 程芹, 张金利. 机器学习预测叶片-网孔管线式高剪切混合器性能[J]. 化学工业与工程, 2022, 39(2): 1-8.

WANG Lingjie, GUO Junheng, LI Wenpeng, CHENG Qin, ZHANG Jinli. Forecast of in-line blade-screen high shear mixer's performance based on machine learning[J]. Chemical Industry and Engineering, 2022, 39(2): 1-8.

机器学习预测叶片-网孔管线式高剪切混合器性能

王灵杰¹ , 郭俊恒¹ , 李文鹏² , 程芹³ , 张金利¹

1. 天津大学化工学院, 天津 300072;
2. 郑州大学化工学院, 郑州 450000;
3. 安徽大学化学化工学院, 合肥 230601

收稿日期: 2021-03-30; 修改日期: 2021-05-12

基金项目: 国家自然科学基金项目(U20A20151;21776179)

作者简介: 王灵杰(1988-), 男, 硕士研究生, 主要从事机器学习在高剪切方向的研究.

通信作者: 张金利, 教授, E-mail: zhangjinli@tju.edu.cn.

摘要：高剪切混合器作为一种新型的过程强化设备, 工业应用日益广泛, 但其工程设计依然依靠经验放大。利用不同定转子构型的叶片-网孔管线式高剪切混合器的功耗、液-液传质系数和乳化性能等数据, 采用反向传播神经网络算法、循环神经网络算法和决策树算法等机器学习算法对数据进行分析建模, 为高剪切混合器的设计与优化提供工具。结果表明: 反向传播神经网络算法和循环神经网络算法都可以准确预测高剪切混合器性能, 但是单个神经网络算法存在过拟合和泛化能力差的问题, 通过将不同机器学习模型融合进一步提高了模型精度和稳定性。基于自动机器学习的PyCaret程序能够准确拟合数据, 但在数据量较小的情况下, 其优化能力较差。

关键词：高剪切混合器机器学习神经网络功耗液-液传质乳化

Forecast of in-line blade-screen high shear mixer's performance based on machine learning

WANG Lingjie¹ , GUO Junheng¹ , LI Wenpeng² , CHENG Qin³ , ZHANG Jinli¹

1. School of Chemical Engineering and Technology, Tianjin University, Tianjin 300072, China;
2. School of Chemical Engineering and Technology, Zhengzhou University, Zhengzhou 450000, China;
3. College of Chemistry & Chemical Engineering, Anhui University, Hefei 230601, China

Abstract: As a novel type of process intensification equipment, high-shear mixers were increasingly widely used in industry, but their design still relies on experimental scaling-up. Data on power, liquid-liquid mass transfer coefficient and emulsification of in-line high-shear mixers with different stator and rotor configurations were collected. And regression fitting analysis on the collected data was performed using machine learning algorithms such as back propagation neural network, recurrent neural network, decision tree, etc., which provided information for the design and optimization of high-shear mixers. The results show that back propagation neural network and recurrent neural network algorithms can predict high-shear mixer's performance precisely and the accuracy of the model can be further improved by fusing different machine learning models. The PyCaret program based on auto machine learning can accurately fit the data. However, its optimization performance is poor when the amount of data is small.

Keywords: high shear mixers machine learning neural networks power liquid-liquid mass transfer emulsification

高剪切混合器作为一种新型的过程强化装备，已广泛应用于化工、食品、制药以及农业领域。高剪切混合器核心部件为定转子，不同的生产过程与操作工况需要采用不同定转子构型及组合方式，这导致高剪切混合器的定转子结构及组合形式复杂多样^[1]。高剪切混合器的结构参数、操作参数与物性参数对其流动、功耗、乳化和传质特性的影响错综复杂，至今仍未形成对上述特性清晰而系统的认识。目前，高剪切混合器的设计、选型、工业放大和操作参数调控仍然主要依赖于工程经验和反复实验，这导致其存在开发与使用成本偏高，放大困难等问题^[2]。因此，急需建立高剪切混合器设计与优化模型。

近些年来，机器学习飞速发展，机器学习建模方法越来越多地应用于模型预测及系统优化。例如，在微波固化材料技术中，由于微波腔内不均匀的电磁场导致物体表面温度不均匀，严重阻碍了固化材料技术的发展；Zhou等利用机器学习卷积神经网络(Neural Network, NN)实现了温度智能控制，使表面温度的均匀性有了明显地提高，解决了温度不均匀的痛点，满足了航空航天材料的高质量要求^[3]。Wu等利用机器学习的迁移学习方法，让计算机从高分子数据库中学习已有数据建立模型，并用实验数据微调机器学习模型，极大改善了因实验数据太少不能使用机器学习的缺点，设计了新型高导热聚酰亚胺，其导热系数比传统的提高了80%^[4]。由于神经网络容易陷入局部极值，孙永利等使用机器学习神经网络和遗传算法结合的方法改善了神经网络容易陷入局部极值的缺点，精确预测了螺旋折流板换热器的壳程换热系数和压降^[5]。李文鹏等使用反向传播神经网络机器学习算法对管线式高剪切反应器建模，减少了实验次数，获得了反应器的最优结构^[6]。

可见基于人工智能和机器学习的建模和优化技术在化工方向发挥越来越重要的作用。然而高剪切混合器设计仅使用了一种机器学习算法，还有多种算法未尝试。因此本工作采用多种机器学习算法对叶片-网孔管线式高剪切混合器的结构参数、操作参数和物性参数对其功耗、液液传质和乳化性能进行建模，以期为叶片-网孔管线式高剪切混合器的设计与优化提供工具。从而减少实验次数，获得高剪切反应器的最优结构，降低成本，缩短开发周期。

1 机器学习算法 1.1 反向传播神经网络算法

反向传播(Back Propagation，BP)神经网络方法，在神经元足够多的情况下，可以在任意精度的情况下，逼近非线性的映射关系^[7]。

BP神经网络是多层的神经网络，含有输入层、隐含层和输出层。前面1层神经元与后1层神经元各个相连接，但是本层神经元互不相连。调整权重和阈值，使用梯度下降法的策略，使预测值与实际值的误差最小。

1.2 循环神经网络算法

循环神经网络(Recurrent Neural Network，RNN)是一种深度学习神经网络^[8]。在神经网络中加入反馈连接层，能够对过去的数据留下印象并且建立不同时间段数据的关系。可认为是同一单元重复构成的链式结构网络，其输出不仅受当前数据的影响而且受以前所有数据的影响。伴随着时间和神经元数量增加，RNN往往会出现梯度消失和爆炸的现象。

长短时记忆(Long Short Term Memory，LSTM)神经网络也是一种神经网络，它是RNN的一种改进模型^[9]。LSTM利用记忆模块代替普通的神经元，一个记忆模块由输入门、遗忘门和输出门构成。由于遗忘门的存在，LSTM可以忘记一些不重要的信息，有效防止梯度的消失和爆炸。

门控循环单元(Gated Recurrent Unit，GRU)神经网络是LSTM的改进版本^[10]。GRU比LSTM少一个门控单元，优化了LSTM内部结构，由于参数的减少，从而大幅提高了训练速度。

1.3 基于树的机器学习算法

决策树(Decision Tree, DT)作为一种机器学习方法，可以进行数据分类和回归^[11]。使用一个基于树的模型，以香农熵的大小为划分依据。因为它的方法非常简单、但却有非常明确的物理含义，可以轻松的变成“如果-那么”的规则，能够生成具有可解释的类似于流程图的树状结构的准确预测模型，从而使用户能够快速提取有用的信息。

极端随机树(Extremely Randomized Trees, ET)由Pierre Geurts等于2006年提出^[12]。通过对多个决策树进行打分，根据各个决策树预测值的平均值来预测。

极端梯度提升(Extreme Gradient Boosting, XGBOOST)由陈天齐博士提出^[13]。内部是决策回归树，能处理大量的数据，自定义损失函数。采用弱分类器迭代计算，从而提高预测精确性。

梯度提升回归树(Gradient Boosting Regressor, GBR)每次迭代生成一个弱学习器用于拟合损失函数以前累积模型的梯度，之后将弱学习器加入累积模型，从而逐渐降低模型的损失^[14]。

2 实验 2.1 PyCaret程序

PyCaret是一个开源的程序，它对计算硬件资源的要求不是很高，8 GB的运行内存就可以运行^[15]；操作系统为Windows 10，程序语言为Python，在Jupyter Notebook软件下运行。PyCaret程序十分方便机器学习初学者使用。

PyCaret具有简洁的、可以方便设置的程序界面，内置25种不同的机器学习算法，仅仅用几行代码就可以完成从数据预处理到实现模型部署的整个流程。它包含了如今很多流行的机器学习算法，如：决策树算法、随机森林算法、支持向量机算法和最近邻算法等。PyCaret可以进行有监督和无监督模型的训练，能够实现分类、回归、异常检测、聚类、自然语言处理和关联规则挖掘6大类功能。

2.2 数据预处理

除PyCaret以外，本研究所有机器学习模型的输入数据均采用归一化的方法[式(1)]，将输入数据变为-1~1的值，将有量纲的数据变为无量纲的数据，变成纯量数据后，更有利于机器学习的训练。输出数据采用对数的方法[式(2)]平滑输出数据，使其更符合高斯分布，也更方便机器学习的训练。最后使用式(3)将式(2)的输出数据变为最终的拟合数据。

$ x_{\max\min }=\frac{2\left(x_{\mathrm{in}}-x_{\min }\right)}{x_{\max }-x_{\min }}-1 $

(1)

式(1)中：x_max为每个特征的最大值，x_min为每个特征的最小值。

$ y_{\text {mid }}=\ln \left(y_{\text {in }}+1\right) $

(2)

$ y_{\text {out }}=e^{y_{\text {mid }}}-1 $

(3)

2.3 数据描述 2.3.1 流体净功耗(P_fluid)数据

流体净功耗数据来自程芹和秦宏云的实验，共有141组数据^{[16, 17]}。输入参数为转子叶片弯曲角度、定转子剪切间隙、转子叶片个数、转子转速、流体流量、流体密度、连续相黏度、分散相黏度、外层直径和层数，输出参数为P_fluid，总计10个输入变量，1个输出变量。表 1为部分流体净功耗数据。

表 1 部分流体净功耗数据 Table 1 Part of P_fluid data

角度/ (°)	间隙/ m	叶片/ 个	转速/ (r·min^-1)	流量/ (m³·h^-1)	密度/ (kg·m³)	连续相黏度/ (mPa·s)	分散相黏度/ (mPa·s)	转子外径/ m	层数/ 层	P_fluid/ W
-15	0.000 5	9	1 000	0.202 0	998	1.2	1.5	0.060	2	6.06
15	0.000 5	6	1 000	0.202 0	998	1.2	1.5	0.060	2	6.61
-15	0.000 5	6	1 000	0.202 0	998	1.2	1.5	0.075	3	10.32
-15	0.000 5	6	2 000	0.202 0	998	1.2	1.5	0.075	3	25.79
-15	0.000 5	6	3 000	0.202 0	998	1.2	1.5	0.075	3	36.36
0	0.000 5	6	3 000	0.202 0	998	1.2	1.5	0.060	2	37.50
-15	0.000 5	6	1 000	0.173 1	1 204	33.7	0	0.060	2	51.33
-15	0.000 5	6	1 500	0.056 4	1 243	260.0	0	0.060	2	160.54
-15	0.000 5	6	2 000	0.312 3	1 241	212.5	0	0.060	2	218.71
-15	0.004 0	6	3 000	0.202 0	998	1.2	1.5	0.060	2	30.78

表选项

2.3.2 液液总体积传质系数(K_La)数据

液液总体积传质系数K_La数据来自秦宏云的实验，共有35组数据^[17]。输入参数为定转子剪切间隙、层数、转子叶片个数、转子叶片弯曲角度、转子转速，输出参数为K_La，总计5个输入变量，1个输出变量。表 2为部分液液K_La数据。

表 2 部分液液K_La数据 Table 2 Part of liquid-liquid K_La data

间隙/ m	层数/ 层	叶片/ 个	转速/ (r·min^-1)	角度/ (°)	K_La/ s^-1
0.004 0	2	6	100 0	-15	0.044 0
0.000 5	2	6	200 0	0	0.081 6
0.000 5	3	6	500	-15	0.040 3
0.004 0	2	6	500	-15	0.025 8
0.004 0	2	6	200 0	-15	0.075 8
0.000 5	2	3	500	-15	0.024 2
0.000 5	2	9	500	-15	0.025 7
0.000 5	2	6	0	15	0.009 5
0.000 5	2	6	100 0	-15	0.048 6
0.000 5	2	6	200 0	15	0.076 1

表选项

2.3.3 液液乳化Sauter平均直径(d₃₂)数据

乳化液滴的d₃₂数据来自秦宏云的实验，共有28组数据^[17]。输入参数为定转子剪切间隙、层数、转子叶片个数、转子转速、转子叶片弯曲角度，输出参数为液滴的d₃₂^[17]。总计5个输入变量，1个输出变量。表 3为部分液液乳化液滴d₃₂数据。

表 3 部分液液乳化液滴d₃₂数据 Table 3 Part of liquid-liquid emulsification droplet d₃₂ data

间隙/ m	层数/ 层	叶片/ 个	转速/ (r·min^-1)	角度/ (°)	液滴d₃₂/ μm
0.000 5	2	9	300 0	-15	10.56
0.000 5	2	6	250 0	0	16.41
0.000 5	3	6	300 0	-15	10.34
0.004 0	2	6	200 0	-15	23.38
0.000 5	2	6	300 0	-15	13.79
0.000 5	2	6	350 0	-15	9.53
0.004 0	2	6	350 0	-15	12.77
0.000 5	2	6	250 0	-15	16.78
0.000 5	3	6	350 0	-15	8.16
0.000 5	2	6	300 0	15	12.18

表选项

3 结果与讨论 3.1 流体净功耗模型 3.1.1 流体净功耗GRU-BP模型

GRU-BP神经网络是在算法层面对2个网络的结合。将GRU层的输出作为BP神经网络的输入层，接着是BPNN的隐含层，最后是输出层。

$ y=\frac{1}{1+\mathrm{e}^{-x}} $

(4)

$ z_{\mathrm{t}}=\sigma\left(W_{\mathrm{x}} x_{\mathrm{t}}+U_{\mathrm{z}} h_{\mathrm{t}-1}\right) $

(5)

$ r_{\mathrm{t}}=\sigma\left(W_{\mathrm{r}} x_{\mathrm{t}}+U_{\mathrm{r}} h_{\mathrm{t}-1}\right) $

(6)

$ \tilde{h}_{\mathrm{t}}=\tan h\left(W_{\mathrm{h}} x_{\mathrm{t}}+r_{\mathrm{t}} U_{\mathrm{h}} h_{\mathrm{t}-1}\right) $

(7)

$ h_{\mathrm{t}}=z_{\mathrm{t}} h_{\mathrm{t}-1}+\left(1-z_{\mathrm{t}}\right) \tilde{h}_{\mathrm{t}} $

(8)

图 1是GRU单元内部结构，式(4)是sigmoid激活函数。式(5)中z_t为更新门，σ为sigmoid激活函数，x_t表示t时刻输入，h_t-1表示上一隐藏节点输出；式(6)中r_t为重置门；式(7)中${\tilde h_{\rm{t}}}$为隐藏节点待选值，tanh为双曲正切函数；式(8)中h_t为t时刻隐藏节点的输出，W_z、W_r、W_h、U_z、U_r和U_h为需要更新的参数。

图 1 GRU单元结构 Fig.1 The structure of GRU unit

图选项

将叶片-网孔管线式高剪切混合器流体净功耗的141组数据中的119组数据为训练集，22组数据为测试集。训练时使用式(2)和式(3)对输出数据进行数据变换。使用GRU-BP模型Adam算法训练数据，得到输入层10个神经元，1层深度为2的GRU单元后接3个神经元的全连接层，全连接层使用sigmoid函数激活，输出层为1个神经元的GRU-BP模型(图 2)。式(9)~式(11)为评价模型平均绝对误差(MAE)、平均相对误差(MRE)和决定系数(R²)。模型训练后的MAE、MRE、R²如表 4所示。图 3为GRU-BP模型预测值与实验值的对比，最大相对误差为24.94%。

$ {\rm{MAE}} = \frac{1}{M}\sum\limits_{e = 1}^M {\left| {{Y_{{\rm{sim}}, e}} - {Y_{{\rm{rea}}, {\rm{e}}}}} \right|} $

(9)

$ {\rm{MRE}} = \frac{{100\% }}{{M \cdot {Y_{{\rm{rea}}, {\rm{e}}}}}}\sum\limits_{e = 1}^M {\left| {{Y_{{\rm{sim}}, {\rm{e}}}} - {Y_{{\rm{rea}}, {\rm{e}}}}} \right|} $

(10)

$ {R^2} = 1 - \frac{{\sum\nolimits_1^M {{{\left( {{Y_{{\rm{sim}}, {\rm{e}}}} - {Y_{{\rm{rea}}, {\rm{e}}}}} \right)}^2}} }}{{\sum\nolimits_1^M {{{\left( {{Y_{rea, {\rm{e}}}} - {Y_{{\rm{rea}}}}} \right)}^2}} }} $

(11)

图 2 经过优化的GRU-BP结构 Fig.2 Optimized structure of the GRU-BP model

图选项

表 4 叶片网孔型流体净功耗GRU-BP模型表现 Table 4 The performance of blade screen P_fluid GRU-BP model

数据集	MAE	MRE/%	R²
GRU-BP训练集	2.381 1	2.60	0.998 7
GRU-BP测试集	2.347 4	4.89	0.999 2

表选项

图 3 GRU-BP模型预测P_fluid值和实验结果对比 Fig.3 Comparison of predicted P_fluid value and experimental value with GRU-BP model

图选项

式(9)~式(11)中：Y_sim为预测值，Y_rea为实验值。

3.1.2 流体净功耗树模型

使用PyCaret程序默认设置对流体净功耗数据进行拟合，在141组数据中119组数据为训练集，22组数据为测试集。输入数据和输出数据均不作任何数据变换。在PyCaret程序创建的25种常用的机器学习模型中，选出MAE较小的3个模型，按照MAE从小到大排列与GRU-BP模型比较，模型的MAE、MRE和R²如表 5所示。从表 5可以看到，经过PyCaret优化的ET模型不仅其MRE为1.48%小于GRU-BP模型的2.96%，而且其MAE为1.111 9也小于GRU-BP模型的2.375 8。由此可见，自动机器学习模型对于仅有少数机器学习背景的科研人员和工程师还是非常有用的，可以用于大数据量的建模与预测。

表 5 4种不同P_fluid模型比较 Table 5 Comparison of 4 different P_fluid models

模型简称	MAE	MRE/%	R²
ET	1.111 9	1.48	0.998 7
GBR	1.143 1	4.99	0.998 7
XGBOOST	2.324 1	1.65	0.998 6
GRU-BP	2.375 8	2.96	0.998 7

表选项

3.2 液液总体积传质系数K_La模型 3.2.1 K_La的RNN、BP模型

将叶片-网孔管线式高剪切混合器的液液总体积传质系数K_La共计35组数据，分为28组训练数据和7组测试数据；使用BP算法，激活函数为sigmoid函数，在输入层、隐含层和输出层之间进行数据传输。最终得到了输入层5个神经元、隐含层3个神经元、输出层1个神经元的5-3-1网络结构的BP₁模型。模型训练后的MAE、MRE、R²如表 6所示，模型在所有数据集上的最大相对误差为19.74%。

表 6 叶片网孔型K_La模型表现 Table 6 The performance of blade screen K_La model

数据集	MAE	MRE/%	R²
BP₁训练集	0.002 4	6.34	0.982 6
BP₁测试集	0.003 5	7.18	0.971 0
RNN₁训练集	0.002 8	6.40	0.980 1
RNN₁测试集	0.003 9	9.94	0.978 3

表选项

使用和BP₁模型同样的训练集和测试集，采用RNN模型Adam算法训练数据，得到输入层5个神经元，1层RNN单元，RNN单元的深度为3，输出层1个神经元的RNN₁模型。模型训练后的MAE、MRE、R²如表 6所示，模型在所有数据集上的最大相对误差为19.70%。

使用模型融合方法，将不同模型的输出乘以权重值加和后作为融合模型的输出，可以减轻神经网络容易过拟合，泛化能力差的问题。不同融合模型的预测精度如图 4所示。图 4中除BP₁、RNN₁外，其余模型名称的命名规则与MK55相同；MK55中的M是Model的简写，K是K_La的简写，第1个5表示BP₁模型的权重为0.5、第2个5表示RNN₁模型的权重为0.5。从图 4中可以看出，MK55模型有最小的平均相对误差，其平均相对误差为6.36%；因此，选取MK55作为叶片-网孔管线式高剪切混合器K_La的最终预测模型[式(12)]。图 5为MK55模型预测不同结构参数和操作参数对K_La的影响，图 5中的圆球形表示的是实验数据。由图 5知，K_La随着转子叶片个数先增大后减小；随着转子叶片弯曲角度增大而减小；低转速下，层数增加，K_La增加。改变高剪切混合器的结构参数和操作参数，可以形成107 632个组合，在此范围内利用MK55模型进行参数寻优，发现：定转子剪切间隙为0.000 5 m、转子层数为2层、转子有6个叶片、转子叶片弯曲角度为-15°、转子转速为3 000 r·min^-1时，可以获得最高的K_La值；此条件下，经GRU-BP模型预测的流体净功耗为35.02 W。

$ {\rm{MK55 = 0}}{\rm{.5}} \times {\rm{B}}{{\rm{P}}_1} + 0.5 \times {\rm{RN}}{{\rm{N}}_1} $

(12)

图 4 不同K_La模型表现 Fig.4 The performance of different K_La models

图选项

图 5 MK55模型估算不同结构参数和转速时叶片网孔K_La的值 Fig.5 The blade screen K_La MK55 model to estimate values of different configuration parameters and speeds

图选项

3.2.2 K_La的树模型

使用PyCaret程序默认设置对总体积传质系数35组数据进行拟合，在35组数据中28组数据为训练集，7组数据为测试集。输入数据和输出数据均不作任何数据变换。在PyCaret程序创建的25种常用的机器学习模型中，选取2个MAE较小的模型与MK55模型比较，模型的MAE、MRE和R²如表 7所示。表 7的DT模型和ET模型对高剪切混合器性能的拟合均优于MK55模型。

表 7 3种不同K_La模型比较 Table 7 Comparison of 3 different K_La models

模型简称	MAE	MRE/%	R²
DT	0.000 590	1.58	0.996 3
ET	0.000 757	1.83	0.992 1
MK55	0.002 739	6.36	0.980 1

表选项

图 6是表 7决策树模型DT估算不同剪切间隙和转速时K_La值的变化情况。通过图 5与图 6比较，MK55模型输出值是平滑的，决策树模型输出值是阶跃的。因此，虽然决策树的MRE和MAE都优于MK55模型，但在数据量较小的情况下，决策树模型由于其输出不能平滑变化，不能对高剪切混合器进行较好地优化。

图 6 决策树模型估算不同剪切间隙和转速时叶片网孔K_La的值 Fig.6 The blade screen K_La decision tree model to estimate values of different shear gaps and speeds

图选项

3.3 乳化液滴d₃₂模型

将叶片-网孔管线式高剪切混合器的乳化液滴d₃₂共计28组数据分为23组训练数据和5组测试数据，使用BP模型Adam算法训练数据，得到5-2-1网络结构的BP₂模型。模型训练后的MAE、MRE、R²如表 8所示，模型在所有数据集上的最大相对误差为10.34%。

表 8 叶片网孔型d₃₂模型表现 Table 8 The performance of blade screen d₃₂ model

数据集	MAE	MRE/%	R²
BP₂训练集	0.289 2	1.98	0.992 7
BP₂测试集	0.699 9	5.53	0.980 3
RNN₂训练集	0.663 3	4.42	0.963 5
RNN₂测试集	0.569 7	4.56	0.985 4

表选项

使用和BP₂模型同样的训练集和测试集，使用RNN模型Adam算法训练数据，得到输入层5个神经元，1层RNN单元，RNN单元的深度为1，输出层1个神经元的RNN₂模型。模型训练后的MAE、MRE、R²如表 8所示，模型在所有数据集上的最大相对误差为12.10%。

图 7是不同乳化液滴d₃₂模型的比较，除BP₂、RNN₂外，其余模型的命名规则与MD91相同；MD91模型名称的命名规则为：M代表Model、D代表d₃₂，9表示BP₂模型的权重为0.9，1表示RNN₂模型的权重为0.1。

图 7 不同叶片网孔d₃₂模型表现 Fig.7 The performance of different blade screen d₃₂ models

图选项

从图 7中可以看出，各个模型MRE变化相对于其最大相对误差变化比较小，MD91模型有最小的平均相对误差，其平均相对误差为2.69%；因此，选取MD91作为乳化液滴d₃₂的最终预测模型(式13)。改变高剪切混合器的结构参数和操作参数，可以形成55 552个组合，在此范围内利用MD91模型进行参数寻优，发现：定转子剪切间隙为0.000 5 m，转子层数为3层，转子有9个叶片，转子叶片弯曲角度为15°，在转速3 500 r·min^-1下，可以获得最小的d₃₂。在此条件下，经GRU-BP模型预测的流体净功耗为57.26 W。

$ {\rm{MD}}91 = 0.9 \times {\rm{B}}{{\rm{P}}_2} + 0.1 \times {\rm{RN}}{{\rm{N}}_2} $

(13)

4 结论

1) BPNN、RNN、GRU-BP算法可以准确预测高剪切混合器的功耗、液液传质和乳化性能，通过对不同机器学习模型进行融合，可以使预测模型的最大相对误差继续下降，模型精度进一步提升。经过模型融合液液K_La模型最大相对误差由19.74%下降至19.53%，平均相对误差由7.11%下降至6.36%。乳化液滴d₃₂模型最大相对误差由12.10%下降至10.00%，平均相对误差由4.44%下降至2.69%。从而为高剪切混合器的结构与操作参数设计提供工具。

2) 为了获得最适宜的液液传质和乳化性能，利用机器学习模型对高剪切混合器的操作与结构参数进行了优化设计。最适宜参数组合为：定转子剪切间隙为0.000 5 m，转子层数为2层，转子叶片数为6个，转子叶片弯曲角度为-15°，转子转速为3 000 r·min^-1时，可以获得最高的K_La值；定转子剪切间隙为0.000 5 m，转子层数为3层，转子叶片数为9个，转子叶片弯曲角度为15°，转子转速为3 500 r·min^-1时，可以获得最小的乳化液滴d₃₂。

3) 基于自动机器学习的PyCaret程序能够准确拟合数据，但在数据量较小的情况下，其优化能力较差。

参考文献

[1]	ZHANG J, XU S, LI W. High shear mixers: A review of typical applications and studies on power draw, flow pattern, energy dissipation and transfer properties[J]. Chemical Engineering and Processing: Process Intensification, 2012, 57/58: 25-41. DOI:10.1016/j.cep.2012.04.004

[2]	QIN H, ZHANG C, XU Q, et al. Geometrical improvement of inline high shear mixers to intensify micromixing performance[J]. Chemical Engineering Journal, 2017, 319: 307-320. DOI:10.1016/j.cej.2017.02.150

[3]	ZHOU J, LI Y, LI D, et al. Online learning based intelligent temperature control during polymer composites microwave curing process[J]. Chemical Engineering Journal, 2019, 370: 455-465. DOI:10.1016/j.cej.2019.03.204

[4]	WU S, KONDO Y, KAKIMOTO M A, et al. Machine-learning-assisted discovery of polymers with high thermal conductivity using a molecular design algorithm[J]. Npj Computational Materials, 2019. DOI:10.1038/s41524-019-0203-2

[5]	孙永利, 王华金, 郝丽, 等. 基于神经网络和遗传算法的螺旋折流板换热器性能预测[J]. 化学工业与工程, 2016, 33(4): 49-55. SUN Yongli, WANG Huajin, HAO Li, et al. Performance prediction of shell-and-tube heat exchangers with helical baffles using multilayer perception neural networks optimized with genetic algorithm[J]. Chemical Industry and Engineering, 2016, 33(4): 49-55. (in Chinese)

[6]	LI W, XIA F, ZHAO S, et al. Mixing performance of an inline high-shear mixer with a novel pore-array liquid distributor[J]. Industrial & Engineering Chemistry Research, 2019, 58(44): 20213-20225.

[7]	REN C, AN N, WANG J, et al. Optimal parameters selection for BP neural network based on particle swarm optimization: A case study of wind speed forecasting[J]. Knowledge-Based Systems, 2014, 56: 226-239. DOI:10.1016/j.knosys.2013.11.015

[8]	SONG J, GUO Y, GAO L, et al. From deterministic to generative: Multimodal stochastic RNNs for video captioning[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019, 30(10): 3047-3058. DOI:10.1109/TNNLS.2018.2851077

[9]	YUAN X, LI L, WANG Y. Nonlinear dynamic soft sensor modeling with supervised long short-term memory network[J]. IEEE Transactions on Industrial Informatics, 2020, 16(5): 3168-3176. DOI:10.1109/TII.2019.2902129

[10]	CHE Z, PURUSHOTHAM S, CHO K, et al. Recurrent neural networks for multivariate time series with missing values[J]. Scientific Reports, 2018. DOI:10.1038/s41598-018-24271-9

[11]	YU Z, HAGHIGHAT F, FUNG B C M, et al. A decision tree method for building energy demand modeling[J]. Energy and Buildings, 2010, 42(10): 1637-1646. DOI:10.1016/j.enbuild.2010.04.006

[12]	GEURTS P, ERNST D, WEHENKEL L. Extremely randomized trees[J]. Machine Learning, 2006, 63(1): 3-42. DOI:10.1007/s10994-006-6226-1

[13]	CHEN T, GUESTRIN C. XGBoost: A scalable tree boosting system[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2016

[14]	FRIEDMAN J H. Stochastic gradient boosting[J]. Computational Statistics & Data Analysis, 2002, 38(4): 367-378.

[15]	PyCaret. org. PyCaret[EB/OL]. https://pycaret.org/about. PyCaret version 1.0.0, 2020-04-30

[16]	CHENG Q, XU S, SHI J, et al. Pump capacity and power consumption of two commercial in-line high shear mixers[J]. Industrial & Engineering Chemistry Research, 2013, 52(1): 525-537.

[17]	秦宏云. 管线型高剪切混合器的几何构型优化[D]. 天津: 天津大学, 2018