广义乘子法求解构造变分问题的神经网络方法

欧阳晔; 江巍; 吴怡; 冯强; 郑宏

doi:10.6052/j.issn.1000-4750.2022.05.0488

广义乘子法求解构造变分问题的神经网络方法

欧阳晔^{1, 2,},
江巍^{1, 2, ,},
吴怡^{1, 2,},
冯强^{1, 2,},
郑宏^{1, 2, 3,}

1.
三峡库区地质灾害教育部重点实验室，湖北，宜昌 443002
2.
三峡大学土木与建筑学院，湖北，宜昌 443002
3.
北京工业大学建筑工程学院，北京 100124

基金项目: 国家自然科学基金项目(52079070)；三峡库区地质灾害教育部重点实验室开放基金项目(2020KDZ10)

详细信息

作者简介:
欧阳晔(1996−)，男，湖北武汉人，硕士生，主要从事土木工程物理数学模拟方法研究(E-mail: ouyangye123@qq.com)

吴　怡(1999−)，男，吉林长春人，硕士生，主要从事土木工程物理数学模拟方法研究(E-mail: 1743036363@qq.com)

冯　强(1979−)，男，湖北麻城人，副教授，博士，硕导，主要从事土木工程物理数学模拟方法研究(E-mail: qiangf2000@163.com)

郑　宏(1964−)，男，湖北南漳人，教授，博士，博导，主要从事土木工程物理数学模拟方法研究(E-mail: hzheng@whrsm.ac.cn)

通讯作者:
江　巍(1981−)，男，湖北松滋人，教授，博士，博导，主要从事土木工程物理数学模拟方法研究(E-mail: jiangweilion@163.com)

中图分类号: O34
计量
- 文章访问数: 236
- HTML全文浏览量: 64
- PDF下载量: 56
出版历程
- 收稿日期: 2022-05-28
- 修回日期: 2022-10-06
- 网络出版日期: 2022-10-28
- 刊出日期: 2023-11-05

NEURAL NETWORK METHOD FOR CONSTRUCTIVE VARIATIONAL PROBLEMS BY GENERALIZED MULTIPLIER METHOD

OUYANG Ye^{1, 2,},
JIANG Wei^{1, 2, ,},
WU Yi^{1, 2,},
FENG Qiang^{1, 2,},
ZHENG Hong^{1, 2, 3,}

1.
Key Laboratory of Geological Hazards on Three Gorges Reservoir Area, Ministry of Education, Yichang, Hubei 443002, China
2.
College of Civil Engineering and Architecture, China Three Gorges University, Yichang, Hubei 443002, China
3.
College of Architecture and Civil Engineering, Beijing University of Technology, Beijing 100124, China

摘要

摘要: 边界条件的施加是求解偏微分方程定解问题的重要步骤。神经网络方法求解偏微分方程定解问题时，将原问题转化为对应的构造变分问题后，损失函数是包含控制方程与边界条件的泛函。采用经典罚函数法及其改进方法施加边界条件时，罚因子的取值直接影响计算精度和求解效率；直接采用Lagrange乘子法施加边界条件，计算结果可能偏离原问题最优解。为破解此局限性，使用广义乘子法施加边界条件。基于神经网络获得原问题的预测解，再使用广义乘子法构建神经网络的损失函数并计算损失值，利用梯度下降法进行参数寻优，判断损失值是否满足要求；不满足则更新罚因子与乘子后再进行求解直至损失满足要求。数值算例的计算结果表明：与采用经典罚函数法、L₁精确罚函数法和Lagrange乘子法施加边界条件构造的神经网络相比，该文提出的方法具有更好的数值精度和更高的求解效率，且求解过程更加稳定。
- 神经网络 /
- 偏微分方程 /
- 广义乘子法 /
- 边界条件 /
- 物理信息神经网络
Abstract: The imposition of boundary conditions is an essential step in solving the definite problem of partial differential equations. When the definite problem of partial differential equations is resolved by neural network, the original problem should be transformed to its corresponding constructive variational problem, and the loss function is a functional consisting of the governing equations and the boundary conditions. If the boundary conditions are imposed by the classical penalty function method and its improvements, the value of the penalty factor will affect the solution accuracy and the computational efficiency. If the boundary conditions are directly imposed by the Lagrange multiplier method, the computational results may deviate from the optimal solution of the original problem. To overcome these limitations, the generalized multiplier method is employed in the imposition of boundary conditions. The predicted solution of the original problem is obtained from the neural network. The generalized multiplier method is used to construct the loss function of the neural network and calculate the loss. The gradient descent method is utilized to perform parameter optimization. Afterwards, the loss function is calculated. The penalty factor and multiplier are updated, and the resolution is repeated till the loss is acceptable. The results of numerical examples verify that the proposed method has better solution accuracy, higher computational efficiency and more stable solution process than those neural networks in which the boundary conditions are applied by the classical penalty function method, L₁ exact penalty function method, and Lagrange multiplier method.
- neural networks /
- partial differential equations /
- generalized multiplier method /
- boundary conditions /
- physics informed neutral network

HTML全文

在工程领域，力学问题的数学模型往往都是以微分方程的形式提出的，微分方程与初边值条件一起构成了微分方程的定解问题^[1]。求解偏微分方程的途径可分为解析法与数值解法两大类。解析法适用于形状规则的简单问题，以逆解法、半逆解法为代表。实际问题的边界条件往往比较复杂，解析法求解困难，于是发展出了以有限差分法、有限单元法等为代表的数值解法，这些算法的求解效果严重依赖事先剖分的网格。此外，有限差分法在不同的方程上需使用不同的差分格式；有限单元法针对不同的问题需选取不同的单元类型，这些局限性大大影响了其应用范围^[2]。

神经网络算法的飞速发展^[3]和Tensorflow^[4]、Pytorch^[4-5]等深度神经网络框架的发布，使得近年来神经网络的应用研究呈现井喷式发展，如叶继红和杨振宇^[6]采用生成式对抗神经网络生成的风场数据与目标数据之间具有相同的特性；许泽坤和陈隽^[7]利用神经网络准确预测了地震作用下框架结构的非线性结构响应；程诗焱等^[8]基于BP神经网络提出的地震易损性曲面分析方法，利用该方法可以得到可信的损伤概率结果；赵林鑫等^[9]将比例边界有限元法与神经网络相结合，建立适用于薄板结构裂纹状缺陷识别的反演模型；郑秋怡等^[10]建立了基于长短时记忆神经网络的大跨拱桥温度-位移相关模型，可准确描述多元温度与位移的非线性映射关系。为克服传统数值解法求解偏微分方程时的局限性，国内外学者尝试将神经网络引入偏微分方程的求解，深度Ritz法^[11]、深度伽辽金法^[12]、深度能量法^[13]等相继被提出，并取得了初步成功应用。RAISSI等^[14-15]提出的物理信息神经网络(Physics Informed Neural Networks, PINN)，将原问题的物理信息嵌入到神经网络中，通过训练神经网络获得近似解；LU等^[16]提出了一种改善PINN训练效率的自适应细化算法，并开发了DeepXDE求解器；郭宏伟和庄晓莹^[17]提出了一种使用Adam与LBFGS两种优化器训练神经网络的策略，克服了传统神经网络训练的结果易陷入局部最优解的问题；黄钟民等^[18]发展了一种耦合神经网络方法用于求解面内变刚度薄板的位移与挠度；唐明健和唐和生^[19]使用神经网络求解了矩形薄板的力学正反问题；HE等^[20]从逼近论的角度证明了使用ReLU激活函数的神经网络与有限元是等价的。

上述研究中，边界条件的施加与传统有限元略有不同。现有研究中神经网络的损失函数是一个包含控制方程与边界条件的泛函，通常使用经典罚函数法进行构造，将原约束优化问题转化为无约束优化问题，如郭宏伟等^[17]、黄钟民等^{[18, 21]}。理论上罚函数法中罚因子的数值应为一个无穷大的数^[22]，在实际计算中，罚因子取得过大会造成方程的病态导致无法求解，取得过小则无法起到惩罚的作用，其值不易把控。以L₁精确罚函数法^[23]为代表的改进方法，可有效克服经典罚函数法中罚因子需趋近于无穷的局限，并在非线性规划问题的神经网络求解中取得成功应用^[24-25]，罚因子的具体取值仍依赖于人为确定。

Lagrange乘子法^[26]也可将约束优化问题转化为无约束优化问题，但采用Lagrange乘子法构建的神经网络同样存在一定不足。当神经网络损失函数对应的Lagrange函数在平衡点处其Hessian矩阵为非正定矩阵时，该平衡点将偏离原问题的最优解^[24]。理论上，广义乘子法可克服Lagrange乘子法的这一局限^[22]。鉴于此，针对边界条件复杂的偏微分方程组，本文提出一种采用广义乘子法施加边界条件的神经网络方法。该方法首先通过神经网络获得预测解，再使用广义乘子法构建损失函数并计算损失值，最后利用梯度下降法进行参数寻优，判断损失值是否满足要求；若不满足，则更新罚因子与乘子后再进行求解，直至损失满足要求。为验证新方法的求解精度和计算效率，本文求解了Kirchhoff薄板和简支梁问题，并与使用经典罚函数法、L₁精确罚函数法、Lagrange乘子法施加边界条件的神经网络求解进行比较。此外，采用不同拓扑结构的神经网络和域内配点求解Kirchhoff薄板问题，探讨了神经网络拓扑结构与域内配点数对新方法求解精度的影响。

1 微分方程及其泛函

工程技术领域，许多自然规律是以偏微分方程(组)的形式提出的，常见的偏微分方程分为三大类：椭圆型方程、抛物型方程、双曲型方程，上述方程的共同点在于方程内部包含待求解的未知场量及其导数，即：

${\boldsymbol{A}}({\boldsymbol{u}})=\left(\begin{array}{c}{A}_{1}({\boldsymbol{u}})\\ {A}_{2}({\boldsymbol{u}})\\ {A}_{3}({\boldsymbol{u}})\\ \cdot \\[-8pt] \cdot\\[-8pt] \cdot \end{array}\right)={\boldsymbol{0}}\;\;,\;在\varOmega 内$

(1)

式中：A为偏微分方程组；u为物理量；Ω为问题求解区域。静态场问题边值条件通常分为三类：第一类条件为指定未知场量在边界上的值；第二类条件为指定未知场量在边界外法线方向上的值；第三类条件为上述两类边界条件的线性组合，即：

${\boldsymbol{B}}({\boldsymbol{u}})=\left(\begin{array}{c}{B}_{1}({\boldsymbol{u}})\\ {B}_{2}({\boldsymbol{u}})\\ {B}_{3}({\boldsymbol{u}})\\ \cdot \\[-8pt] \cdot\\[-8pt] \cdot \end{array}\right)={\boldsymbol{0}}\;\;,\;在\varGamma 上$

(2)

式中：B为边界条件组；Γ为求解区域的边界。

式(1)所示的控制方程与式(2)所示的边值条件一起构成了微分方程的定解问题。通常来说，微分方程对解的要求较高，若直接对微分方程进行求解较为困难，因此常使用加权余量法获得微分方程的等效积分弱形式，弱形式会降低对解的要求。对满足线性、自伴随的微分方程而言，采用伽辽金加权余量法所获得的等效积分弱形式与使用自然变分原理获得的泛函是相同的，弱形式将具备明确的物理意义，例如，弹性力学中平衡微分方程的等效积分弱形式就是虚功方程。对不满足线性、自伴随的微分方程而言，需使用构造变分原理来获得泛函，使用罚函数法构造的泛函表达式如下：

${\prod\nolimits_{\rm{p}}}{\text{ = }}\int_\varOmega {{{\boldsymbol{v}}^{{\rm{T}}} }} {\boldsymbol{A}}({\boldsymbol{u}}){\rm{d}}\varOmega + M\int_\varGamma {{\boldsymbol {B}^{{\rm{T}}} }({\boldsymbol{u}})} {\boldsymbol {B}}({\boldsymbol{u}}){\rm{d}}\varGamma$

(3)

式中：v为一组与A(u)方程个数相同的任意函数；M为罚因子，是一个标量。

2 神经网络方法

2.1 神经网络基本原理

神经网络是一个由权重w、偏置b、激活函数σ等定义的非线性函数，神经网络的输入x，输出为u(x)，其前向传播可表达为：

${\boldsymbol{u}}({\boldsymbol{x}}) = {{\boldsymbol{F}}_l}({\boldsymbol{\sigma }}({{\boldsymbol{F}}_{l - 1}}( \cdots {\boldsymbol{\sigma }}({{\boldsymbol{F}}_1}({\boldsymbol{x}})) \cdots )))$

(4)

式中，下标l表示神经网络的层数，F_l(l=1, 2, 3, … , l)为第l层的映射规则，定义为：

${{\boldsymbol{F}}_l} = {{\boldsymbol{x}}_l}{{\boldsymbol{w}}_l} + {{\boldsymbol{b}}_l}$

(5)

初始状态下，神经网络中参数θ={w;b}是随机生成的，不能满足实际要求，需进行参数更新，现阶段常使用BP算法进行参数更新。

万能近似定理^[20]指出，神经网络具有逼近任意复杂非线性函数的能力。神经网络具有强大非线性函数拟合能力的关键在于其激活函数是非线性的。现有研究中常使用ReLU函数和Tanh函数两种激活函数。ReLU函数^[27]的表达式为：

$\sigma (x){\text{ = }}\max (0,x)$

(6)

该函数及其导数图形如图1(a)和图1(c)所示。ReLU函数形式简单、计算成本低，可避免出现梯度消失现象。Tanh函数具有C^∞性质，其表达式为：

$\sigma (x){\text{ = }}\frac{{{{\rm{e}}^x} - {{\rm{e}}^{ - x}}}}{{{{\rm{e}}^x} + {{\rm{e}}^{ - x}}}}$

(7)

图 1 两种常用的神经网络激活函数及其导数

Figure 1. Two widely used activation function in neural network and their derivatives

下载: 全尺寸图片幻灯片

当式(3)涉及未知场量的高阶导数时，Tanh函数更为适用，因此在目前神经网络求解力学问题中广泛使用^[17-18]，该函数及其导数图形如图1(b)、图1(d)和图1(e)所示，本文采用Tanh函数为激活函数。

2.2 深度配点法

深度配点法是由RAISSI等^[14-15]提出的一种由物理信息驱动的神经网络模型。根据万能近似定理，偏微分方程组的解u可使用神经网络来逼近。对于深度配点法，需首先在求解域内布置一系列的散点x_Ω，另外边界上也需布置一系列的散点x_Γ。图2给出了一矩形区域的配点示意，点★代表x_Ω，点●代表x_Γ，散点x={x_Ω; x_Γ}构成了神经网络的训练数据。

图 2 配点示意图

Figure 2. Schematic diagram of collocation points

下载: 全尺寸图片幻灯片

从偏微分方程出发构建如所示的物理信息网络。左边的神经网络作为偏微分方程的近似解，输入为散点坐标，输出 $\widehat{\boldsymbol{u}}$ (x;θ)由式(4)计算。右边的物理信息则是将近似解 $\widehat{\boldsymbol{u}}$ 带入控制方程与边界条件中所产生的余量。

图 3 物理信息网络示意图

Figure 3. Diagram of Physics Informed Neutral Network

下载: 全尺寸图片幻灯片

深度配点法一般采用经典罚函数法施加边界条件，建立的神经网络损失函数表达式为：

$\begin{split} {\rm loss} = &\frac{1}{{{N_{\boldsymbol{A}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{A}}}} {\frac{1}{{{P_\varOmega }}}\sum\nolimits_{j{\text{ = 1}}}^{{P_\varOmega }} {{{({A_i}({x_j};{\boldsymbol{\theta }}))}^2}} } + \\ & \frac{M}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {{{({B_i}({x_j};{\boldsymbol{\theta }}))}^2}} } \end{split}$

(8)

式中：N_A、N_B分别为微分方程与边界条件方程的个数； ${P}_{\varOmega }、{P}_{{{\varGamma }}_{i}}$ 分别为域内、相应边界上的配点数；M为罚因子；其中A(x;θ)与B(x;θ)共享同一套超参数θ，并且都是坐标的函数。当loss取得最小值时， $\widehat{\boldsymbol{u}}$ (x;θ)就是偏微分方程的近似解。

将经典罚函数法替换为L₁精确罚函数法，则神经网络损失函数的表达式变化为：

$\begin{split} {\rm loss} =& \frac{1}{{{N_{\boldsymbol{A}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{A}}}} {\frac{1}{{{P_\varOmega }}}\sum\nolimits_{j{\text{ = 1}}}^{{P_\varOmega }} {{{({A_i}({x_j};{\boldsymbol{\theta }}))}^2}} } +\\ & \frac{M}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {|{B_i}({x_j};{\boldsymbol{\theta }})|} } \end{split}$

(9)

式中，|•|为绝对值。

如果使用Lagrange乘子法施加边界条件，建立的神经网络损失函数为：

$\begin{split} {\rm loss} =& \nabla \Bigg(\frac{1}{{{N_{\boldsymbol{A}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{A}}}} {\frac{1}{{{P_\varOmega }}}\sum\nolimits_{j{\text{ = 1}}}^{{P_\varOmega }} {{{{\text{(}}{A_i}({x_j};{\boldsymbol{\theta }}){\text{)}}}^2}} } + \\ & \frac{{\text{1}}}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{{{k_i}}}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {{B_i}({x_j};{\boldsymbol{\theta }})} } \Bigg) \end{split}$

(10)

式中，k_i为Lagrange乘子。

2.3 采用广义乘子法施加边界条件的深度配点法

如引言中所述，使用经典罚函数法、L₁精确罚函数法、Lagrange乘子法施加边界条件的神经网络在求解时均存在一定的局限性。广义乘子法^[20]结合了罚函数与Lagrange乘子法的优点，使得罚因子在适当大的情况下也能求得原约束问题的解。因此，本文将广义乘子法引入神经网络之中，提出一种基于广义乘子法施加边界条件的神经网络方法。该方法左边的神经网络仍由式(4)计算，右边的物理信息则基于广义乘子法构建，最终建立的神经网络损失函数表达式为：

$\begin{split} {\rm loss}{\text{ = }}&\frac{1}{{{N_{\boldsymbol{A}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{A}}}} {\frac{1}{{{P_\varOmega }}}\sum\nolimits_{j{\text{ = 1}}}^{{P_\varOmega }} {{{({A_i}({x_j};{\boldsymbol{\theta }}))}^2}} } + \\ & \frac{M}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {{{({B_i}({x_j};{\boldsymbol{\theta }}))}^2}} } - \\ & \frac{{\text{1}}}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{{{k_i}}}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {{B_i}({x_j};{\boldsymbol{\theta }})} } \end{split}$

(11)

式中：M为罚因子；k_i为相应边界方程对应的乘子，当loss取得最小值时， $\widehat{\boldsymbol{u}}$ (x;θ)就是偏微分方程的近似解。使用梯度下降法训练参数θ，从而使得loss取得最小值，具体做法如下：

S1在求解域内与边界上布置一系列的配点；

S2利用广义Lagrange乘子法将约束问题转化无约束的待优化函数，得到式(11)；

S3构建前馈神经网络，并将其作为试函数；

S4给定初始值θ ⁰，初始乘子 ${k}_{i}^{0}$ ，初始罚因子M ⁰，放大系数α>1，误差阈值ε，参数γ∈(0,1)。这里，各量的上标代表迭代次数；

S5问题求解：以θ ⁿ⁻¹为起始点，利用梯度下降法求解当前乘子、罚因子下的最优解θ ⁿ，具体做法为：

① 计算损失函数loss的值，判断损失函数的值是否达到精度要求；若达到要求，则进入S6，若未达到要求，则进入②。

② 将损失标量loss对神经网络参数θ求偏导，并更新神经网络参数，其更新公式为：

$\Delta {{\boldsymbol{\theta }}^{n - 1}} = - \eta \frac{{\partial {\rm loss}}}{{\partial {{\boldsymbol{\theta }}^{n - 1}}}},{{\boldsymbol{\theta }}^{n - 1}} + \Delta {{\boldsymbol{\theta }}^{n - 1}} \to {{\boldsymbol{\theta }}^n}$

(12)

式中：Δθ ⁿ⁻¹为θ ⁿ⁻¹的更新量；η为神经网络学习率。参数更新完毕后进入①。

S6判断迭代终止条件：根据下式计算边界上的误差h(θ ⁿ)，若h(θ ⁿ)<ε成立，则停止迭代并输出θ ⁿ；否则，进入步骤S7；

$h({{\boldsymbol{\theta }}^n}) = \frac{1}{{{N_{\boldsymbol{B}}}}}\sum\nolimits_{i = 1}^{{N_{\boldsymbol{B}}}} {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{\text{ = 1}}}^{{P_{{\varGamma _i}}}} {\text{|}} {B_i}({x_j};{{\boldsymbol{\theta }}^n}){\text{|}}}$

(13)

S7更新罚因子：若 $\dfrac{{h(\boldsymbol{\theta }}^{n})}{{h(\boldsymbol{\theta }}^{n-1})}\geqslant {\gamma}$ ，则更新罚因子：

${M^{n + 1}} = \alpha {{ M}^n}$

(14)

否则：

${{ M}^{n + 1}} = {{ M}^n}$

(15)

S8更新乘子项：使用如下公式更新乘子项及迭代次数，并返回步骤S5：

$k_i^{n + 1} = k_i^n - {{M}^n}{h_i}({{\boldsymbol{\theta }}^n})$

(16)

$n = n + 1$

(17)

3 算例分析

本文求解程序均采用Python的Tensorflow2.6版本进行编写，运行平台为Windows10，硬件配置为CPU：Intel Xeon E-2224 @ 3.40 GHz，GPU：NIVIDIA Quadro RTX 4000。

3.1 周边简支矩形Kirchhoff薄板

如图4所示的周边简支矩形Kirchhoff薄板，边长a=b=1 m，薄板厚度h=0.01 m，弹性模量E=10 MPa，泊松比ν=0.2，板中面的均布荷载为q=10 N/m²，该问题的重三角级数解^[28]为：

图 4 Kirchhoff矩形薄板示意图

Figure 4. Diagram of a Kirchhoff thin rectangular plate

下载: 全尺寸图片幻灯片

$w = \frac{{16q}}{{{\pi ^6}D}}\sum\limits_{m = 1,3,5, \cdots }^\infty {{\kern 1pt} {\kern 1pt} \sum\limits_{n = 1,3,5, \cdots }^\infty {\frac{{\sin \dfrac{{m\pi x}}{a}\sin \dfrac{{n\pi y}}{b}}}{{mn{{\left(\dfrac{{{m^2}}}{{{a^2}}} + \dfrac{{{n^2}}}{{{b^2}}}\right)}^2}}}} }$

(18)

该问题的微分控制方程为：

$D{\nabla ^4}w = q$

(19)

式中： $\nabla$ 为双调和算子； $D=\dfrac{E{h}^{3}}{12(1-{\nu }^{2})}$ 。

其边界条件为：

${(w)_\varGamma } = 0{\kern 1pt} ,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {({M_n})_\varGamma } = 0{\kern 1pt}$

(20)

式中：Γ={Γ₁，Γ₂，Γ₃，Γ₄}为边界，分别代表{x=0，x=a，y=0，y=a}四条边；M_n为弯矩。

根据广义乘子法构建的损失函数为：

$\begin{split} {\rm loss}=&\sum\nolimits_{j{ = 1}}^{{P_\varOmega }} {{{{(}D{\nabla ^4}w({x_j};{\boldsymbol{\theta }}) - q{)}}^2}{||}} + \\ & \frac{M}{4}\sum\nolimits_{i = 1}^4 {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{{j{ = 1}}}^{{P_{{\varGamma _i}}}}} {{(w{{({x_j};{\boldsymbol{\theta }})}_{{\varGamma _i}}})}^2} + \\ & \frac{M}{4}\sum\nolimits_{i = 1}^4 {\frac{1}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{ = 1}}^{{P_{{\varGamma _i}}}} {({M_n}{({x_j};{\boldsymbol{\theta }})_{{\varGamma _i}}})}^2 } -\\ & \frac{{1}}{4}\sum\nolimits_{i = 1}^4 {\frac{{{k_i}}}{{{P_{{\varGamma _i}}}}}\sum\nolimits_{j{ = 1}}^{{P_{{\varGamma _i}}}} {w{({x_j};{\boldsymbol{\theta }})}_{\varGamma _i}} } - \\ &\frac{{1}}{4}\sum\nolimits_{i = 5}^8 {\frac{{{k_i}}}{{{P_{{\varGamma _{i - 4}}}}}}\sum\nolimits_{j{ = 1}}^{P_{{\varGamma _{i - 4}}}} {{M_n}{({x_j};{\boldsymbol{\theta }})}_{{\varGamma _{i - 4}}}} } \end{split}$

(21)

式中： ${P}_{\varOmega }、{P}_{{\mathrm{\varGamma }}_{i}}$ 分别为域内、相应边界上的配点数；k_i为相应边界方程对应的乘子。

初始设定罚因子M=1，乘子k_i=1(i=1, 2, …, 8)，放大系数α=2，误差阈值ε=1×10⁻³，参数γ=0.01，采用本文提出方法进行求解。按照图2的方式在求解域与边界上进行配点，其中域内配点20×20个，边界上每边配点40个。神经网络的拓扑结构设置为2-1*30-1，表示输入层神经元数量为2，分别为配点的横纵坐标；隐藏层层数为1，隐藏层神经元数量设置为30个；输出层神经元数量为1，为配点的挠度预测解，优化器选取Adam，学习率设置为0.01。在神经网络训练过程中，若损失值连续500轮没下降则自动更新罚因子、乘子后再进行计算，且在每轮罚因子、乘子下的训练不超过10000轮。

经典罚函数法、L₁精确罚函数法、Lagrange乘子法施加边界条件建立的神经网络求解该算例时，配点方式、神经网络拓扑结构、激活函数、优化器和学习率等设定均与本文算法求解时的设定保持一致，训练完毕后取损失值最小的一轮作为输出结果。为探讨罚因子取值对结果的影响，经典罚函数法和L₁精确罚函数法的罚因子分别取M=1、10、50、100、500和1000。Lagrange乘子法的乘子初始值设定与本文算法求解时的设定相同。

以配点处的神经网络预测解与重三角级数解^[28]的绝对误差平均值作为参考，对上述神经网络求解结果的精度进行比较。如图5所示，使用经典罚函数法时，计算误差随着罚因子的增加呈先减小后增加的趋势，当M=50时其数值精度最高，绝对误差平均值为5×10⁻⁴ m。这表明在使用基于经典罚函数法构建的神经网络时，盲目的增大罚因子其效果可能适得其反。当罚因子M=1时，L₁精确罚函数法具有最好的求解精度，此时绝对误差平均值为5.2×10⁻⁴ m。随着罚因子增大，其误差反而快速增加至与Lagrange乘子法同数量级。对于本算例而言，Lagrange乘子法的求解精度最低，绝对误差平均值达到1.4×10⁻² m，其原因正如引言中所提及的，Lagrange乘子法建立的神经网络损失函数对应的Lagrange函数在平衡点处的Hessian矩阵可能为非正定矩阵。本文建立的广义乘子法经过5次参数更新之后，罚因子M=32时绝对误差平均值减小至4.6×10⁻⁴ m，5次参数更新的详细情况参见表1。

图 5 四种神经网络模型挠度结果的绝对误差平均值

Figure 5. Mean value of the absolute deflection errors resulted by four neural network models

下载: 全尺寸图片幻灯片

表 1 Kirchhoff薄板算例罚因子、乘子更新值

Table 1. The updating of penalty factor and multipliers in Kirchhoff thin plate example

更新次数	罚因子M	乘子
更新次数	罚因子M	k₁	k₂	k₃	k₄	k₅	k₆	k₇	k₈
0	1	1.000	1.000	1.000	1.000	1.000	1.000	1.000	1.000
1	2	0.750	0.749	0.752	0.749	0.749	0.748	0.747	0.749
2	4	0.679	0.678	0.683	0.678	0.678	0.677	0.676	0.678
3	8	0.649	0.648	0.655	0.650	0.447	0.647	0.646	0.648
4	16	0.627	0.640	0.636	0.638	0.626	0.641	0.626	0.643
5	32	0.622	0.635	0.632	0.627	0.621	0.629	0.620	0.640

下载: 导出CSV

| 显示表格

以矩形简支薄板边界处的挠度计算结果为参考，进一步对经典罚函数法、L₁精确罚函数法和本文算法进行比较。边界处挠度理论上为零，经典罚函数法罚因子M=50时，挠度绝对值最小为6.1×10⁻⁴ m；L₁精确罚函数法罚因子M=1时，挠度绝对值最小为4.2×10⁻⁴ m；本文算法经过5次参数更新后，挠度绝对值最小达到3.2×10⁻⁴ m。本文算法求解出的薄板挠度云图如图6所示，经典罚函数法、L₁精确罚函数法和Lagrange乘子法均可以获得与图6接近的挠度分布，结果的主要区别在于计算精度。

图 6 本文算法求解的薄板挠度云图

Figure 6. Deflect distribution of thin plate resulted by the proposed algorithm

下载: 全尺寸图片幻灯片

基于上述比较分析，可以发现本文方法的求解精度整体上要优于其他方法。经典罚函数法和L₁精确罚函数法，当罚因子取值合适时，求解精度与本文方法具有一定的可比性；若罚因子取值不合理，则计算结果误差较大。由于避开了罚因子的取值问题，因此本文方法的实用性强于罚函数法。

3.2 均布荷载作用下的简支梁

设有一受均布荷载作用的简支梁，如图7所示，梁长l=1 m、梁宽b=0.01 m，梁高h=0.01 m，均布荷载q=10 N/m²，弹性模量E=1.0 GPa，求梁的挠度方程w(x)。

图 7 平面简支梁示意图

Figure 7. Diagram of a simple supported beam

下载: 全尺寸图片幻灯片

该问题的控制方程为：

$- EI\frac{{{{\rm{d}}^4}w}}{{{\rm{d}}{x^4}}} + q = 0$

(22)

边界条件为：

$w{|}_{x=0}=w{|}_{x=l}={w}''{|}_{x=0}={w}''{|}_{x=l}=0$

(23)

使用广义乘子法构造的损失函数为：

$\begin{split} {\rm loss}=&\frac{1}{{N}_{\varOmega }}{\displaystyle {\sum }_{j{=1}}^{{N}_{\varOmega }}{{\left(-EI\frac{{{\rm{d}}}^{4}w({x}_{j},{\boldsymbol{\theta}} )}{{\rm d}{x}^{4}}+q \right)}}^{2}}+\\ &M({(w{({\boldsymbol{x}},{\boldsymbol{\theta }})_{x = 0}})^{\rm{2}}} + {(w{({\boldsymbol{x}},{\boldsymbol{\theta }})_{x = l}}{\rm{)}}^{\rm{2}}} + \\ &{(w{\text{′′}}{({\boldsymbol{x}},{\boldsymbol{\theta }})_{x = 0}}{\rm{)}}^{\rm{2}}} + {(w{\text{′′}}{({\boldsymbol{x}},{\boldsymbol{\theta }})_{x = l}}{\rm{)}}^{\rm{2}}})-\\ &{k_1}w{({\boldsymbol{x}};{\boldsymbol{\theta }})_{x = 0}} - {k_2}w{({\boldsymbol{x}};{\boldsymbol{\theta }})_{x = l}}-\\ &{k_3}w{\text{′′}}{({\boldsymbol{x}};{\boldsymbol{\theta }})_{x = 0}} - {k_4}w{\text{′′}}{({\boldsymbol{x}};{\boldsymbol{\theta }})_{x = l}} \end{split}$

(24)

使用本文涉及的四种不同神经网络进行求解时，神经网络拓扑结构均设定为1-1*10-1，优化器为Adam，学习率设定为0.01，域内配点数为10，边界配点数为2。基于3.1节中算例求解的经验，使用罚函数时应避免罚因子取值过大，本算例执行时，经典罚函数法罚因子采用50和100两种取值，L₁精确罚函数法的罚因子采用1和50两种取值。广义乘子法求解时初始设定为：罚因子M=5，乘子k₁=k₂=k₃=k₄=1，放大系数α=5，误差阈值ε=1×10⁻⁵，参数γ=0.25。Lagrange乘子法的乘子初始值设定与广义乘子法保持一致。

四种神经网络求解得到的挠度曲线如图8所示。经典罚函数法、Lagrange乘子法和广义乘子法计算得到的挠度结果与解析解近乎完全重合，其绝对误差量级为10⁻⁴ m。L₁精确罚函数法计算所得的挠度结果误差则相对较大，其绝对误差量级为10⁻² m，这进一步证明了罚因子取值对基于罚函数法构建的神经网络求解结果的影响。

图 8 采用不同神经网络计算的平面弯曲梁挠度曲线

Figure 8. Deflection curve of plane bending beam by different neural network models

下载: 全尺寸图片幻灯片

图9给出了不同神经网络求解时的误差-耗时曲线。可以发现，由于数学理论的不同，四种神经网络求解过程呈现显著的差异。罚函数法的单次训练过程耗时较短，在向最终解逼近的过程中呈现反复的来回震荡现象，L₁精确罚函数法的震荡幅度略小于经典罚函数法，但在本算例中由于罚因子取值不太合理所以误差无法继续降低。Lagrange乘子法初期误差下降较快且无明显震荡，当误差下降至10⁻² m量级后，其向最终解逼近时呈现逐步向下的来回震荡。本文采用的广义乘子法，经过4次迭代后误差达到收敛标准。第一次迭代时耗时较长，原因在于初始值距离最终解较远，计算参数可能不合理。随迭代轮数增加，其计算参数将根据最终解的预测位置实时调整，后续迭代明显耗时减少。在向最终解逼近过程中，误差虽然也存在震荡现象，但每次震荡后误差均会大幅降低。比较四种神经网络求解该问题的耗时可发现，本文提出方法总耗时最少，与Lagrange乘子法相比甚至呈现数量级的区别，因此在计算效率方面本文提出的方法明显优于其它的神经网络方法。

图 9 采用不同神经网络计算的误差-耗时曲线

Figure 9. Error and time-consuming curves by different neural network models

下载: 全尺寸图片幻灯片

此算例求解时，广义乘子法神经网络求解4次迭代过程中的参数更新情况如表2所示。

表 2 简支梁算例罚因子、乘子更新值

Table 2. The updating of penalty factor and multipliers in simple supported beam example

更新次数	罚因子M	乘子
更新次数	罚因子M	k₁	k₂	k₃	k₄
0	5	1.00	1.00	1.00	1.00
1	5	0.36	0.64	0.97	1.35
2	5	0.14	0.35	0.98	1.47
3	25	0.06	0.16	0.95	1.58
4	125	0.01	0.05	0.96	1.62

下载: 导出CSV

| 显示表格

4 广义乘子法神经网络求解的影响因素分析

4.1 神经网络拓扑结构对求解过程的影响

针对3.1节中的Kirchhoff薄板问题，构造隐藏层层数为1层、2层和3层，每层神经元数量分别为10个、20个和30个的神经网络，对其进行求解，观察神经网络拓扑结构对求解过程的影响。为简单起见将拓扑结构表示为2-L*N-1，其中，L为隐藏层层数，N为每层隐藏层的神经元数量，其他参数设置与3.1节中保存一致。使用不同拓扑结构的神经网络进行求解，最终得到的误差耗时曲线如图10所示。

图 10 不同结构神经网络求解的误差-耗时曲线

Figure 10. Error and time-consuming curves by different neural network structures

下载: 全尺寸图片幻灯片

可以发现，隐藏层层数为1层时，神经网络结果的绝对误差平均值均可收敛至10⁻³ m左右，增加隐藏层神经元数量可显著降低神经网络结果的误差。隐藏层层数为2层时，隐藏层神经元数量增加对于降低神经网络结果的误差有一定作用，但是误差曲线在收敛过程中可能会产生较大振荡。隐藏层层数为3层时，神经网络结果始终存在一定误差，而且该误差不会随着神经元数量的增加而减小。增加隐藏层层数与增加神经元数量都会导致求解耗时增加，但相对来说，隐藏层层数对计算效率影响更大。基于上述比较，可认为本文建立的广义乘子法神经网络求解偏微分方程时，过多的隐藏层层数反而会导致计算效率和求解精度降低。

4.2 配点数与隐藏层神经元数量

理论上，神经网络的计算精度与训练集的大小和隐藏层神经元数量密切相关。基于前面的分析，使用2-1*N-1的神经网络拓扑结构，其中N=5、10、15、20、30、50，其他参数设置与3.1节中保持一致，选取5×5、10×10、15×15、20×20、30×30和50×50等六种不同的配点方式，探讨不同配点数量在不同隐藏层神经元数量下的收敛情况，并将结果绘制于图11。

图 11 不同配点数与隐藏层神经元数量组合求解的误差

Figure 11. Error resulted by different combinations of collocation points and neurons in the hidden layer

下载: 全尺寸图片幻灯片

可以发现，配点数为5×5时，不同隐藏层神经元数量的神经网络求解结果的绝对误差平均值均较大；使用其他配点方式，当隐藏层神经元数量超过20个时，神经网络求解结果的误差均能降低至10⁻³ m以下。因此，使用本文建立的广义乘子法神经网络求解偏微分方程时，配点数量不宜过少，且隐藏层神经元数量应达到一定标准。

5 结论

针对以往物理信息神经网络采用经典罚函数法进行求解时罚因子取值难以确定的问题，本文结合广义乘子法提出一种改进方法，经算例验证，可得出如下结论：

(1)与使用经典罚函数法、L₁精确罚函数法和Lagrange乘子法施加边界条件构造的神经网络相比，采用广义乘子法施加边界条件构造的神经网络具有更好的数值精度和更高的求解效率，而且求解过程更加稳定。

(2)使用本文提出的方法求解偏微分方程组时，神经网络隐藏层层数不宜过多。隐藏层层数设置合理的前提下，隐藏层神经元数量和配点数量均应达到一定标准。

图 1 两种常用的神经网络激活函数及其导数

Figure 1. Two widely used activation function in neural network and their derivatives

下载: 全尺寸图片幻灯片

图 2 配点示意图

Figure 2. Schematic diagram of collocation points

下载: 全尺寸图片幻灯片

图 3 物理信息网络示意图

Figure 3. Diagram of Physics Informed Neutral Network

下载: 全尺寸图片幻灯片

图 4 Kirchhoff矩形薄板示意图

Figure 4. Diagram of a Kirchhoff thin rectangular plate

下载: 全尺寸图片幻灯片

图 5 四种神经网络模型挠度结果的绝对误差平均值

Figure 5. Mean value of the absolute deflection errors resulted by four neural network models

下载: 全尺寸图片幻灯片

图 6 本文算法求解的薄板挠度云图

Figure 6. Deflect distribution of thin plate resulted by the proposed algorithm

下载: 全尺寸图片幻灯片

图 7 平面简支梁示意图

Figure 7. Diagram of a simple supported beam

下载: 全尺寸图片幻灯片

图 8 采用不同神经网络计算的平面弯曲梁挠度曲线

Figure 8. Deflection curve of plane bending beam by different neural network models

下载: 全尺寸图片幻灯片

图 9 采用不同神经网络计算的误差-耗时曲线

Figure 9. Error and time-consuming curves by different neural network models

下载: 全尺寸图片幻灯片

图 10 不同结构神经网络求解的误差-耗时曲线

Figure 10. Error and time-consuming curves by different neural network structures

下载: 全尺寸图片幻灯片

图 11 不同配点数与隐藏层神经元数量组合求解的误差

Figure 11. Error resulted by different combinations of collocation points and neurons in the hidden layer

下载: 全尺寸图片幻灯片

表 1 Kirchhoff薄板算例罚因子、乘子更新值

Table 1 The updating of penalty factor and multipliers in Kirchhoff thin plate example

更新次数	罚因子M	乘子
更新次数	罚因子M	k₁	k₂	k₃	k₄	k₅	k₆	k₇	k₈
0	1	1.000	1.000	1.000	1.000	1.000	1.000	1.000	1.000
1	2	0.750	0.749	0.752	0.749	0.749	0.748	0.747	0.749
2	4	0.679	0.678	0.683	0.678	0.678	0.677	0.676	0.678
3	8	0.649	0.648	0.655	0.650	0.447	0.647	0.646	0.648
4	16	0.627	0.640	0.636	0.638	0.626	0.641	0.626	0.643
5	32	0.622	0.635	0.632	0.627	0.621	0.629	0.620	0.640

下载: 导出CSV

表 2 简支梁算例罚因子、乘子更新值

Table 2 The updating of penalty factor and multipliers in simple supported beam example

更新次数	罚因子M	乘子
更新次数	罚因子M	k₁	k₂	k₃	k₄
0	5	1.00	1.00	1.00	1.00
1	5	0.36	0.64	0.97	1.35
2	5	0.14	0.35	0.98	1.47
3	25	0.06	0.16	0.95	1.58
4	125	0.01	0.05	0.96	1.62

下载: 导出CSV

参考文献(28)

[1]	姜礼尚, 陈亚浙, 刘西垣, 等. 数学物理方程讲义[M]. 3版. 北京: 高等教育出版社, 2007: 1 − 2. JIANG Lishang, CHEN Yazhe, LIU Xiyuan, et al. Equations of mathematical physics [M]. 3rd ed. Beijing: Higher Education Press, 2007: 1 − 2. (in Chinese)
[2]	王昀卓. 求解偏微分方程的神经网络方法[D]. 合肥: 中国科学技术大学, 2021. WANG Yunzhuo. Neural network for solving partial differential equations [D]. Hefei: University of Science and Technology of China, 2021. (in Chinese)
[3]	焦李成, 杨淑媛, 刘芳, 等. 神经网络七十年: 回顾与展望[J]. 计算机学报, 2016, 39(8): 1697 − 1717. JIAO Licheng, YANG Shuyuan, LIU Fang, et al. Seventy years beyond neural networks: Retrospect and prospect [J]. Chinese Journal of Computers, 2016, 39(8): 1697 − 1717. (in Chinese)
[4]	XIE Y L, HE M J, MA T S, et al. Optimal distributed parallel algorithms for deep learning framework TensorFlow [J]. Applied Intelligence, 2022, 52(4): 3880 − 3900. doi: 10.1007/s10489-021-02588-9
[5]	DAI H L, PENG X, SHI X H, et al. Reveal training performance mystery between TensorFlow and Pytorch in the single GPU environment [J]. Science China Information Sciences, 2022, 65: 112103. doi: 10.1007/s11432-020-3182-1
[6]	叶继红, 杨振宇. 基于生成式对抗网络的风场生成研究[J]. 工程力学, 2021, 38(10): 1 − 11. doi: 10.6052/j.issn.1000-4750.2020.10.0721 YE Jihong, YANG Zhenyu. Research on generation of wind fields based on GAN [J]. Engineering Mechanics, 2021, 38(10): 1 − 11. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.10.0721
[7]	许泽坤, 陈隽. 非线性结构地震响应的神经网络算法[J]. 工程力学, 2021, 38(9): 133 − 145. doi: 10.6052/j.issn.1000-4750.2020.09.0645 XU Zekun, CHEN Jun. Neural network algorithm for nonlinear structural seismic response [J]. Engineering Mechanics, 2021, 38(9): 133 − 145. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.09.0645
[8]	程诗焱, 韩建平, 于晓辉, 等. 基于BP神经网络的RC框架结构地震易损性曲面分析: 考虑地震动强度和持时的影响[J]. 工程力学, 2021, 38(12): 107 − 117. doi: 10.6052/j.issn.1000-4750.2020.11.0837 CHENG Shiyan, HAN Jianping, YU Xiaohui, et al. Seismic fragility surface analysis of RC frame structures based on BP neural networks: Accounting for the effects of ground motion intensity and duration [J]. Engineering Mechanics, 2021, 38(12): 107 − 117. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.11.0837
[9]	赵林鑫, 江守燕, 杜成斌. 基于SBFEM和机器学习的薄板结构缺陷反演[J]. 工程力学, 2021, 38(6): 36 − 46. doi: 10.6052/j.issn.1000-4750.2020.06.0416 ZHAO Linxin, JIANG Shouyan, DU Chengbin. Flaws detection in thin plate structures based on SBFEM and machine learning [J]. Engineering Mechanics, 2021, 38(6): 36 − 46. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.06.0416
[10]	郑秋怡, 周广东, 刘定坤. 基于长短时记忆神经网络的大跨拱桥温度-位移相关模型建立方法[J]. 工程力学, 2021, 38(4): 68 − 79. doi: 10.6052/j.issn.1000-4750.2020.05.0323 ZHENG Qiuyi, ZHOU Guangdong, LIU Dingkun. Method of modeling temperature-displacement correlation for long-span arch bridges based on long short-term memory neural networks [J]. Engineering Mechanics, 2021, 38(4): 68 − 79. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.05.0323
[11]	E W N, YU B. The deep Ritz method: A deep learning-based numerical algorithm for solving variational problems [J]. Communications in Mathematics and Statistics, 2018, 6(1): 1 − 12. doi: 10.1007/s40304-018-0127-z
[12]	SIRIGNANO J, SPILIOPOULOS K. DGM: A deep learning algorithm for solving partial differential equations [J]. Journal of Computational Physics, 2018, 375: 1339 − 1364. doi: 10.1016/j.jcp.2018.08.029
[13]	SAMANIEGO E, ANITESCU C, GOSWAMI S, et al. An energy approach to the solution of partial differential equations in computational mechanics via machine learning: Concepts, implementation and applications [J]. Computer Methods in Applied Mechanics and Engineering, 2020, 362: 112790. doi: 10.1016/j.cma.2019.112790
[14]	RAISSI M, PERDIKARIS P, KARNIADAKIS G E. Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations [J]. Journal of Computational Physics, 2019, 378: 686 − 707. doi: 10.1016/j.jcp.2018.10.045
[15]	RAISSI M, YAZDANI A, KARNIADAKIS G E. Hidden fluid mechanics: Learning velocity and pressure fields from flow visualizations [J]. Science, 2020, 367(6481): 1026 − 1030. doi: 10.1126/science.aaw4741
[16]	LU L, MENG X H, MAO Z P, et al. DeepXDE: A deep learning library for solving differential equations [J]. SIAM Review, 2021, 63(1): 208 − 228. doi: 10.1137/19M1274067
[17]	郭宏伟, 庄晓莹. 采用两步优化器的深度配点法与深度能量法求解薄板弯曲问题[J]. 固体力学学报, 2021, 42(3): 249 − 266. doi: 10.19636/j.cnki.cjsm42-1250/o3.2021.029 GUO Hongwei, ZHUANG Xiaoying. The application of deep collocation method and deep energy method with a two-step optimizer in the bending analysis of Kirchhoff thin plate [J]. Chinese Journal of Solid Mechanics, 2021, 42(3): 249 − 266. (in Chinese) doi: 10.19636/j.cnki.cjsm42-1250/o3.2021.029
[18]	黄钟民, 谢臻, 张易申, 等. 面内变刚度薄板弯曲问题的挠度-弯矩耦合神经网络方法[J]. 力学学报, 2021, 53(9): 2541 − 2553. doi: 10.6052/0459-1879-21-273 HUANG Zhongmin, XIE Zhen, ZHANG Yishen, et al. Deflection-bending moment coupling neural network method for the bending problem of thin plates with in-plane stiffness gradient [J]. Chinese Journal of Theoretical and Applied Mechanics, 2021, 53(9): 2541 − 2553. (in Chinese) doi: 10.6052/0459-1879-21-273
[19]	唐明健, 唐和生. 基于物理信息的深度学习求解矩形薄板力学正反问题[J]. 计算力学学报, 2022, 39(1): 120 − 128. doi: 10.7511/jslx20201110003 TANG Mingjian, TANG Hesheng. A physics-informed deep learning method for solving forward and inverse mechanics problems of thin rectangular plates [J]. Chinese Journal of Computational Mechanics, 2022, 39(1): 120 − 128. (in Chinese) doi: 10.7511/jslx20201110003
[20]	HE J C, LI L, XU J C, et al. ReLU deep neural networks and linear finite elements [J]. Journal of Computational Mathematics, 2020, 38(3): 502 − 527. doi: 10.4208/jcm.1901-m2018-0160
[21]	黄钟民, 陈思亚, 陈卫, 等. 薄板弯曲问题的神经网络方法[J]. 固体力学学报, 2021, 42(6): 697 − 706. HUANG Zhongmin, CHEN Siya, CHEN Wei, et al. Neural network method for thin plate bending problem [J]. Chinese Journal of Solid Mechanics, 2021, 42(6): 697 − 706. (in Chinese)
[22]	张光澄. 非线性最优化计算方法[M]. 北京: 高等教育出版社, 2005: 292 − 309. ZHANG Guangcheng. Computational methods for nonlinear optimization [M]. Beijing: Higher Education Press, 2005: 292 − 309. (in Chinese)
[23]	徐慧福. 混合约束不可微非线性规划的L₁-精确罚函数法[J]. 宁波大学学报, 1994, 7(2): 1 − 9. XU Huifu. L₁ exact penalty methods for inequality and equality constrained programming [J]. Journal of Ningbo University, 1994, 7(2): 1 − 9. (in Chinese)
[24]	李海滨, 段志信. 约束非线性规划问题的L₁精确罚函数神经网络方法[J]. 电子学报, 2009, 37(1): 229 − 234. doi: 10.3321/j.issn:0372-2112.2009.01.043 LI Haibin, DUAN Zhixin. An L₁ exact penalty function neural network method for constraint nonlinear programming problems [J]. Acta Electronica Sinica, 2009, 37(1): 229 − 234. (in Chinese) doi: 10.3321/j.issn:0372-2112.2009.01.043
[25]	陈珊珊, 楼旭阳, 崔宝同. 参数非线性规划问题的L₁精确罚函数神经网络方法分析[J]. 计算机应用与软件, 2014, 31(7): 277 − 279, 315. doi: 10.3969/j.issn.1000-386x.2014.07.071 CHEN Shanshan, LOU Xuyang, CUI Baotong. Analysing L₁ exact penalty function neural networks method of parametric nonlinear programming problems [J]. Computer Applications and Software, 2014, 31(7): 277 − 279, 315. (in Chinese) doi: 10.3969/j.issn.1000-386x.2014.07.071
[26]	王尚长, 杨格, 吴斌, 等. 基于内点法和拉格朗日乘子法的混合试验冗余作动器控制方法[J]. 振动与冲击, 2021, 40(12): 23 − 30, 37. WANG Shangzhang, YANG Ge, WU Bin, et al. A redundant actuator control method for hybrid simulation based on the interior point and the Lagrange multiplier [J]. Journal of Vibration and Shock, 2021, 40(12): 23 − 30, 37. (in Chinese)
[27]	蒋昂波, 王维维. ReLU激活函数优化研究[J]. 传感器与微系统, 2018, 37(2): 50 − 52. JIANG Angbo, WANG Weiwei. Research on optimization of ReLU activation function [J]. Transducer and Microsystem Technologies, 2018, 37(2): 50 − 52. (in Chinese)
[28]	徐芝纶. 弹性力学简明教程[M]. 5版. 北京: 高等教育出版社, 2018: 214 − 216. XU Zhilun. Concise course in elasticity [M]. 5th ed. Beijing: Higher Education Press, 2018: 214 − 216. (in Chinese)