能量束热作用状态控制方法

著录项
  • CN201810590548.4
  • 20180609
  • CN108732927A
  • 20181102
  • 王天骄
  • 王天骄
  • G05/B1302
  • G05/B1302 G05/B1304

  • 北京市海淀区清华大学李兆基科技大楼A216
  • 北京(11)
摘要
本发明提供了一种能量束热作用状态控制方法,包括步骤:实施不同能量束工作参数下形成的材料结构性能测试,对能量束作用下材料发射出的多波段复合电磁波信号和相应的材料结构性能进行数据采样;使用神经网络学习获得材料结构性能评价网络;设定目标材料结构性能,从随机能量束工作参数开始,通过控制策略施加控制动作,通过性能评价网络计算控制动作执行后的回报值,获得以能量束热作用状态、控制动作、回报值和下一时刻能量束热作用状态为数据单元的能量束工作历史数据集;使用神经网络在能量束工作历史数据集上进行训练学习更新控制策略;验证控制策略是否满足目标材料结构性能要求,如不满足,则再次更新控制策略。
权利要求

1.一种能量束热作用状态控制方法,其特征在于,包括步骤:

步骤1:对于能量束对材料的热作用状态,本发明使用传感器采集到的不同波段电磁波点阵数据来对其进行表征;本发明使用(λ,λ,λ)来分别代表采集到的红外波段电磁波信号点阵数据、可见光波段电磁波信号点阵数据和其它波段电磁波信号点阵数据;为了表征能量束热作用状态在时间维度受到的影响,本发明在每一个离散时间范围内采集连续m帧(m>2)电磁波信号来联合表征能量束热作用状态,因此时刻能量束热作用状态完整表达为[(λ~λ),(λ ~λ ), (λ~λ))]共3×m层二维点阵数据;针对能量束工作参数如功率P、速率V和焦深F设计正交实验,得到M种(P,V,F)组合,在相同规则矩形区域内分别使用M种(P,V,F)组合执行能量束作业,作业过程中使用传感器采集能量束热作用状态数据[(λ~λ),(λ ~λ ), (λ~λ))],作业结束后对形成的材料结构进行性能测试,如屈服强度σ测试,从性能测试结果中选择N个性能区间,要求N个性能区间具有足够差异性并且能够覆盖性能测试结果的上下限;以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元采集构成能量束热作用状态与相应材料结构性能的数据集;

步骤2:使用神经网络 (;ε)在步骤1中得到的以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元构成的能量束热作用状态与相应材料结构性能的数据集上进行训练学习;其输入为能量束热作用状态的表征数据 =[(λ~λ),(λ ~λ ), (λ~λ))],输出为步骤1中选择的N种材料结构性能σ,ε为训练得到的神经网络参数;以(,σ)作为训练数据单元,以损失值(σ - (;ε))使用随机梯度下降法训练更新的网络参数ε;学习完成后得到性能评价网络 (;ε),对于任意能量束热作用状态,通过性能评价网络输出为当前能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对于目标能量束热作用状态,通过性能评价网络输出为目标能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对一维向量[]和[]做相似性计算得到与的相似度值ω,该相似度值ω即为对当前能量束热作用状态的评价值;

步骤3:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,对能量束工作参数施加随机控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω<κ,将回报值赋值为0,当ω>κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤4:本发明使用神经网络 (,;)来评价从当前时刻起能量束热作用状态长程的好坏,称为值函数;值函数的输入为能量束热作用状态,输出为执行控制动作的长程回报值;(,;)为目标值函数;使用随机参数初始化值函数,同时初始化目标值函数,目标值函数的参数= ;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略设置为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤5:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,使用步骤4中得到的控制策略根据能量束热作用状态对能量束工作参数施加控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω<κ,将回报值赋值为0,当ω>κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤6:在该步骤中值函数设置为步骤4中更新后的,目标值函数设置为步骤4中更新后的;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略更新为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤7:针对步骤1中选择的N个材料结构性能区间,分别从随机能量束工作参数开始,执行步骤6中得到的控制策略(将概率δ设置为0),分别验证该控制策略是否能够施加合适控制动作使得能量束作用下形成的材料结构性能分别达到N个目标材料结构性能:如果不能,则重复步骤5与步骤6;如果能,那么该控制策略即为本发明最终的能量束热作用状态控制策略。

2.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,能量束为等离子弧、电弧、电子束或激光。

3.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,用以表征能量束热作用状态的电磁波信号为多波段复合电磁波信号。

4.根据权利要求3所述的能量束热作用状态控制方法,其特征在于,多波段复合电磁波信号的波长范围为10~10米之间。

5.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,材料结构性能为弹性模量、屈服强度、抗拉强度、抗压强度、抗弯强度、延伸率、硬度、粗糙度、残余应力、密度、比热、导热率、热膨胀系数、导电性能、疏水性能、耐火性能、吸声性能或电磁屏蔽性能。

6.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,材料结构性能数据包含N个性能区间,且N≥3。

7.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合。

8.根据权利要求7所述的能量束热作用状态控制方法,其特征在于,能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量取值方式分别为{-αW,0W,αW }、{-βmm/s,0mm/s,βmm/s}、{-γum,0um,γum}与{-1,0,1}。

9.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,评价值阀值κ取值为0.9~1之间。

10.根据权利要求1所述的能量束热作用状态控制方法,其特征在于,概率δ取值为0~0.1之间。

说明书

能量束热作用状态控制方法

技术领域

本发明涉及能量束热作用状态控制领域,尤其涉及一种能量束热作用状态控制方法。

背景技术

能量束的热作用过程包括焊接中的电弧热作用过程、激光加工中的激光热作用过程以及增材制造中的电子束热作用过程与激光热作用过程。在能量束的热作用下,目标材料经过升温熔融、冷却凝固,最终形成具有一定性能的材料结构。在何种条件的能量束作用下会得到何种性能的材料结构,如何对能量束工作参数进行控制以使能量束在不同时间不同工作环境都能达到稳定一致的热作用状态,这些问题一直以来都没有完美的解决办法。

发明内容

鉴于背景技术中存在的问题,本发明的目的在于提供一种能量束热作用状态控制方法,其能够对能量束对材料的热作用状态进行诊断,给出当前能量束热作用状态下形成的材料结构性能的评价,在此基础上给出达到目标材料结构性能所需的能量束控制动作,使得能量束热作用状态转变为能够达到目标材料结构性能的能量束热作用状态。

为了实现上述目的,本发明提供了一种能量束热作用状态控制方法,其包括步骤:

步骤1:对于能量束对材料的热作用状态,本发明使用传感器采集到的不同波段电磁波点阵数据来对其进行表征;本发明使用(λ,λ,λ)来分别代表采集到的红外波段电磁波信号点阵数据、可见光波段电磁波信号点阵数据和其它波段电磁波信号点阵数据;为了表征能量束热作用状态在时间维度受到的影响,本发明在每一个离散时间范围内采集连续m帧(m&gt;2)电磁波信号来联合表征能量束热作用状态,因此时刻能量束热作用状态完整表达为[(λ~λ),(λ ~λ ), (λ~λ))]共3×m层二维点阵数据;针对能量束工作参数如功率P、速率V和焦深F设计正交实验,得到M种(P,V,F)组合,在相同规则矩形区域内分别使用M种(P,V,F)组合执行能量束作业,作业过程中使用传感器采集能量束热作用状态数据[(λ~λ),(λ ~λ ), (λ~λ))],作业结束后对形成的材料结构进行性能测试,如屈服强度σ测试,从性能测试结果中选择N个性能区间,要求N个性能区间具有足够差异性并且能够覆盖性能测试结果的上下限;以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元采集构成能量束热作用状态与相应材料结构性能的数据集;

步骤2:使用神经网络 (;ε)在步骤1中得到的以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元构成的能量束热作用状态与相应材料结构性能的数据集上进行训练学习;其输入为能量束热作用状态的表征数据 =[(λ~λ),(λ ~λ ), (λ~λ))],输出为步骤1中选择的N种材料结构性能σ,ε为训练得到的神经网络参数;以(,σ)作为训练数据单元,以损失值(σ - (;ε))使用随机梯度下降法训练更新的网络参数ε;学习完成后得到性能评价网络 (;ε),对于任意能量束热作用状态,通过性能评价网络输出为当前能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对于目标能量束热作用状态,通过性能评价网络输出为目标能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对一维向量[]和[]做相似性计算得到与的相似度值ω,该相似度值ω即为对当前能量束热作用状态的评价值;

步骤3:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,对能量束工作参数施加随机控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω&lt;κ,将回报值赋值为0,当ω&gt;κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤4:本发明使用神经网络 (,;)来评价从当前时刻起能量束热作用状态长程的好坏,称为值函数;值函数的输入为能量束热作用状态,输出为执行控制动作的长程回报值;(,;)为目标值函数;使用随机参数初始化值函数,同时初始化目标值函数,目标值函数的参数= ;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略设置为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤5:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,使用步骤4中得到的控制策略根据能量束热作用状态对能量束工作参数施加控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω&lt;κ,将回报值赋值为0,当ω&gt;κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤6:在该步骤中值函数设置为步骤4中更新后的,目标值函数设置为步骤4中更新后的;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略更新为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤7:针对步骤1中选择的N个材料结构性能区间,分别从随机能量束工作参数开始,执行步骤6中得到的控制策略(将概率δ设置为0),分别验证该控制策略是否能够施加合适控制动作使得能量束作用下形成的材料结构性能分别达到N个目标材料结构性能:如果不能,则重复步骤5与步骤6;如果能,那么该控制策略即为本发明最终的能量束热作用状态控制策略。

本发明的有益效果如下:

以能量束作用下材料发射出的多波段复合电磁波信号对能量束热作用状态进行有效表征,能够对能量束对材料的热作用状态进行诊断,给出当前能量束热作用状态下形成的材料结构性能的评价;在以上评价基础上,对于给定的目标材料结构性能,通过控制策略给出达到目标材料结构性能所需的能量束控制动作,使得能量束热作用状态转变为能够达到目标材料结构性能的能量束热作用状态。因而本发明能够诊断出何种条件的能量束作用下会得到何种性能的材料结构,同时本发明能够对能量束工作参数进行控制以使能量束在不同时间不同工作环境都能达到稳定一致的热作用状态,进而本发明能够对于给定的材料结构性能,控制能量束热作用状态转变为能够达到目标材料结构性能的能量束热作用状态。

具体实施方式

下面来详细说明根据本发明的能量束热作用状态控制方法。

根据本发明的能量束热作用状态控制方法包括以下步骤:

步骤1:对于能量束对材料的热作用状态,本发明使用传感器采集到的不同波段电磁波点阵数据来对其进行表征;本发明使用(λ,λ,λ)来分别代表采集到的红外波段电磁波信号点阵数据、可见光波段电磁波信号点阵数据和其它波段电磁波信号点阵数据;为了表征能量束热作用状态在时间维度受到的影响,本发明在每一个离散时间范围内采集连续m帧(m&gt;2)电磁波信号来联合表征能量束热作用状态,因此时刻能量束热作用状态完整表达为[(λ~λ),(λ ~λ ), (λ~λ))]共3×m层二维点阵数据;针对能量束工作参数如功率P、速率V和焦深F设计正交实验,得到M种(P,V,F)组合,在相同规则矩形区域内分别使用M种(P,V,F)组合执行能量束作业,作业过程中使用传感器采集能量束热作用状态数据[(λ~λ),(λ ~λ ), (λ~λ))],作业结束后对形成的材料结构进行性能测试,如屈服强度σ测试,从性能测试结果中选择N个性能区间,要求N个性能区间具有足够差异性并且能够覆盖性能测试结果的上下限;以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元采集构成能量束热作用状态与相应材料结构性能的数据集;

步骤2:使用神经网络 (;ε)在步骤1中得到的以{[(λ~λ),(λ ~λ ), (λ~λ))],σ}为数据单元构成的能量束热作用状态与相应材料结构性能的数据集上进行训练学习;其输入为能量束热作用状态的表征数据 =[(λ~λ),(λ ~λ ), (λ~λ))],输出为步骤1中选择的N种材料结构性能σ,ε为训练得到的神经网络参数;以(,σ)作为训练数据单元,以损失值(σ - (;ε))使用随机梯度下降法训练更新的网络参数ε;学习完成后得到性能评价网络 (;ε),对于任意能量束热作用状态,通过性能评价网络输出为当前能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对于目标能量束热作用状态,通过性能评价网络输出为目标能量束热作用状态下形成的材料结构性能在N种材料结构性能上的概率分布,即一个含有N个元素的向量[];对一维向量[]和[]做相似性计算得到与的相似度值ω,该相似度值ω即为对当前能量束热作用状态的评价值;

步骤3:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,对能量束工作参数施加随机控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω&lt;κ,将回报值赋值为0,当ω&gt;κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤4:本发明使用神经网络 (,;)来评价从当前时刻起能量束热作用状态长程的好坏,称为值函数;值函数的输入为能量束热作用状态,输出为执行控制动作的长程回报值;(,;)为目标值函数;使用随机参数初始化值函数,同时初始化目标值函数,目标值函数的参数= ;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略设置为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤5:本发明在离散时间序列()上对能量束热作用状态控制过程进行描述:在每一个时刻对能量束热作用状态都有一个来对其进行表达,因而对应离散时间序列()有能量束热作用状态序列();对于每一个能量束热作用状态都有一个控制动作与之对应;在的作用下能量束热作用状态由转变为;本发明能量束增量控制动作空间为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合;本发明将能量束增量控制动作空间表述为{(∆, ∆, ∆, ∆)| ∆∈{-αW,0 W,αW},∆∈{-βmm/s,0 mm/s,βmm/s},∆∈{-γmm,0 mm,γmm},∆∈{-1,0,1}};控制动作(αW,-βmm/s,γmm,-1)即在当前能量束工作参数基础上增加αW功率,降低βmm/s速度,增加γmm焦深并将工作模式减1;为了对本发明的控制目标进行表达,本发明定义了一个回报值,对于每一个能量束热作用状态和控制动作都有一个回报值来表示当前能量束热作用状态的好坏;设定随机目标材料结构性能,从随机能量束工作参数开始,使用步骤4中得到的控制策略根据能量束热作用状态对能量束工作参数施加控制动作,通过步骤2中得到的性能评价网络 (;ε)给出对当前能量束热作用状态的评价值ω;设定评价值阀值κ,当ω&lt;κ,将回报值赋值为0,当ω&gt;κ,将回报值赋值为1;本发明将与()联合组成一个数据单元即=();在离散时间序列()上采集的()构成能量束工作历史数据集D;

步骤6:在该步骤中值函数设置为步骤4中更新后的,目标值函数设置为步骤4中更新后的;从历史数据集D中随机提取(,,,),如果为时间终止步,那么= ;如果不是时间终止步,那么= +max(,;);以(,,)作为训练数据单元,以损失值( - (,;))使用随机梯度下降法训练更新值函数的网络参数;训练完成后设置= ;此时控制策略更新为:在时刻,在概率δ下选择随机动作,在概率1-δ下选择动作= argmax(;),即选择能量束热作用状态下使得值函数最大的控制动作;

步骤7:针对步骤1中选择的N个材料结构性能区间,分别从随机能量束工作参数开始,执行步骤6中得到的控制策略(将概率δ设置为0),分别验证该控制策略是否能够施加合适控制动作使得能量束作用下形成的材料结构性能分别达到N个目标材料结构性能:如果不能,则重复步骤5与步骤6;如果能,那么该控制策略即为本发明最终的能量束热作用状态控制策略。

以能量束作用下材料发射出的多波段复合电磁波信号对能量束热作用状态进行有效表征,能够对能量束对材料的热作用状态进行诊断,给出当前能量束热作用状态下形成的材料结构性能的评价;在以上评价基础上,对于给定的目标材料结构性能,通过控制策略给出达到目标材料结构性能所需的能量束控制动作,使得能量束热作用状态转变为能够达到目标材料结构性能的能量束热作用状态。因而本发明能够诊断出何种条件的能量束作用下会得到何种性能的材料结构,同时本发明能够对能量束工作参数进行控制以使能量束在不同时间不同工作环境都能达到稳定一致的热作用状态,进而本发明能够对于给定的材料结构性能,控制能量束热作用状态转变为能够达到目标材料结构性能的能量束热作用状态。

在根据本发明的能量束热作用状态控制方法中,能量束可为等离子弧、电弧、电子束或激光。

在根据本发明的能量束热作用状态控制方法中,用以表征能量束热作用状态的电磁波信号的波长范围为10~10米之间。

在根据本发明的能量束热作用状态控制方法中,材料结构性能可为弹性模量、屈服强度、抗拉强度、抗压强度、抗弯强度、延伸率、硬度、粗糙度、残余应力、密度、比热、导热率、热膨胀系数、导电性能、疏水性能、耐火性能、吸声性能或电磁屏蔽性能。

在根据本发明的能量束热作用状态控制方法中,材料结构性能数据包含N个性能区间,且N≥3。

在根据本发明的能量束热作用状态控制方法中,能量束增量控制动作空间可为能量束功率增量、能量束速度增量、能量束焦深增量与能量束工作模式增量的组合。

在根据本发明的能量束热作用状态控制方法中,评价值阀值κ取值为0.9~1之间。

在根据本发明的能量束热作用状态控制方法中,概率δ取值为0~0.1之间。

本文发布于:2024-09-23 14:23:43,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/73014.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议