基于机器学习的H型钢力学性能与成分优化研究.docx
《基于机器学习的H型钢力学性能与成分优化研究.docx》由会员分享,可在线阅读,更多相关《基于机器学习的H型钢力学性能与成分优化研究.docx(58页珍藏版)》请在冰豆网上搜索。
基于机器学习的H型钢力学性能与成分优化研究
摘要
H型钢是一种高效节约、截面设计合理、具有良好的综合性能的结构用钢,其在各种民用和工业建筑、铁路和桥梁等建设中应用十分广泛。
近年来随着制造业和经济的快速发展,新材料产品研发速度越来越滞后于新材料研发速度,主要依据研究者的科学直觉和大量重复传统的“尝试法”实验研究方法已经难以满足工程材料快速发展的需求,因此为了缩短新材料从发现到工程应用的研发周期,高通量技术和机器学习开始逐步在材料领域内发展。
本工作将机器学习与H型钢成分优化相结合,从而达到缩短H型钢新产品研发周期的目标。
本工作利用粒子群算法(PSO)进行超参数优化,采用支持向量回归(SVR)、随机森林(RandomForest,RF)、Bagging、XGBoost四种机器学习算法对H型钢的屈服强度(YS)、抗拉强度(TS)和延伸率(EL)进行回归预测,并筛选出性能最佳的一种模型进行后续的分析和基于PSO算法的成分优化算法。
根据本工作的研究结果,XGBoost模型为预测H型钢三种性能的最佳模型,并以其为基础采用SHAP进行分析以及完成基于PSO和XGBoost模型的成分优化算法。
由于本工作只采用了成分的质量分数和碳当量作为输入,因此预测准确度有些差强人意,但是其仍然显著优于传统的普通最小二乘法(OLS),同时XGBoost模型和成分优化算法在设计时预留了加入工艺参数以及其他参数的空间,因此其可以有针对H型钢预测更加准确的潜力和更广泛的应用。
关键词:
H型钢,机器学习,SHAP,PSO,成分优化
StudyonmechanicalpropertiesandcompositionoptimizationofH-beambasedonmachinelearning
Abstract
H-beamisakindofstructuralsteelwithhighefficiency,reasonablesectiondesignandgoodcomprehensiveperformance.Itiswidelyusedinvariouscivilandindustrialbuildings,railwaysandbridges.Inrecentyears,withtherapiddevelopmentofmanufacturingindustryandeconomy,theeffectofnewmaterialproductR&DspeedlaggingbehindthenewmaterialR&Dspeedismoreandmoresignificant.Thetraditionalresearchmethods,whicharemainlybasedonthescientificintuitionofresearchersandalargenumberofrepeated"trialmethod"experiments,havebeendifficulttomeettheneedsoftherapiddevelopmentofindustry.Therefore,inordertoshortentheR&Dcycleofnewmaterialsfromdiscoverytoapplication,HighFluxtechnologyandmachinelearningbegantodevelopgraduallyinthefieldofmaterials.Inthiswork,machinelearningandH-beamcompositionoptimizationarecombinedtoachievethegoalofshorteningtheR&DcycleofnewH-beamproducts.
Thisworkisbasedonparticleswarmoptimization(PSO)forsuperparameteroptimization.Fourmachinelearningalgorithms,supportvectorregression(SVR),randomforest(RF),baggingandxgboost,areusedtopredicttheyieldstrength(YS),tensilestrength(TS)andelongation(EL)ofH-beam,andamodelwiththebestperformanceisselectedforsubsequentanalysisandcomponentoptimizationcalculationbasedonPSOalgorithmLaw.Accordingtotheresearchresultsofthiswork,xgboostmodelisthebestmodeltopredictthethreepropertiesofH-beam,andbasedonit,shapisusedtoanalyzeandcompletethecompositionoptimizationalgorithmbasedonPSOandxgboostmodel.Becauseonlythemassfractionandcarbonequivalentofcomponentsareusedastheinputinthiswork,thepredictionaccuracyissomewhatunsatisfactory,butitisstillsignificantlybetterthanthetraditionalordinaryleastsquaremethod(OLS).xgboostmodelandcompositionoptimizationalgorithmreservespaceforaddingprocessparametersandotherparametersinthedesign,soithasthepotentialtopredictH-beammoreaccuratelyAndawiderrangeofapplications.
KeyWords:
H-beam,Machinelearning,SHAP,PSO,compositionoptimization
摘要I
AbstractII
目录III
插图或附表清单V
注释说明清单XII
1绪论样式:
b正文2级标题样式:
b正文3级标题1
1.1课题背景样式:
b正文2级标题样式:
b正文3级标题1
1.2H型钢简介样式:
b正文2级标题1
1.2.1H型钢的特点样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题1
1.2.2H型钢一般生产工艺样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题2
1.2.3钢中不同成分作用机制样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题2
1.3机器学习在材料科学领域的发展历程样式:
b正文2级标题5
1.3.1机器学习在材料科学领域的发展样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题5
1.3.2机器学习的范式(在材料领域)样式:
b正文3级标题样式:
b正文3级标题5
1.3.3材料属性的数值化(指纹或者描述符)样式:
b正文3级标题样式:
b正文3级标题6
1.4利用机器学习研究H型钢样式:
b正文2级标题样式:
b正文2级标题6
2方法8
2.1概述8
2.2数据来源8
2.3四种机器学习算法和OLS简介8
2.3.1XGBBoost算法8
2.3.2SVR算法10
2.3.3Bagging算法10
2.3.4随机森林算法12
2.3.5OLS简介12
2.4基于PSO的超参数优化13
2.5模型评价标准15
2.6模型的可解释性——SHAP16
2.7基于PSO算法和XGBoost模型的H型钢成分优化算法16
3结果与讨论18
3.1不同算法的表现18
3.1.1数据集大小与回归模型性能关系18
3.1.2XGBoost模型预测性能表征19
3.2基于SHAP和XGBoost分析成分重要性22
3.3H型钢成分优化算法的结果23
4结论与展望样式:
b正文1级标题25
4.1结论25
4.2展望26
参考文献样式:
b标题不编号27
在学取得成果31
致谢33
插图或附表清单
图1-1H型钢生产工艺流程示意图
输入:
训练集D={(x1,y1),(x2,y2),...(xm,ym)}
基学习算法f;
训练轮数T(代表基学习器数量).
过程:
1:
fort=1,2,...,Tdo
2:
ht=f(D)
3.endfor
图2-1Bagging算法
输入:
样本集D={(x1,x2,...xm)}。
过程:
1:
对所有样本进行中心化:
xi←xi-average(x);
2:
计算样本的协方差矩阵XXT;
3.对协方差矩阵XXT做特征值分解;
输出:
原始数据中14个特征属性各自的各自的方差百分比。
注:
方差百分比越高代表改属性解释目标值差异的能力越强。
图2-1PCA算法
图2-2PSO超参数优化算法流程图,十倍交叉验证即将数据集分成十份,轮流将其中九份作为训练数据,一份作为测试数据共进行10次试验,最终将10次试验的结果取平均值输出。
图2-3基于PSO算法和XGBoost模型的H型钢成分优化算法流程图,图中T值用来确保预测的性能不会超过目标性能太多。
该算法需要多次重复运行以获得一组满足目标性能的不同成分比例,之后通过人工筛选获得成本较低的局部最优成分比例。
(a)(b)
(c)(d)
(e)(f)
图3-1上述a~f为总数据集大小和模型性能关系折线图,a~f横坐标均为总数据集样本数大小,a、c、e纵坐标为线性相关度r,b-d-f纵坐标为平均绝对误差MAE。
a~f图中XGBoost和随机森林模型的r值均明显高于SVR和Bagging模型,且XGBoost和随机森林模型的MAE值均明显低于SVR和Bagging模型,因此可认为XGBoost和随机森林模型回归预测的性能要优于SVR和Bagging模型。
同时,随着数据集的增大,a、c、e图的曲线的r值有上升的趋势,d、f图的曲线的MAE值有下降的趋势,可见增加总数据集样本量有利于训练的模型的性能。
(a)YS(b)YS
(c)TS(d)TS
(e)EL(f)EL
图3-2XGBoost模型十倍交叉验证结果
图3-3左图为XGBoost模型的YS预测值和YS实际值散点图,图中红色实线为等值线,外侧的绿色虚线代表AETA=30Mpa,内侧的黑色虚线代表AETA=15Mpa,其为对右图的直观展示。
右图为XGBoost模型的绝对误差阈值精确度曲线,其表征了再实际工业应用中所允许的不同误差范围内的模型预测精确度。
图3-4左图为XGBoost模型的TS预测值和TS实际值散点图,图中红色实线为等值线,外侧的绿色虚线代表AETA=30Mpa,内侧的黑色虚线代表AETA=15Mpa,其为对右图的直观展示。
右图为XGBoost模型的绝对误差阈值精确度曲线,其表征了再实际工业应用中所允许的不同误差范围内的模型预测精确度。
图3-5左图为XGBoost模型的EL预测值和EL实际值散点图,图中红色实线为等值线,外侧的绿色虚线代表AETA=4%,内侧的黑色虚线代表AETA=2%,其为对右图的直观展示。
右图为XGBoost模型的绝对误差阈值精确度曲线,其表征了再实际工业应用中所允许的不同误差范围内的模型预测精确度。
(a)(b)
(c)
图3-6a、b、c三图分别为传统OLS算法模型对YS、TS和EL的预测能力的散点图,三图中红色实线均为等值线,a图和b图外侧的绿色虚线代表AETA=30Mpa,内侧的黑色虚线代表AETA=15Mpa,c图外侧的绿色虚线代表AETA=4%,内侧的黑色虚线代表AETA=2%.
图3-7XGBoost预测YS模型的SHAP特征重要性表征图,图中从蓝色到红色代表相应特征数值从小到大,横坐标为对YS预测值影响
图3-8XGBoost预测TS模型的SHAP特征重要性表征图,图中从蓝色到红色代表相应特征数值从小到大,横坐标为对TS预测值影响
图3-9XGBoost预测EL模型的SHAP特征重要性表征图,图中从蓝色到红色代表相应特征数值从小到大,横坐标为对EL预测值影响
表2-1模型输入特征属性
特征属性
特征属性
W(C)
W(Cu)
W(Si)
W(Al)
W(Mn)
W(Mo)
W(P)
W(V)
W(S)
W(Nb)
W(Cr)
W(Ti)
W(Ni)
Ceq
Ceq=C+Mn/6+(Cr+V+Mo)/5+(Cu+Ni)/15
W表示质量分数
表2-2局部最优参数
YS模型
TS模型
EL模型
XGBoost
XGBoost
XGBoost
min_child_weight
2.993319
min_child_weight
2.343911
min_child_weight
6.356834
max_depth
7
max_depth
9
max_depth
8
学习速率
0.1
学习速率
0.1
学习速率
0.1
迭代次数
100
迭代次数
100
迭代次数
100
lambda
1
lambda
1
lambda
1
alpha
1
alpha
1
alpha
1
SVR
SVR
SVR
gamma(
)
946.594152
gamma(
)
926.069477
gamma(
)
868.902139
C
41.567209
C
46.865107
C
5.452739
epsilon(
)
3.584059
epsilon(
)
3.526138
epsilon(
)
1.205769
表3-1基于XGBoost模型的SHAP分析主要特征属性对YS、TS、EL的影响
C
Si
Mn
P
S
Cr
Ni
Cu
Al
Mo
V
Nb
Ti
Ceq
YS
+
+
-
+
+
TS
+
+
-
+
+
+
+
EL
+
-
-
-
-
+
+
+
-
+
表3-2次要特征属性输入值
Mn
Al
Nb
1.49
0.021
0.029
表3-3重复进行10次成分优化结果
序号
C
Si
Mn
P
S
Cr
Ni
Cu
Al
Mo
V
Nb
Ti
Ceq
1
0.10
0.361
1.49
0.024
0
0.024
0.093
0.026
0.021
0.001
0.04
0.029
0.019
0.37
2
0.09
0.121
1.49
0.008
0
0.017
0.161
0.02
0.021
0.002
0.035
0.029
0.017
0.36
3
0.10
0.153
1.49
0.025
0.004
0.023
0.155
0.023
0.021
0
0.037
0.029
0.014
0.37
4
0.09
0.367
1.49
0.025
0.003
0.02
0.015
0.024
0.021
0.001
0.04
0.029
0.013
0.35
5
0.10
0.049
1.49
0.007
0.003
0.018
0.019
0.019
0.021
0.001
0.023
0.029
0.025
0.36
6
0.10
0.291
1.49
0.025
0.002
0.013
0.106
0.02
0.021
0.001
0.037
0.029
0.027
0.36
7
0.09
0.399
1.49
0.025
0.003
0.031
0.184
0.025
0.021
0
0.019
0.029
0.021
0.36
8
0.10
0.194
1.49
0.025
0.003
0.026
0.114
0.027
0.021
0.002
0.035
0.029
0.003
0.37
9
0.09
0.242
1.49
0.025
0.007
0.026
0.064
0.028
0.021
0.001
0.026
0.029
0.021
0.36
10
0.10
0.285
1.49
0.017
0.002
0.021
0.1
0.024
0.021
0.001
0.036
0.029
0.021
0.37
表3-4成分优化结果的XGBoost模型预测性能
序号
YS
TS
EL
3
398
538
31.0
4
406
538
29.8
5
400
540
30.5
6
402
540
30.1
7
402
536
29.4
8
397
535
32.3
9
401
536
30.9
10
400
536
29.8
注释说明清单
符号及缩写
意义
SVR
SupportVectorRegressor,支持向量回归算法
XGBoost
eXtremeGradientBoosting,极梯度增强算法
Bagging
Bootstrapaggregating,引导聚集算法
RF
RandomForest,随机森林算法
PSO
ParticleSwarmoptimization,粒子群算法
SHAP
SHapleyAdditiveexPlanations
PCA
principalcomponentsanalysis,主成分分析
Ceq
碳当量
r
线性相关系数
MAE
平均绝对误差
AETA
绝对误差阈值精确度
YS
屈服强度
TS
抗拉强度
EL
延伸率
1绪论样式:
b正文2级标题样式:
b正文3级标题
1.1课题背景样式:
b正文2级标题样式:
b正文3级标题
钢材以性能稳定、产量大和成本低的优点成为世界上应用最广泛的材料。
我国的钢材产量居世界前列,根据世界钢铁协会的数据统计,我国的钢铁产量在世界所占的比例在2005年为30.9%,2008年为37.75%,2012年将近全球总产量的一半,因此研究钢材领域的应用具有重要的现实意义。
H型钢因其断面与英文字母“H”相同而得名,其作为一种截面面积分配、强重比更加合理的经济断面高效型材而被广泛应用。
由于H型钢的各个部位均以直角排布,因此H型钢在各个方向上都具有抗弯能力强、施工简单、节约成本和结构重量轻等优点。
由于具有上述优点,如今H型钢主要用于:
各种民用和工业建筑结构;各种大跨度的工业厂房和现代化高层建筑,尤其是地震活动频繁地区和高温工作条件下的工业厂房;要求承载能力大、截面稳定性好、跨度大的大型桥梁、重型设备、高速公路、舰船骨架、矿山支护、地基处理和堤坝工程等各种机器构件[1]。
目前国内外约有20多个国家生产H型钢,其中日本新日铁、JFE和卢森堡阿贝尔贝德公司掌握着最高技术水平。
美国、日本及欧洲发达国家的H型钢消费量比例均高于中国,从某方面来说其映射了一个国家的建筑水平[2]。
1998年之前,中国的H型钢主要依赖于进口,随着马钢、莱钢H型钢生产线的建立逐渐缓解了这种情况,尽管在数量比例上我国增长迅速,但是H型钢的生产面临着同质化日益严重,技术水平严重不足的困境,依靠传统的经验式或半经验式的研发方法仍难以弥补和发达国家之间的差距。
1.2H型钢简介样式:
b正文2级标题
1.2.1H型钢的特点样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题
H型钢得名于其断面与英文字母“H”相似性,其拥有截面面积分配、强重比更加合理的特点,使其与普通工字钢比较,具有截面模数大、重量轻、节省金属的优点,因此H型钢被广泛应用于新型经济建筑用钢。
目前由于H型钢由于具有良好的机械性能和物理性能,被广泛用于机械设备、民房、桥梁等的建设中。
根据GB/T11263-2017《热轧H型钢和部分T型钢》[3],H型钢的规格标记采用:
高度H值×宽度B值×腹板厚度t1值×翼缘厚度t2值表示。
H型钢具有以下特点:
(1)H型钢比普通工字钢力学性能更好,相同单重时截面模数更大。
(2)H型钢在截面设计方面更加合理,同等受力载荷下耗费钢材更少,具有较大的经济效益。
(3)H型钢具有节约工时、加工方便、造型美观等诸多优点。
目前,由于H型钢具有上述的优点,在机械、铁路、桥梁、建筑等行业得到了广泛的应用。
1.2.2H型钢一般生产工艺样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题
根据目标要求及装备特点。
对于H型钢的生产应当首先确定生产流程工艺,目前H型钢常用的工艺流程如图1-1所示。
图1-1H型钢生产工艺流程示意图
总而言之,目前大多数现代化的H型钢厂都采用机械化自动控制[4],由于机械化自动控制有产品质量及时反馈以及多流程自动控制的优势,且拥有较高生产效率,较低的人力成本,因此现代化钢企普遍采用机械自动化控制。
1.2.3钢中不同成分作用机制样式:
b正文3级标题样式:
b正文2级标题样式:
b正文3级标题
H型钢常用的合金元素有Mn、Cr、Ni、Cu等8种元素,其中包含微合金化元素V、Ti、Nb等。
由于钢中的非金属夹杂物对钢的综合力学性能有较大的影响,因此我们要控制非金属夹杂物含量尽可能的低,因此就必须严格将P、S控制在较低的水平,但是非金属元素P、S在某些条件下也可以起到合金化作用[5]。
Mn元素在钢中的作用[6]。
通过加入Mn元素可以降低钢的Ms温度和增加了钢中的残留奥氏体;Mn元素具有脱氧脱硫的作用,但也容易形成夹杂物,进而降低了钢的韧性;Mn降低了奥氏体向铁素体转变所需的自由能,对于提高钢的淬透性有显著的作用;M