材料设计原理相关问题Word格式文档下载.docx
《材料设计原理相关问题Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《材料设计原理相关问题Word格式文档下载.docx(10页珍藏版)》请在冰豆网上搜索。
下面简要介绍归一化处理的原理与方法。
(1)什么是归一化?
数据归一化,就是将数据映射到[0,1]或[-1,1]区间或更小的区间,比如(0.1,0.9)。
(2)为什么要归一化处理?
<
1>
输入数据的单位不一样,有些数据的范围可能特别大,导致的结果是神经网络收敛慢、训练时间长。
<
2>
数据范围大的输入在模式分类中的作用可能会偏大,而数据范围小的输入作用就可能会偏小。
3>
由于神经网络输出层的激活函数的值域是有限制的,因此需要将网络训练的目标数据映射到激活函数的值域。
例如神经网络的输出层若采用S形激活函数,由于S形函数的值域限制在(0,1),也就是说神经网络的输出只能限制在(0,1),所以训练数据的输出就要归一化到[0,1]区间。
4>
S形激活函数在(0,1)区间以外区域很平缓,区分度太小。
例如S形函数f(X)在参数a=1时,f(100)与f(5)只相差0.0067。
(3)归一化算法:
一种简单而快速的归一化算法是线性转换算法。
线性转换算法常见有两种形式:
y=(x-min)/(max-min),其中min为x的最小值,max为x的最大值,输入向量为x,归一化后的输出向量为y。
上式将数据归一化到[0,1]区间,当激活函数采用S形函数时(值域为(0,1))时这条式子适用。
:
y=2*(x-min)/(max-min)-1。
这条公式将数据归一化到[-1,1]区间。
当激活函数采用双极S形函数(值域为(-1,1))时这条式子适用。
2.请详述蒙特卡罗方法中的基本思想、特点及其局限性?
就数学特性而言,蒙特卡罗方法的发展可以追溯到18世纪著名的蒲丰问题.1777年,法国科学家蒲丰(Buffon)提出用投针试验计算圆周率π值的问题.这里我们用蒲丰问题来初步说明蒙特卡罗方法的基本原理和解决问题的基本手续.
蒲丰问题是这样一个古典概率问题:
在平面上有彼此相距为2a的平行线,向此平面任意投一长度为2l的针,假定l<
a,显然,所投的针至多可与一条直线相交,那么,此针与任意条平行线相交的概率可以求出,由下面的分析可知,此概率与所取针长2l、平行线间距2a有关,并且包含有π值.在这里,任投一针的概率含义有以下三点:
(1)针的中点Ml在平行线之间等概率落入,即Ml距平行线的距离x均匀分布在区间[0,a]之内;
(2)针与线的夹角θ均匀分布在区间[-π/2,π/2]之内,(3)x与θ互相独立。
MC方法的基本思想是:
当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,并用它们作为问题的解。
MC方法通过抓住事物运动的几何数量和几何特征,利用数学方法来加以模拟,即进行一种数字模拟试验。
它是以一个概率模型为基础,按照这个模型所描绘的过程,将模拟试验的结果作为问题的近似解。
可以把MC解题归结为3个主要步骤:
构造或描述概率过程;
实现从已知概率分布抽样;
建立各种估计量。
此方法属于实验数学的分枝。
它是根据待求问题的变化规律,人为地构造出一个合适的概率模型,依照该模型进行大量的统计试验,它的某些统计参量,正好是待求问题的解。
这种计算方法通过计算机很容易实现。
MC法没有分子动力学中的迭代问题,也没有数值不稳定的情况,收敛性可以得到保证,即在粒子数无限趋近于无穷大的时候,收敛到解,但是否收敛到解要由所取模型的正确性决定。
MC法的收敛速度与问题的维数无关,这是它的优点,它的另一个优点是其误差容易确定。
而且,MC法的计算量没有分子动力学那样大,所需机时少。
MC方法特点:
与其他的数值计算方法相比,蒙特卡罗方法有这样几个优点:
(1)收敛速度与问题维数无关,换句话说,要达到同一精度,用蒙特卡罗方法选取的点数与维数无关;
计算时间仅与维数成比例.但一般数值方法,比如在计算多重积分时,达到同样的误差,点数与维数的幂次成比例,即计算量要随维数的幂次方而增加.这一特性,决定了对多维问题的适用性.
(2)受问题的条件限制的影响小.(3)程序结构简单,在电子计算机上实现蒙特卡罗计算时,程序结构清晰简单,便于编制和调试.(4)对于模拟象粒子输运等物理问题具有其他数值计算方法不能替代的作用.蒙特卡罗方法的弱点是收敛速度慢,误差大的概率性质.这一情况在解粒子输运问题中仍然存在.除此之外,经验证明,只有当系统的大小与粒子的平均自由程可以相比较时,一般在10个平均自由程左右,这方法算出的结果较为满意.而对于大系统深穿透问题,算出的结果往往偏低.对于大系统,其他数值方法往往很适应,能算出较好的结果.因此,已有人将数值方法与蒙特卡罗方法联合起来使用,克服这种局限性,取得了一定的效果.
MC方法的局限性:
随机数选择问题是蒙特卡罗方法的局限性。
在运用在运用蒙特卡罗算法求解定积分的解时,程序中的核心问题是随机数发生器的选用,选用不同的随机数发生器对定积分的计算结果有着不同的计算精度。
数学上,对重积分和定积分的传统计算方法是将复杂的重积分和定积分化简为类次积分,来求原函数和积分结果。
这种数学方法在理论上没有任何问题,但是在实际应用中,原函数难以得到,或者是原函数根本不能用初等函数来表示,而蒙特卡罗方法为此提供了一个新的途径,它是利用计算机的计算快速和计算高精度来模拟物理上的随机投点实验,最后通过概率计算来解决问题。
蒙特卡罗方法中的关键之处是随机数发生器的选用。
其选择共有三种方法:
(1)乘同余法:
这种方法在初始值给定时整个随机数数列就已经确定,但是整个随机数数列仍具有随机特性。
人们通过大量的研究发现可通过选择恰当的数值使得乘同余法的周期可以达到满周期。
(2)VENDER法。
(3)取小数法:
其原理是将前一次随机数平方后的数,取其小数点后第一个非零数字后面的尾数作为下一个所求随机数。
此算法简单易读,除初值外,没有其他参数,并且计算过程与初值的取值关系不大,几乎可以取所有的非负有理数和非平方数(即该数的开根是无理数);
只要取得一个适当的种子,该算法所得到的随机数序列就具有周期长,不易退化,统计性质好的优点。
通过随机数发生器对蒙特卡罗算法求解定积分的影响的比较试验,得到了可以满足模拟要求的随机数发生器----乘同余法
3.请详述什么叫基组,slater轨道,Gauss轨道?
基组是分子中分子轨道的数学描述,可解释为把电子限制到特定的空间区域里。
从头算方法中的基函数,应具备如下条件:
(1)它是一个完备集合,可由它们线性组合得到任意的分子轨道;
(2)与被描述的分子或原子体系有正确的近似关系,这样可用较少的基函数来较精确地描述分子轨道;
(3)由这组基函数系定义的分子积分,特别是多中心电子积分容易计算,随后进行的自洽迭代收敛比较快。
原子轨道基函数,即基组。
STO-GTO系基组,STO即Slater型轨道;
GTO即GAUSS型轨道。
STO-GTO基组是以STO作为自洽场的基函数,而每个STO用若干个GTO来逼近。
解出的分子轨道仍用STO的线性组合来表示,而GTO不作为原子轨道,仅作为中间数学工具。
常用基组:
(1)极小基组,或STO-3G,3G表示3个高斯函数。
STO-3G基组是规模最小的压缩高斯型基组。
STO-3G基组用三个高斯型函数的线性组合来描述一个原子轨道,对原子轨道列出HF方程进行自洽场计算,以获得高斯型函数的指数和组合系数。
STO-3G基组规模小,计算精度相对差,但是计算量最小,适合较大分子体系的计算。
(2)劈裂价键基组(3-21G、4-21G、4-31G、6-31G、6-311G等)。
如6-311G所代表的基组,每个内层电子轨道是由6个高斯型函数线性组合而成,每个价层电子轨道则会被劈裂成三个基函数,18分别由3个、1个和1个高斯型函数线性组合而成。
劈裂价键基组能够比STO-3G基组更好地描述体系波函数,同时计算量也比最小基组有显著的上升需要根据研究的体系不同而选择相应的基组进行计算。
(3)极化基组[6-311G**或6-311G(d,p)]。
劈裂价键基组对于电子云的变型等性质不能较好地描述,为了解决这一问题,方便强共轭体系的计算,量子化学家在劈裂价键基组的基础上引入新的函数,构成了极化基组。
所谓极化基组就是在劈裂价键基组的基础上添加更高能级原子轨道所对应的基函数,如在第一周期的氢原子上添加p轨道波函数,在第二周期的C原子上添加d轨道波函数,在过渡金属原子上添加f轨道波函数等等。
这些新引入的基函数虽然经过计算没有电子分布,但是实际上会对内层电子构成影响,因而考虑了极化基函数的极化基组能够比劈裂价键基组更好地描述体系。
极化基组的表示方法基本沿用劈裂价键基组,所不同的是需要在劈裂价键基组符号的后面添加*号以示区别
(4)弥散基组[6-311G+(d,p),6-311G++(d,p)]。
弥散基组是对劈裂价键基组的另一种扩大,它允许轨道占据更大的空间,这样的基组可以用于非键相互作用体系的计算。
对于弱相互作用体系(如吸附、氢键等)、有孤电子对的体系、负离子体系、共轭体系和激发态体系,使用弥散函数会使分子结构得到较优的描述。
如6-311G+(d,p)基组是在6-311G(d,p)基础上对重原子添加弥散函数,6-311G++(d,p)则是在6-311G+(d,p)的基础上对氢原子添加弥散函数。
不过根据计算的结果,氢原子上是否添加弥散函数对计算的精度影响不大。
(5)高角动量基组[6-31G(2d),6-311++G(3df,3Pd)]。
现在使用的更大的基组,是在分裂基组基础上增加多个角动量。
比如6-31G(Zd)就是在6-31G基础上增加两个d轨道的函数,而6-311++G(3df,3Pd)则增加了更多的极化函数,包括三个分裂的价键基组,在重原子和氢原子上增加的弥散函数,在重原子上增加的三个d函数和一个f函数,在氢原子上增加的三个p函数和一个d函数。
这些基组一般不用于HF计算。
(6)双Zeta基组(D95,D95V)。
对每个轨道都用两个STO逼近,内层轨道取较大的n值(为了逼近歧点性质),外轨道取较小的n值
(7)第三周期以后原子的基组(LANL2D2)。
第三周期以上原子的基组很难处理。
由于存在非常大的核,原子核附近的电子通过有效核电势方法(膺势场ECP)进行了近似,这一处理,同时也包含了相对论效应。
这其中,LANL2D2是最有名的基组,它对第一行原子是D95V,对Na-Bi是LosAlamosECP加上DZ。
(8)Dunning相关一致基组。
cc-pVDZ,cc-pVTZ,cc-pVQZ,cc-pV5Z,cc-pV6Z,分别为双-zeta,三-zeta,四-zeta,五-zeta,和六-zeta,为了提高计算效率,这些基组删除了多余的函数并进行了旋转,这些基组可以通过给基组关键字添加AuG-前缀来增加弥散函数。
在实际的量化计算中,很少真正使用Slater行列式表示体系波函数,而一般采用有限基组(basicset)表示波函数(或轨道)。
原子轨道可以线性组合成分子轨道,但在实际的量化计算中,往往不是采用真正的类氢离子波函数作为原子轨道,而是采用一组基函数用于线性组合分子轨道:
采用类氢离子波函数作为基函数,在进行分子轨道计算时,由于径向部分的关联Laguerre多项式积分难以计算,迭代收敛很慢,并不适用于实际计算。
实际量化计算中,经常使用的基函数主要有两种类型,一种是Slater型轨道(Slatertypeorbital,1STO),另一种是Gaussian型轨道(Gaussiantype
orbital,1GTO)。
这两种类型的基函数各有特点,但GTO的使用范围较STO更为广泛。
在量化计算中,由于类氢离子波函数的技术瓶颈在径向函数部分,所以Slater对其加以改造,提出了新的径向函数,称为STO:
其中ξ是轨道指数,r为电子到该STO所在核的距离,n为主量子数。
采用STO可以大大减少计算积分时数学处理的复杂性。
但是,与类氢离子波函数不同,STO没有径向节面,所以单一的STO不能很好地逼近原子轨道,必须采用STO的线性组合,才能更好地拟合原子轨道:
一般3-5个不同ξ的STO能很好描述一个原子轨道但实际计算中一般只有2-3个。
在r趋近无穷大和r趋近0时,STO具有正确的波函数渐近行为,但STO也有一个重大的缺点:
在多原子分子中,大量的3中心和4中心积分难以解析求算。
针对这种情况,Boys在1950年提出使用Gauss函数(GTO)。
GTO可写为笛卡尔坐标的形式:
其中l是轨道指数,r为电子到该STO所在核的距离,x,y,z为笛卡尔坐标。
;
GTO与STO的差别在于指数函数
和
。
GTO只有1s,没有2s和3s,而p型函数也只有2p,没有3p和4p等,即GTO与原子轨道没有一一对应关系。
GTO的优点在于很容易分离变量,并且积分方便,可以将3中心和4中心积分化作双中心积分,最后化作单中心积分来处理,从而使多电子分子体系中的许多问题得以解决。
正是因为使用GTO具有计算上的优势,当今的绝大多数量化计算都是在GTO下进行的。
目前,在主流的商业量化软件中,都收集了许多基组,其中大多数是采用GTO的基组,例如价层劈裂基组3-21G、6-31G等。
在基组中,一个基函数代表一个轨道。
小基组中的基函数数目比较小,而大基组中基函数的数目大,但是无论采用大基组还是小基组,占据轨道数是固定不变的,而空轨道的数目随着基组的增大而增多。
从数学上严格讲,应包含所有可能的原子轨道,但太复杂,所以用一些主要的占有轨道和价轨道,称为有限基组。
使用有限基组进行量化计算,必然会带来一定的误差,这种误差一般随着基组的增大而减小,所以,一般而言,基组越大,计算结果越接近真实,但计算的困难也越大(积分数目与基组数目n4成正比),所以在实际计算中要在计算效率和计算精度二者之间取平衡。
4.请说出你所了解的材料设计方法(有几种),这些方法的特点和使用对象,并对其中一种方法进行详述。
答:
共八种方法,后面一部分详述了材料设计专家设计系统
1.经验法。
该方法是根据大量的试验数据,对成分-组织-性能反复调整、试验,直到获得满意的材料为止。
这种方法具有相当大的盲目性,费时、费力、经济损失大,此外,为了总结出材料的成分-组织-性能间的内在规律,常用统计学法对试验数据反复回归,得到一些回归方程,这些关系式对材料的研究、应用起到了一些积极作用。
但是,这些关系式都是在一定的生产条件下建立起来的,它仅适用于相应的生产条件;
再者,由于材料的制备过程是一个复杂的非线性系统,显然利用线性函数来考虑性能、组织和成分的这些关系式不是很理想的。
2.半经验法。
这种设计方法的基本原理是从已有的大量数据和经验事实出发,将材料的性能、组分等数据存放在数据库中,利用一些数学计算来完成材料设计。
典型的材料数据库是日本工程中心自1996年开始建立的LPF数据库,该库涵盖了合金、金属间化合物、陶瓷、矿物等全部无机物材料的有关信息。
在LPF数据库的基础上可建立一个知识-信息体系,通过计算有效地预测、开发新材料。
常用的有热力学方法,即利用材料的一些特征数据(如自由能、扩散系数等)预测材料的性能;
还可利用能带理论来设计一些合金元素在金属间化合物中的作用,以及利用量子力学理论计算合金的相结构等。
3.第一原理法。
第一原理法就是把由多粒子构成的体系理解为由电子和原子核组成的多粒子系统,并根据量子力学的基本原理最大限度的对问题实现“非经验性”处理。
第一原理的出发点是求解多粒子系统的量子力学薛定谔方程,在实际求解该方程时采用两个简化:
一是绝热近似,即考虑电子运动时原子核是处于它们的瞬时位置上,而考虑原子核的运动时不考虑电子密度分布的变化,将电子的量子行为与离子的经典行为视为相对独立;
第二个假设是利用哈特利-福克自洽场近似将多电子的薛定谔方程简化为单电子的有效势方程。
事实上,基于第一原理的计算方法发展较快,如密度泛函理论(DFT)、准粒子方程(GW近似)方法等。
现在应用最广泛的是密度泛函理论,它是将多电子系统简化成单电子系统,该理论认为系统基态物理性质是由其电子密度唯一确定的。
在实际计算过程中,为了解决交换能与关联能的计算,常采用局域密度近似(LDA),即将非均匀电子系统分割成一些小块,在这些小块中认为电子气是均匀的,这样,子块中的交换关联能只取决于该处的电子密度。
虽然LDA取得了较好的计算效果,但也有不合理的计算结果,有待进一步完善。
4.分子动力学法。
分子动力学(MD)是从原子尺度上来研究体系的有关性质与时间和温度关系的模拟技术,它把多粒子体系抽象为多个相互作用的质点,通过对系统中的各质点的运动方程进行直接求解来得到某一时刻各质点的位置和速度,由此来确定粒子在相空间的运动轨迹,再利用统计计算方法来确定系统的静态特性和动态特性,从而得到系统的宏观性质.在计算中首先要确定势能函数,最简单的是双体势模型,一般就用Lennard-Jones势,即原子间作用势只与两个原子间距有关,而与其他原子无关。
复杂的模型有镶嵌原子法(EAM),它是基于LDA得到的多体势,势能函数不仅与两个原子间距有关,还与基体有关。
分子动力学模拟方法也较多,如恒压分子动力学方法、恒温分子动力学方法和现在应用较广泛的第一性原理分子动力学方法,后者不仅可以处理半导体问题和金属问题,还可用于处理有机物和化学反应。
但是,分子动力学法模拟程序较复杂,计算量也较大。
5.蒙特卡罗法。
蒙特卡罗法(MC)也称随机抽样技术或统计试验方法,是以概率论和数理统计学为基础,通过统计试验来实现目标量的计算。
蒙特卡罗方法的基本思路是求解数学、物理化学问题时,将它抽象为一个概率模型或随机过程,使得待求解等于随机事件出现的概率值或随机事件的数学期望值,事实上,随机模型并没有改变多体问题的复杂本质,它只是提供了一种处理问题的有效方法,因此利用该方法研究粒子的瞬时分布和宏观量是很接近实际的。
其中在统计物理学上,将宏观量看成是相应微观量在满足给定宏观条件下系统所有可能在微观状态上的平均值,因此它主要研究的是平衡体系的性质。
此外,MC法关键问题是抽样方法以及要有足够多的样本。
6.有限元法。
有限元法是一种常规的数值解法,它是将连续介质采用物理上的离散与片分多项式插值来形成一个统一的数值化方程,非常方便计算机求解。
该方法实质上是完成两个转变:
从连续到离散和从解析到数值,因此可解决大多数力学问题、凝固模拟和晶体的塑性模拟等。
有限元法与细观力学和材料科学相结合产生了有限元计算细观力学,它主要研究复合材料中组分材料间的相互作用力和定量描述细观结构与宏观性能间的关系。
然而,有限元法由于是连续体的近似,它不能严格的包含单个晶格缺陷的真正动力学特性,而且在该尺度上大多数的微观结构演化现象是高度非线性的。
为克服这一困难,通常采用带有固态变量的状态量方法,该方法对于完成宏观和介观尺度上的模拟是非常有效的。
7.材料设计专家系统。
在长期的研究中,虽然对材料的设计积累了一定的理论知识,但是由于材料制备过程中不确定、复杂因素的影响,使得对一些材料的成分、工艺与性能间的内在关系不甚了解,存在许多经验知识,因此材料设计专家系统应运而生。
材料设计专家系统就是依靠专家的经验知识,建立材料设计的知识库和数据库,使系统具有逻辑推理能力,从而缩短材料设计周期,提高效率。
专家经验知识的获取是一个关键环节,通过对专家经验知识的归纳总结形成知识库和数据库以及形成解决问题的方法(即推理机)。
数据库中存放有关材料的物理性能等指标,知识库中用来存放材料的成分—工艺—性能等规则,推理机根据数据库和知识库所提供的信息得出材料应具有的化学成分和工艺参数。
8.人工神经网络系统。
材料设计涉及材料的组分、工艺、性能之间的关系,但这些内在的规律往往不甚清楚,难于建立起精确的数学模型。
人工神经网络具有很强的自学习能力,能够从已有的试验数据中获取有关材料的组分、工艺和性能之间的规律,因此特别适用于材料设计,为材料的研究提供了一条有效的新途径。
它不需要预先知道输入(材料的成分、工艺)和输出(性能要求)间存在的某种内在联系,便可以进行训练学习,并达到预测的目的,这是材料设计中其它方法难以比拟的。
若设计目标(如力学性能等)可用Y=〔Y1Y2·
·
Ym〕T(Y∈Rm)表示,其相关因素(如化学成分、显微组织等)用X=〔X1X2·
Xn〕T(X∈Rn)表示,目的就是要找出一个从Rn到Rm的映射关系,使得Y=F(X)。
由于该映射为非线性映射,各相关因素对设计目标的比重不同,故可用BP网络解决该问题。
BP网络的可靠性、应用性已在广泛使用中得到证实。
相关因素与BP网络的输入层对应,它可以是材料的成分、各种工艺条件等;
隐含层的神经元是模拟人工神经网络计算过程建立起来的,它能将各种材料的化学成分和工艺参数等数据抽象到较高层次的概念上,使神经网络具有非线性分类的能力;
BP网络通过前向计算可得到输出层的输出数据,该数据则与设计目标相对应;
BP网络的权值以数据文件的方式存储,其数值根据BP网络的实际输出与期望输出的误差值利用反向传播学习算法来修正。
材料设计专家系统:
专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。
也就是说,专家系统是一个具有大量的专门知识与经验的程
序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。
长期以来,材料研究采用的是依赖大量实验、进行大面积筛选的方法,要消耗大量人力、物质资源和时间,并且由于诸多