相关数学模型.docx
《相关数学模型.docx》由会员分享,可在线阅读,更多相关《相关数学模型.docx(14页珍藏版)》请在冰豆网上搜索。
相关数学模型
1.数学模型:
对于一个现实对象,为了一个特定的目的,根据其内在规律,作出必要的简化假设,运用适当的数学工具,得到的一个数学结构。
2.选煤数学模型:
是将选煤实际应用问题转化为数学问题的形式,并利用计算机求解,给出其近似最优的解法,然后对结果加以分析、检验、讨论和推广
3.物理模型主要指科技工作者根据与原型相似的原理构造的模型。
思维模型指人们通过对原型的反复认识,获得的知识以经验的形式直接储存于大脑中,并根据思维或直觉做出相应的决策。
4.数学模型的分类:
根据来源分类:
a.理论模型:
根据实体的物理和化学性质,通过分析推导出来的模型b.经验模型:
指不考虑实际内部的变化,只着重于外部的关系,把收集到的输入和输出观测值,用数理统计的方法,导出输入、输出变量之间的关系,建立数学模型c.综合模型:
模型结构来自理论分析,但其中的某些参数未确定,需要收集现场生产数据或通过试验用数学方法来确定
根据模型中变量和时间的关系分类:
a.稳态模型:
单纯反应生产过程变量之间的因果关系,不考虑时间影响。
b.动态模型:
生产过程中各变量的状态是随时间而变化的,此时各输入输出量之间的数学关系可以用微分方程或积分方程进行描述。
根据模型中变量的的性质分类:
a.确定性模型:
自变量与因变量自身之间的关系都是确定的。
b.随机模型。
全部或部分变量是随机变量,变量之间的关系不是确定性的函数关系,而是随机变化的相关关系。
根据模型的基本关系:
分线性模型和非线性模型
根据变量的连续性,分成离散模型和连续模型。
5.建立数学模型方法:
机理分析方法:
根据对客观事物特性的认识,找出反映内部机理的数量规律
测试分析:
将对象看作“黑箱”通过对测量数据的统计分析,找出与数据拟合最好的模型
二者结合:
用机理分析建立模型结构,用测试分析确定模型参数
6.数学建模一般步骤:
模型准备:
了解实际背景,明确目的,搜集信息;
模型假设:
针对问题特点和目的,作出合理的、简化的假设;
模型构成:
用数学的语言、符号描述问题;
模型求解;
模型分析:
误差分析、统计分析等;
模型检验:
检验模型的合理性、适用性;
模型应用
7.经验模型的建立:
试验数据的整理:
在建模前需要进行检查和取舍;
模型形式的确定:
应该切合实际,可以根据专业知识,实际经验和试验所取得的数据来决定;
模型参数的估计:
公式中的常数和系数还需要确定,最小二乘法、回归分析或最优化方法;
模型的检验:
以模型的计算值与实测值相差多少为标准。
多次试验,反复修改。
8.随机变量:
设随机试验空间是S={e}.如果对于每一个e∈S,有一个实数X(e),与之对应,这样就得到一个定义在S上的实值单值函数X(e),称为随机变量
9.离散型随机变量:
随机变量所取的可能值是有限多个或无限可列个连续型随机变量:
随机变量所取的可能值可以连续地充满某个区间
10.众数:
指使得频率函数或密度函数达到极大值的点。
具体说,当X为离散型随机变量时,若Pi>Pj对于一切i≠j成立,则称xj为X的众数。
当X为连续型随机变量时,若f(x0)=maxf(x)则称x0为X的众数。
11.分位数中位数:
给定常数0
12.数学期望:
设随机变量X有分布函数F(x),定义其数学期望为E(x)=[+∞]S[-∞]xdF(x),对于离散型随机变量E(x)=[n]E[i=1]xipi,i=1,2,3…n;连续型随机变量E(x)=[+∞]S[-∞]xf(x)dx
13.方差、标准差:
设X是一个随机变量,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X的方差,记为D(X)或Var(X),称根号“D(X)”为标准差或均方差,记为σ(X)。
方差与标准差均是用来刻画随机变量围绕均值的散布程度的量。
当方差数值小时,说明随机变量的取值就集中在均值附近,反之,随机变量的取值向均值左右两边散开。
14.数学期望的性质:
设C是常数,则E(C)=C,若C是常数,则E(CX)=CE(X);E(X1+X2)=E(X1)+E(X2);设X、Y独立,则E(XY)=E(X)E(Y);
15.方差的性质:
设C是常数,则有D(C)=0
设X是一个随机变量,C是常数,则有D(CX)=C^2*D(X),D(X+C)+D(X)
设X,Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(Y))}
D(X)=0↔P(X=C)=1,C为常数
16.偏度系数:
设分布函数F(x)有二阶中心矩u2和三阶中心矩u3,其偏度系数为r1=u3/[(u2)3/2],偏度系数是一个无量纲的量,它刻画分布函数的对称性。
当r1=0时,分布函数对称;当r1>时,概率分布偏向均值的右边,反之,则偏向左边。
17.峰度系数:
设分布函数F(x)有二阶中心矩u2和四阶中心矩u4,其峰度系数为r2=u4/(u22)-3。
峰度系数r2是一个无量纲的量,它用来刻画不同类型的分布函数的集中和分散程度。
对于单峰分布,r2越小,说明密度函数形状越“陡峭”r2越大密度函数形状越“平缓”。
正态分布峰度系数r2=0,一个对称分布,其峰度系数越接近于9,越接近正态分布。
18.正态分布:
设连续型随机变量X的概率密度为
19.其中,u,σ(σ>0)为常数,则称X服从参数为u,σ的正态分布,记为X~N(u,σ2)。
期望方差:
E(X)=u,D(X)=σ2。
特征:
曲线关于x=u对称;
当x=u时,f(x)取得最大值;
当x→±∞时,f(x)→0;
曲线在x=u±σ处有拐点;
曲线以x轴为渐近线;
当固定σ,改变u的大小时,f(x)图形的形状不变,只沿x轴平移;
固定u改变σ大小时,f(x)图形的对称轴不变形状变,σ越小图形越高瘦,σ越大图形越矮胖。
20.标准正态分布:
正态分布N(u,σ2)中的u=0,σ=1时,这样的称为标准正态分布
21.对数正态分布:
一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布。
22.3σ法则:
服从正态分布N(u,σ2)的随机变量X落在区间(u-3σ,u+3σ)内的概率为0.9974,落在该区间外的概率只有0.0026即X几乎不可能在区间之外取值
23.X2分布:
设X1X2…Xn相互独立,同N(0,1)分布的随机变量定义Q=[n]E[i=1]xi2则Q的分布称具自由度n的X2分布,记Q~X2(n)。
X2(n)的特征数为E(Q)=n,Var(Q)=2n,r1=2*20.5/n0.5,r2=12/n
24.t分布:
设X~N(0,1),Q~X2(n),且X与Q相互独立,记T=X/(Q/n)0.5,则T的分布称为具自由度n的t分布,记作T~t(n)。
t(n)的密度函数曲线也是一个对称曲线,且n越大,t(n)的曲线越接近于N(0,1)。
t(n)的特征数为:
E(T)=0,Var(T)=n/(n-2)(n>2),r1=0,r2=6/(n-4)
25.F分布:
设Q1~X2(n1),Q2~X2(n2)且Q1与Q2相互独立,记F=(Q1/n1)/(Q2/n2),则F的分布称为具自由度(n1,n2)的F分布,记住F~F(n1,n2);期望方差:
E(F)=n2/(n2-2),(n2>2);Var(F)=2n2^2*(n1+n2-2)/[n1(n2-2)^2*(n2-4)],(n2>4)。
F分布常用于
检查两个正态分布间方差的显著性差异。
检验方差分析中某个因素是否对指标有显著作用。
26.泊松分布:
设X~π(λ),且分布律为P{X=k}=λk/k!
*e^-λ,k=0,1,2…,λ>0;期望方差均为λ
27.指数分布:
设随机变量X服从指数分布,其概率密度为f(x)={1/θ*e^(-x/θ),x>0;0,x≤0}其中θ>0。
指数分布的期望和方差分别为θ和θ^2
28.威布尔分布:
设随机变量X有分布密度函数w(x,α,β,δ)={(α/β)(x-δ)α-1e^-((x-δ)α/β),x≥δ;0,x<δ},称X服从威布尔分布,并记成X-W(α,β,δ)
29.若吉斯蒂克分布:
设随机变量X有分布密度函数L(x,α,β)=1/[1+exp(-(x-α)/β)];β>0,-∞<α<∞,-∞β数值越小,曲线越陡,β数值越大,曲线越平缓。
特征数:
E(X)=α,Var(X)=π2β2/3,r1=0,r2=1.2
30.样本:
为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息。
所抽取的部分个体称为样本
31.拒绝域与临界点:
当检验统计量取某个区域C中的值时,我们拒绝原假设H0,则称区域C为拒绝域,拒绝域的边界点称为临界点
32.区间估计:
设θ为一维未知数,^θ1和^θ2为两个统计量,满足^θ1≤^θ2,用区间[^θ1,^θ2]去估计θ存在的范围,称为θ的一个区间估计。
33.置信区间、置信度:
设[^θ1,^θ2]为θ的一个区间估计,若对给定的正数1-α及θ的任一可能值θ’有P(^θ1≤θ'≤^θ2)≥1-α;则称[^θ1,^θ2]为θ的一个置信水平为1-α的置信区间。
而α称为置信度或显著性水平。
34.置信上下限:
设θ为未知参数,1-α为给定的置信水平,若统计量-θ和θ分别满足P(-θ≤θ)≥1-α;P(θ≤-θ)≥1-α,则称-θ和-θ为θ的置信水平1-α的置信上(下)限
35.假设检验:
就是根据样本对所提出的假设作出判断:
是接受,还是拒绝。
36.原假设与备择假设:
假设检验问题通常叙述为:
在显著性水平α下,检验假设H0:
u=u0,H1:
u≠u0,H0称变回原假设或零假设,H1称为备择假设。
37.两类错误:
当原假设H0为真,观察值却落入拒绝域,而作出了拒绝H0的判断,称做第一类错误,又叫弃真错误,第一类是拒绝一个正确的假设;当原假设H0不真,而观察值却落入接受域,而作出了接受H0的判断,称做第二类错误,又叫取伪错误,第二类是接受一个错误的假设
38.检验的一般步骤:
根据经验,对研究中的代表试验模型的总体分布做出假设,如正态等。
确定原假设和被择假设。
选取统计量Z。
确定统计量Z的分布。
给定显著性水平α。
确定拒绝域|u|≥uα/2,或u≤uσ,u≥uα(由给定的显著性水平查统计量Z概率分布表确定)。
根据试验数据,计算统计量Z的值。
作出决策:
若统计量落在拒绝域内,择拒绝原假设H0,反之则接受H0
39.回归分析:
利用统计方法研究变量之间的相关关系称回归系数:
回归方程中常数项或者各自变量对应的系数叫做回归方程的回归系数
40.回归系数的确定:
回归系数的确定采用最小二乘法,即在精确度相等而误差呈正态的许多试验数据中求得最优概值的方法,其判断标准为各数据的偏差平方和为最小。
41.模型显著性检验:
就是检验拟合所得的逼近函数对被逼近的离散函数的表示能力,这可通过对逼近函数的统计检验来判断。
对于线性最小二乘法,常用的检验方法有方差分析和残差分析。
42.
曲线的直线化回归:
用试验数据绘制散点图,结合专业知识和经验选择适宜的函数,再将函数线性化,同时将原始数据也按同样方式进行转换。
用线性回归方法对转换后的试验数据进行回归,求得回归系数和线性回归相关系数。
对线性回归系数进行转换,得到曲线函数的回归系数,计算曲线的回归精度和相关系数
43.高斯消元法的步骤:
划方程组为矩阵
扩展矩阵
变换矩阵(从第一列开始,每一步将该列主对角线上的元素变位1,该列其他元素变为0)
44.多项式回归如何判断项数:
简单的方法可以根据试验绘制散点图,通过其形状欠缺的多项式的项数:
当曲线只有一个极大或极小值时,可以选择二次抛物线;当曲线即有极大又有极小值时,可以选择三次或三次以上抛物线。
差分判别的原则,若p阶差分是常数,p+1阶差数为0时,则函数是p阶多项式
45.模型参数的估计方法:
当选择多项式时,进而即使是二次抛物线y=b0+b1x+b2x2也不能转换成线性关系,用一元线性回归的方法求出模型参数。
但同样可以用最小二乘法,建立方程组,求出模型参数。
46.多元线性回归:
当遇到多个自变量,一个因变量,且每个自变量和因变量之间均为线性关系时,可以用多元线性函数来表示:
y^=b0+b1x1+b2x2+…+bpxp;对比多元线性函数和一元多项式的表达式,可以发现多元线性函数是自变量下标在变化,而多项式是自变量的幂次在变化,若将多项式的幂次移到下标位置时,即将每个幂次看作一个新的自变量,则一元多项式就转化为多元线性函数式。
47.复相关系数:
借鉴相关系数的概念来评价多元线性回归方程的显著性,由于是与多个自变量之间的相关关系所以称复相关系数:
R=(U/lyy)^0.5=(1-Q/lyy)^0.5
48.回归方程显著性检验方法:
复相关系数:
类似于一元线性回归分析,总偏差平方和仍可以分解成剩余平方和以及回归平方和。
lyy=[N]E[i=1](yi--y)^2=U+Q;回归平方和:
U=[N]E[i=1](^yi--y)^2=[p]E[k=1]bklky;借鉴相关系数的概念来评价多元线性回归方程的显著性,复相关系数:
R=(U/lyy)^0.5=(1-Q/lyy)^0.5;当|R|近于1时,说明因变量与诸个自变量组成的线性方程线性关系密切,反之线性关系不密切甚不存在
49.F检验:
总平方和lyy的自由度为N-1,回归平方和的自由度等于自变量个数p,则剩余平方和的自由度等于N-p-1。
平方和除以它相应的自由度称为均方。
在满足矩阵X满秩与假设H0(y与诸x之间无线性关系)成立的条件下,回归均方U与剩余均方Q相互独立,构成F=
(U/P)/[Q/(N-p-1)];服从第一自由度为p,第二自由度为N-p-1的F分布。
对于结定的置信度α,相应的自由度p和N-p-1,可查F分布表,得到Fα。
如果F>Fα,否定原假设,即认为y与诸x之间存在线性关系,回归方程具有实际意义;反之则接受原假设,y与诸x之间无线性关系。
50.剩余均方差:
剩余平方和除以它相应的自由度
51.偏回归平方和:
若从自变量总数中去掉一个自变量xk,回归平方和会减小,而回归平方和减小的程度越大,说明被去掉的自变量在回归模型中起的作用越大。
取消一个自变量后回归平方和的减少值称y对这个变量的偏回归平方和pk
52.何进行逐步回归:
逐步回归方法可分为逐步增元和逐步降元。
逐步增元基本思想是从众多的自变量中,按显著性大小逐次将自变量选入回归方程。
每次引入一个最显著的变量的同时剔除一个最不显著的变量,持续直到回归方程中再没有可剔除的变量,也没有可再引入的变量为止,最后得到最优回归方程。
计算步骤:
按对所有变量线性回归的思路,建立系数矩阵。
用相关系数对系数矩阵进行转换。
变量的取舍。
结果转换。
此时,对标准回归系数和相应的平方和进行转换。
逐步降元回归的基本思想是先将所有的自变量全部引入到回归方程中,然后对所有的自变量都进行显著性检验,再将其中最小且低于某一临界值Fa的自变量从方程中剔除。
然后重新建立回归方程,重复上面步骤,直到所有自变量均显著为止,最后得到最优回归方程。
计算量较大,但不漏掉有显著影响的自变量。
53.非线性回归思想原理:
非线性回归用最小二乘法,就是按原给定的函数形式来拟合试验数据,求出剩余平方和最小时的模型参数。
当参数估计的判别式—剩余平方和确定后,求参数便转化为求相应的目标函数的最小值,这就成了一个多元函数求极值的问题。
54.高斯牛顿法:
把非线性函数在一局部范围内进行泰勒级数展开,作为原函数的线性近似式,用线性回归的方法,求得参数的近似解,以新的解作为作为新的起点,重复计算,直到逼近真正的解。
55.插值定义:
设函数y=f(x)在区间[a,b]上连续,且已知其在a≤x1如有代数多项式Pn(x),在点xi处满足Pn(x)=yi,i=0,1,2,...,n则称Pn(x)为函数y=f(x)的插值多项式点x0,x1,x2,...,xn称为插值节点,[a,b]称为插值区间,y=f(x)表格函数称为被插值函数。
56.插值法基本思想:
构造一个简单函数y=p(x)作为f(x)的近似表达式,利用y=p(x)求f(x)得近似值,通常p(x)取代数多项式。
57.插值与回归的区别:
插值进过所有点,回归不一定经过所有点,回归的离差平方和最小
58.拉格朗日通式:
p(x)=[n]E[i=1]yili(x);附
59.牛顿基本插值公式:
当结点为不等距时f(x)=f(x0)+(x-x0)f[x0,x1]+(x-x0)(x-x1)f[x0,x1,x2]+…+(x-x0)(x-x1)…(x-xn-1)f[x0,x1,…xn]+“(x-x0)(x-x1)…(x-xn)f[x0,x1,…xn,x]”;记Nn(x)=前面,En(x)=“”
60.牛顿基本插值与拉格朗日插值的区别:
拉格朗日插值多项式形式对称,计算L(x)依赖于全部基点,若算出所有L(x)后又需要增加基点,则必须重新计算。
但牛顿插值则不需要,如果增加1个结点时,前n项的系数保持不变,从而减少了计算量。
因此,Newton插值比Lagrange插值方便。
61.差商:
又称为均差,设函数f(x)在互异的点x0,x1,x2,…x0处的函数值分别为f(x0),f(x1),f(x2)…f(xn)。
则f[x0,xk]=f(xk)-f(x0)/(xk-x0)为函数f(x)关于点x0,xk的一阶差商。
f[xo,x1,xk]=f(x0,xk)-f(xo,x1)/(xk-x1)为函数f(x)关于点x0,x1,xk的二阶差商。
f[x0,x1,…,xk]=[f(x0,x1,…xk-2,xk)-(x0,x1,…xk-2,xk-1)]/(xk-xk-1)为函数f(x)关于点x0,x1,…xk的k阶差商。
62.差分:
已知函数f(x)在等距结点xk=x0+kh(k=0,1,2,...n)处的函数值分别为f(xk)=fk,常熟h称为步长,定义Δfk=f(xk+h)-f(xk)=fk+1-fk为函数f(xk)在点xh处步长为h的一阶差分。
m阶差分为Δmfk=Δm-1fk+1-Δm-1fk,m=2,3…;规定0零阶差分Δ0fk=fk
63.埃尔米特插值:
对于在n+1个结点x0,x1,x2,…,xn上,分别取给定的函数值y0,y1,y2,…,yn和导数值y’0,y’1,y’2,…y’n。
要求一个插值函数p(x)在结点xk处,不仅与被差函数f(x)的函数值相等,而且与其导数相等,即p(xi)=yi,p’(xi)=y’i,i=1,2,…,n能满足这种要求的插值多项式称为埃尔米特插值多项式。
当r=n时,埃尔米特插值多项式为:
分段三次埃尔米特插值多项式为:
64.线性插值:
利用离散数据中的任意两点,建立一次插值多项式,这种方法称为
65.抛物线插值:
利用其中任意三点,建立二次插值多项式,这种方法称为。
高阶插值:
如果全部利用N+1点,建立N次多项式,则称为。
66.样条插值:
顺次选取三点,建立彼此有联系的三次多项式的差值方法
67.各种插值法的缺点:
①Hermite插值与L-插值(牛顿插值)高次插值出现龙格现象②分段插值分段线性插值在节点处不一定光滑③分段Hermite插值导数值不容易找到
三次样条插值(先由函数值确定导数值,再由分段Hermite插值解决问题)
68.单变量非线性方程的数值解方法:
二分法:
取(a,b)中点x0=(a+b)/2,将区间分成两半,则解落在其中之一,按照f(a)*(b)<0判断解落在哪个区间,若在(a,x0)以x0代替b,反之以x0代替a重新计算中点,n次计算后区间长度为起始的1/2^n,当n趋于无穷,区间长度趋于一点x*,f(x*)→0,x*为方程解。
牛顿法:
将非线性方程通过泰勒级数转化为近似的线性方程,然后迭代求解。
迭代公式:
xk+1=xk+f(xk)/f’(xk)。
弦位法:
为了避免使用导数,用前两次的迭代值计算差商替代导数,其余步骤与牛顿法相同;
逐步搜索法:
在给定的区间(a,b)内,若f(a)与f(b)异号,则(a,b)内至少有一实根。
按从小到大(或大到小)的顺序增加步长,可以逐步逼近方程的解。
具体过程:
a为起点,x0=a,给定步长h,x1=x0+h,f(x0)*f(x1)>0,则以x1为新的起点,再增加步长h,进行计算和判断,直到f(x0)*f(x1)<0,然后返回一个步长,减小步长为原步长的1/c,直到数值解满足精度。
69.黄金分割法计算步骤:
给定初始区间[a,b],按{x1=a+0.382(b-a);x2=a+0.618(b-a)}选取点x1、x2,计算f(x1)、f(x2);
比较f(x1)、f(x2)的大小,若f(x1)>=f(x2),删去[a,x1],a=x1,x1=x2,f(x1)=f(x2),x2=a+0.618(b-a),计算f(x2),缩小区间;反之,计算f(x1)。
区间每缩小一次,需要判断|b-a|≤ε,若满足条件,则x=(a+b)/2为极小值点,否则继续缩小区间,直到满足要求。
70.黄金分割法推导:
事先并不知道f(x1)与f(x2)的大小,把x1,x2及放在[a,b]区间对称的位置上;消去后保留下的点仍处在区间内相应的位置上,在进一步搜索时,仍是一个有用点。
X1-a=b-x2,(x1-a)/(b-a)=(x2-x1)/(b-x1),(b-x2)/(b-a)=(x2-x1)/(x2-a),令a=0,b-a=l,则x1=l-x2,x1/l=(x2-x1)/(l-x1),解得x1=0.382l,x2=0.618l,将a,b代入,有x1=a+0.382(b-a),x2=a+0.618(b-a)
71.线性规划的标准形式:
约束条件的标准化:
如果第i个约束公式为ai1x1+ai2x2+…+ainxn≤bi;则加入变量xn+1≥0,公式改为ai1x1+ai2x2+…+ainxn+xn+1=bi;如果第k个约束公式为:
ak1x1+ak2x2+…+aknxn≥bk;则减去变量xn+k≥0,公式改为ak1x1+ak2x2+…+aknxn-xn+k=bk;
目标函数的标准化:
若求函数S=[n]E[j=1]cjxj的最大值,则令S’=-S,将最大值转为最小值问题;
变量的标准化:
如果对某变量xj,没有非负限制,则引进两个变量x’j≥0,x’’j≥0,令xj=x’j-x’’j代入约束条件中,全部变量都化为非负限制。
利用矩阵线性规划可写为:
求minf=cx满足{Ax=b;x≥0}
72.分配曲线特性参数表征:
分选密度,指分配率为50%时所对应的密度,记为δp。
可能偏差(Ep)用以衡量分选设备的效率,它是根据分配曲线上分配率为75%和25%所对应的密度而算出的。
不完善度:
为表征实际分选相对于理想分选的偏离程度I=E/(δp-1)错配物总量将轻产品中大于分选密度的占原煤的量和重产品中小于分选密度的占原煤的量合计在一起,可以明确表达出物料分选的结果和设备的潜力。
误差面积:
实际分配曲线(AOE)与理想分配曲线(AB—BC—CO—OE折线)围起的面积,面积大小可表示分选效果的好坏;分离误差矩:
是分配曲线中两块误配产品面积线性力矩的总和,其值大分选效果差。
73.可选性曲线:
是根据浮沉试验结果绘制的一组曲线,用以表示煤的可选性。
是由五条曲线组成,包括浮物曲线(β)、沉物曲线(θ)、灰分特性