ImageVerifierCode 换一换
格式:DOCX , 页数:20 ,大小:134.66KB ,
资源ID:26123965      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26123965.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(最佳培养基配比方案.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

最佳培养基配比方案.docx

1、最佳培养基配比方案最佳培养基配比方案何官勇 王国敏 正勇摘要: 本文通过建立三个模型来确定最佳培养基配比方案,其主要容如下:模型一单因素模型。我们直接由图表的数据得到,即在N2(或C1)为准则的情况下,通过使用matlab对图表中有同类性质的数据进行了拟合,得到了只有一个碳源(氮源)与IFN-(干扰素)的产量有关的几组拟合函数。通过对这些拟合函数的分析、并结合图形判断出在N2(或C1)为准则下的优化配比方案。这个模型虽然可以得到比较优化的配比方案,但是它要在某一因素不变的情况下才成立的,而在实际求解最优配比方案时,要考虑到各组成因素的变化情况,同时还要考虑各组成因素的交互效应,所以我们想到了逐

2、步回归模型。模型二逐步回归模型。我们是运用逐步回归分析法分析图表的数据,把IFN-(干扰素)的产量作为要考虑的因变量y,三种碳源和四种氮源的含量作为要考虑的七个自变量。因为七个自变量对因变量y的影响是不同的,所以我们通过使用逐步回归分析模型把七个可供选择的自变量中的那些对建立回归方程比较重要的因素选择出来,从而可以得到这些确定出来的因素即为影响y产量的主要因素,即得到所选择的碳源和氮源的种类,在得到碳源和氮源的种类之后我们要解决的问题是如何确定其含量使得IFN-(干扰素)的产量最大,即最终找出最优配比方案。由此我们想到了模型三。模型三。在确定了碳源和碳源的种类之后,我们通过借鉴模型一中运用的单

3、因素准则法,先确定一个C1,在N1、N2对IFN-产量影响的图像中进行比较,就可以得到IFN-的产量达到最大时碳源和氮源的含量。在得到模型之后,我们对所建模型进行了的可行性分析,自我评价和改进。在整个建模过程中我们运用matlab去进行计算,使得我们在建模过程中处理数据方便了许多。关键字: 最优配比 matlab 拟合 逐步回归 图像分析 单因素准则一、问题重述及分析本题是某发酵实验中培养基的碳源(C1,C 2,C3)和氮源(N1,N2,N3,N4)含量及IFN-(-干扰素)的产量的关系问题(实验数据表见附件一):如何选择碳源和氮源的种类及含量使IFN-的产量达到最大?本题是以生物化学知识为背

4、景的数学建模。在建立模型之前首先要弄清楚发酵、IFN-(干扰素)等生物化学上的专用词,弄清楚培养基原理,再从实验的数据出发,去建立一个最优的配比方案。二、模型假设与假设的说明模型假设:1)每个实验都是在相同的外界条件下进行的,且外界条件的变化对实验不会产生影响。 2)每个实验都是独立进行、互不影响的。3)每个实验都是在所需的条件下顺利进行的。4)每个实验培养基中都有相同的且数量不变的真菌。5)每个实验培养基中的碳源、氮源和真菌都是均匀分布,且充满整个培养基。6)每个实验中的真菌利用氮源和碳源生成IFN-的能力是一样的。7)每个实验中氮源、碳源的含量同时成比例变化不影响氮源、碳源的转化率。8)每

5、个实验中不同碳源(氮源)之间都是独立的,不互相影响。9)每个实验用到的数据都用同一的单位。10)因为IFN-是单一类型的干扰素分子,在下面的讨论中考虑不同的碳源和氮源被吸收后都只生成一种相同类型的干扰素分子。11)每个实验的培养基本身都含有一定数量的碳和氮。12)在求解最佳配比方案时,不同碳源(氮源)价格是相同的,或者说他们的价格的差别对于问题而言是可以忽略的。假设的说明: 对于假设1)、2)、3)、4)、5)、6)、8)、9),是为了保证实验具有可行性、可比性,在现实的情况下这些假设是可以做到的,符合实际的。 对于假设7),是为了便于从实验数据中了解、得到更多的信息,从而建立模型。在实际情况

6、下,当两个反应物在其他条件不变时,浓度成比例改变,它们的转化率一般是不变的,在这里也假设是不变的。 对于假设10),是为了在判断碳源和氮源的优劣进而选择合适的原料时,不需要去考虑因生成的IFN-有不同种类,而导致在判断碳源和氮源时,无法根据表中的量去判断的情况,在现实中因为IFN-是单一类型的干扰素分子,考虑其只会产生一种IFN-,也是合理的。对于假设11),是从实际情况出发,考虑到一方面每个培养基中本身就含有必备的营养素,也就会含有一定的碳和氮;另一方面,因为实验中有五组数据是在只有碳或氮的情况下生成的,如果没有碳或氮是不会出现这些情况的。 对于假设12),是为了在判断碳源和氮源的优劣进而选

7、择合适的原料时,只需从相同原料时生成IFN-的产量的多少考虑即可,这样假设是从方便建模的角度出发的。在现实中,会出现价格不同,甚至相差很大的情形,在这个时候就必须要考虑经济效益了,我们将在模型改进中予以简要说明。三、模型建立及求解模型一: 经过我们分析认为第14,15,16,17,23五次实验为特殊情形,在以下分析中暂不考虑,将在模型二的第二步中予以说明。下面介绍模型一: 首先,根据实验数据研究N2含量不变的准则下,不同的C1(C2,C3)的含量对产生IFN-的影响,主要思想如下:找出含C1(C2,C3)源的项及其对应的IFN-的产量的项,利用数学软件matlab把表中的C1(C2,C3)的含

8、量与IFN-的产量有关的数据拟合成曲线,建立它们两者之间的函数关系。把建立C1(C2, C3)的含量与IFN-的产量的三条曲线图像放在同一个坐标系中,进行观察、比较,取图像在一定区间最上方的曲线所对应的碳源为在该区间所选择的碳源,对应区间取得函数最大值时的自变量即为碳源的含量。 其次,根据实验数据研究C1准则下,不同的N1(N2 N3 N4)的量的对产生IFN-的影响,主要思想和上面的一样,这里就不累述了。 最后,根据在N2含量不变的准则下求出的一个最佳的碳源Ci(i为1、2或3中的一个),把N2 ,Ci(i为1、2或3中的一个)的组合作为一个优化的配比方案。同理,根据在C1含量不变的准则下求

9、出的最佳的一个氮源Ni(i为1、2、3或4中的一个),把C1,Ni(i为1、2、3或4中的一个)的组合也作为一个优化的配比方案。具体的做法如下:把实验设置为七组,把第1至第5个实验作为第一组,第6至第9个实验作为第二组,把第10至13个实验为第三组,把第15至第18个实验作为第四组,在第1至5个实验中把C1按假设7)都化为2后所得的新结果分为一组作为第五组,把第23至28个实验作为第六组,把第29至32个实验作为第七组。在N2含量为0.5,N1 、N3 、N4 、C2、C3含量均为零时,利用数学软件matlab对1,2,3,4,5组实验中C1 的含量x与IFN-的产量y的关系进行三次曲线拟合。

10、具体的拟合曲线如下: Matlab指令:x=0.1 0.4 1 2 3; (1) y=11.6900 39.1297 68.2035 83.6580 75.4200;a=polyfit(x,y,3) x1=0.1:0.1:3; z=polyval(a,x1); plot(x,y,k*,x1,z,r) a =5.1683 -41.8866 103.4625 2.5470 得到拟合曲线,如图(1)所示。 拟合函数为:y = 5.1683 x 3 - 41.8866 x 2 + 103.4625 x + 2.5470同理,对固定的N2 ,可以按上述的方法拟合第二组,和第三组实验的数据,具体的拟合过程

11、如下:对第二组:C2的含量x与IFN-的产量y的关系进行三次曲线拟合,具体的拟合曲线如图(2): 拟合函数为:y = -9.0119 x 3 + 23.7190 x 2 -13.0696 x + 22.4733 对第三组:C3的含量x与IFN-的产量y的关系进行三次曲线拟合,具体的拟合曲线如图(3):拟合函数为:y =2.4244 x 3 -10.2156 x 2 +16.9070x + 4.0330 (2)0 (3) (3) (2) (4)把上面建立的C1、C2 、C3的含量与IFN-的产量的三条曲线图像拟合在同一个坐标下,得到图(4):从上图可知,以N2含量不变作为准则时,取C1作为碳源,

12、IFN-产量明显最大。因此,我们取C1、N2 作为碳源和氮源。通过计算可以得到C1的最大值,该值即为N2不变准则下IFN-产量取最大值时的含量,由此我们即得到一个优化配比方案。该方案为:C1N2=1.9 0.5同理:以C1含量不变作为准则的情况下,可以得到另一个优化配比方案。 模型二:模型一中我们只考虑了单一准则下各因素的最优时的情况,然而,实际上各个因素都在变化,要找到最优方案必须考虑周全。因此,我们要同时考虑三种碳源和四种氮源,分析它们对IFN-产量的影响的大小,从中选取影响较大且合理的组合,由此我们想到了逐步回归分析方法,建立了逐步回归模型。通过使用这种方法选取出了对IFN-产量的影响较

13、大的碳源、氮源。在运用这种方法时,我们是借助于数学软件matlab的,我们的具体计算过程为:第一步:分别记C1、C2、C3、N1、N2、N3、N4等7列的数据为列向量x1、x2x7。记rhIFN-列的数据为列向量y。即: x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ; x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ; x3 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5

14、2.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ; x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 0 0 0 0 0 0 ; x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ; x6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ; x7 =

15、0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01 0.05 0.1 0.3 ; y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.7417 22.5836 25.8213 5.624 10.2357 14.5909 20.3346 7.296 42.588 51.6 165.54 72 54.9 42.84 164.25 138.04 126.9 11.484 17.16 20.8 57.24 72.96 17.608 30.94 11.475 12.084 ;令x = x1

16、 x2 x3 x4 x5 x6 x7 ,用stepwise(x,y)得到一个stepwise regression diagnostics table(如图i所示)可以看出结果不太好:p=0.0229,取=0.05时,此回归模型可用,但取=0.01时,模型不能用;R-square = 0.461,较小;F=2.932,也较小。(由图ii中各直线都是虚线可证明)于是我们调整图ii中的各直线。然而,无论怎么调整都无法使哪条虚线变为实线。故可知此回归模型不大合理,需改进。第二步:我们仔细分析实验数据,发现x(14:16,:)中,每行向量相等,而y的值不等,说明此实验数据不可靠,且在现实中如果只用单一

17、氮源,那么培养基将因缺乏碳源而崩溃,x(17,:)和x(23,:)也是如此,故将其删除掉。用其余数据组合成新的x、y。即: x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ; x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ; x3 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5 2.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ; x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5

18、2 3 4 5 0 0 0 0 0 0 0 0 0 ; x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ; x6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ; x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01 0.05 0.1 0.3 ; y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.

19、7417 22.5836 25.8213 5.624 10.2357 14.5909 20.3346 72 54.9 42.84 164.25 138.04 11.484 17.16 20.8 57.24 72.96 17.608 30.94 11.475 12.084 ; x = x1 x2 x3 x4 x5 x6 x7;重复做第一步中的操作,得到另一个 stepwise regression diagnostics table 如图iii所示:可知此方案比较好了,p=7.4e-005,很小;R-square =0.7651,比较大;F=8.84,也比较大。可见此方案可取。但,由图iii可知

20、,x2、x3、x7不显著,调整图iv中的直线,移去这三个向量后统计结果如图v所示:由matlab易知: inin = 1 4 5 6 outout = 2 3 7图vi中x2、x3、x7三行用红线显示,表明它们已经移去。从新的统计结果可以看出,虽然剩余标准差s(RMSE)没有太大的变化,但是统计量F 的值明显增大,因此新的回归模型更好一些。再运用matlab知识: x=ones(27,1) x1 x4 x5 x6; b,bint,r,rint,stats=regress(y,x); bb = -32.6171 24.6535 25.4289 105.0067 -96.6340 statssta

21、ts = 0.7630 17.7026 0.0000可以求出模型:y=-32.6171+24.6535x1+25.4289x4+105.0067x5-96.634x6第三步:由试验数据可知,C1、N3和N2共存时,IFN-的产量比只有C1、N2时要低得多。可见最优方案中要去掉N3。以下我们再次用逐步回归方法验证我们的结论:去掉与N3有关的数据之后我们得到新的x,y。即:x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 ;x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 ;x3

22、 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5 2.5 0 0 0 0 0 0 0 0 0 ;x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ;x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0 0 0 0 ;x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01 0.05 0.1 0.3 ;y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.7417 22

23、.5836 25.8213 5.624 10.2357 14.5909 20.3346 72 54.9 42.84 164.25 138.04 17.608 30.94 11.475 12.084 ;x = x1 x2 x3 x4 x5 x7 ;调用stepwise(x,y)得到另一个stepwise regression diagnostics table如图vii所示: vii viii 可知此方案好了很多,p=2.996e-004,很小;R-square =0.7808,比较大;F=8.903,也比较大。可见此方案可取。 ix x但是,有很多虚线,重复第二步中的操作,得到比较好的结果,如

24、图ix以及图x所示:从新的统计结果可以看出,统计量F 的值明显增大,因此这种回归模型比前面的更好一些。再用matlab,知: x=ones(22,1) x1 x4 x5 ;b,bint,r,rint,stats=regress(y,x);bb = -27.6976 24.6535 24.1140 95.1678 statsstats = 0.7738 20.5260 0.0000求出最终的模型: y=-27.6976+24.6535x1+24.1140x4+95.1678x5综上所述:碳源C1和氮源N1、N2是影响IFN-产量的主要因素。所以原问题中要求得最优培养基配比方案,可以转化为在选取碳

25、源C1和氮源N1、N2作为原料后,确定它们的含量使得IFN-产量最大(具体求解见模型三)。模型三:通过上述讨论,我们已经选出了碳源和氮源的类型,下面我们具体讨论它们的含量问题:鉴于N2、N3共存时,IFN-的产量低于仅有N2时的情况,我们不能断定N1、N2共存时IFN-的产量会达到最大;同时也没有C1、N1、N2共存时的数据。因此我们通过分析,可以先任意给出C1的含量,在N1、N2中选择一种,使之与C1共存时,让IFN-的产量达到最大,从而求出氮的含量。具体分析如下:在假设7)成立的情况下,通过数据分析,当C1含量为a时(以下计算时,以a=0.5为例),通过作图来比较N1、N2的优劣情况: x

26、1=0.5 2 3 4 5; x2=10 2.5 1 0.5 1/3; y1=72 54.9 42.84 164.25 138.04; y2=11.6900*20 39.1297*5 68.2035*2 83.6580 75.4200/1.5; 图一 a1=polyfit(x1,y1,3); a2=polyfit(x2,y2,3); x=0.1:0.1:5; z1=polyval(a1,x); z2=polyval(a2,x); plot(x,z1,r,x,z2,b)由图一分析可知:在培养基中C1的含量a(a取0.5)已知的情况下,当氮源的量小于0.5或大于4.0时,选择N1,IFN-的产量高

27、;当氮源的量在0.5到4.0之间,选择N2,IFN-的产量高。(最大含量由a的具体值决定)四、模型的说明与可靠性分析 本题是通过给我们一系列实验数据,要求我们分析数据来寻求最优配比方案。这本身就要求我们用那些数据去预测,而那些数据的产生具有一定的随机性、和误差值,这就使得我们的模型的结果具有一定的随机性、预测性。同时,我们根据实验数据,用拟合和逐步回归的方法建立上述模型,所得的结果与实验数据是基本吻合的,具有合理性,预测性。五、模型的自我评价对于模型一,我们使用了在确定一个因素的量之后,研究其它单一因素的改变对目标的影响。运用这种方法,我们可以粗略地判断不同的因素对目标的贡献大小,得到一个粗略

28、的优化配比方案。这个模型的优点在于我们可以直接利用实验数据表中的数据进行比较而得到方案;缺点在于没有把实验表中的每个因素都进行比较,得到的结果只是局部的一个最优,不一定是整体的最优,同时在比较时没有考虑第14,15,16,17,23五次实验,也会对所得的结果造成一定的影响。对于模型二,我们用逐步回归分析法找出最优的碳源、氮源种类。运用这种方法得到一组最优组合是比较合理的,它是根据实验数据考虑了全部变量而得到的。对于模型三,我们是对模型二进行了补充说明。它在通过计算碳源、氮源的含量来获得最优方案时,参照了模型一的方法。这个模型的优点在于解决了我们在得到了回归方程之后,无法由实验数据表求出三个因素

29、都在变动时的最优配比方案的难题。该模型通过确定一个因素之后,就可以利用实验数据表求解最优配比方案了。缺点在于没有给出全部因素都在变动时的最优解。在整个建模过程中,存在一个无法克服的困难:我们的模型是建立在实验数据之上的,由于实验数据具有随机性,这就决定了模型所得结果具有随机性、预测性。六、模型的改进1)我们的模型是建立在实验数据上的,运用的是数理统计的方法,可以从增加实验的测试次数来提高我们的模型的准确度。2)在实验设计时考虑运用正交实验设计。3)我们的模型假设12)如果不成立时,就要考虑到价格对我们选取碳源、氮源种类时的影响。这种情况下,我们建议在建立模型时把价格乘上含量来代替原模型中的含量

30、,这样就可以用上述模型去选择种类及含量。4)我们在建立模型时没有分析到氮过量时对模型的影响,事实上如果氮源过量,会导致ph值升高,从而会破坏培养基,导致IFN-产量的下降。我们建议在添加原料控制好氮的含量。5)对于在得到最优配比方案时的碳源和氮源含量的求解问题中,我们在模型三中给出了一个特殊解法,事实上,如果我们可以找到关于IFN-的产量与碳源和氮源含量的函数关系,就可以直接作为回归方程的约束条件来求解最值。6)由于表中数据没有具体的单位,在上述模型中我们把它当作物质的量来考虑。如果把表中数据当作百分比含量来考虑,在模型三中求解时,就可以通过二次回归得出最优配比方案如下:a、当选择C1、N1:y = 0.7363 + 34.0797 x1+ 38.0397 x4 5.9335x12 -3.9689 x42x1=4.151 x4=2.604 ymax=113.2815b、当选择C1、N2:y = 0.7363 + 34.0797 x1+ 38.0397 x5 5.9335x12 -3.9689 x52;x1=2.872 x5=4.792 ymax=140.1561c、当选择C1、N1

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1