MEGA软件地使用文档格式.docx

资源描述

MEGA软件地使用文档格式.docx

《MEGA软件地使用文档格式.docx》由会员分享，可在线阅读，更多相关《MEGA软件地使用文档格式.docx（12页珍藏版）》请在冰豆网上搜索。

MEGA软件地使用文档格式.docx

单击“OpenData〞选项，会弹出如下菜单：

浏览文件，选择要分析的数据打开，单击“打开〞按钮，会弹出如下操作界面：

此程序操作界面，提供了三种选择数据选择：

NucleotideSequences〔核苷酸序列〕、ProteinSequences〔蛋白质序列〕、PairwiseDistance〔遗传距离矩阵〕。

根据输入数据的类型，选择一种，点击“OK〞即可。

如果选择“PairwiseDistance〞，如此操作界面有所不同；

如如下图所示：

根据遗传距离矩阵的类型，如果是下三角矩阵，选择“LowerLeftMatrix〞即可；

如果是上三角矩阵，选择“UpperRightMatrix〞即可。

点击“OK〞按钮，即可导入数据。

如果是核苷酸数据，如此读完之后，会弹出如下对话框：

如上图，如果是编码蛋白质的核苷酸序列，如此选择“Yes〞按钮；

如果是不编码蛋白质的核苷酸序列，如此点击“No〞按钮。

之后，会弹出如下操作窗口：

此作界面的名称是“SequenceDataExplorer〞，在其最上方是工具栏“Data〞、“Display〞、“Highlight〞等，然后是一些数据处理方式的快捷按钮，在操作界面的左下方是每个序列的名称。

显示序列占了操作界面的绝大局部，与第一个序列一样的核苷酸用“.〞表示，发生变异的序列如此直接显示。

2、遗传距离的计算

点击Mega操作主界面的“Distances〞按钮，会弹出一个下拉菜单。

从上图易知，此菜单包括如下选项：

“ChooseModel〞〔选择模型，即选择计算遗传距离的模型〕、“putePairwise〞〔计算遗传配对差异〕、“puteOverallMean〞〔计算包括所有样本在内的平均遗传距离〕、“puteWithGroupMeans〞〔计算组内平均遗传距离〕、“puteBetweenGroupsMeans〞〔计算组间平均遗传距离〕、“puteNetBetweenGroupsMeans〞〔计算组间平均净遗传距离〕、“puteSequenceDiversity〞〔计算序列分歧度〕。

“puteSequenceDiversity〞选项包括四个子菜单：

“MeanDiversityWithinSubpopulations〞〔亚群体内部平均序列多态性〕、“MeanDiversityforEntirePopulation〞〔整个人群平均序列多态性〕、“MeanInterpopulaionalDiversity〞〔群体内部平均序列多态性〕、“CoefficientofDifferentiation〞〔遗传变异系数〕。

点击“ChooseModel〞选项，会弹出如下操作界面：

从上述操作界面可以看出，通过此对话框可以选择计算遗传距离的模型等。

“DataType〞显示数据的类型：

Nucleotide〔Coding〕〔编码蛋白质的DNA序列〕、Nucleotide〔不编码蛋白质的DNA序列〕、AminoAcid〔氨基酸序列〕。

通过“Model〞选项可以选择，计算遗传距离的距离模型。

点击“Model〞一行末端的按钮会弹出一选择栏。

如上图所示，对于非编码的核苷酸序列Mega程序提供了八种距离模型：

“NumberofDifference〞〔核苷酸差异数〕、“P-distance〞〔P距离模型〕、“Jukes-Cantor〞〔Jukes和Cantor距离模型〕、“Kimura2-Parameter〞〔Kimura双参数模型〕、“Tajima-Nei〞〔Tajima和Nei距离模型〕、“Tamura3-parameter〞〔Tamura三参数模型〕、“Tamura-Nei〞〔Tamura和Nei距离模型〕、“LogDet〔Tamurakumar〕〞〔对数行列式距离模型〕。

对于编码的核苷酸序列，其遗传距离模型如如下图所示：

如上图所示，对于编码蛋白质的DNA序列，Mega程序提供了一下几种模型：

“Nei-GojoboriMethod〞，“ModifiedNei-GojoboriMethoed〞、“Li-Wu-LuoMethod〞、“Pamilo-Bianchi-LiMethod〞、“KumarMethod〞。

其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型：

“NumberofDifferences〞、“P-distance〞、“Jukes-Cantor〞。

对于氨基酸序列，Mega所提供的遗传距离模型如如下图所示：

如上图所示，对于氨基酸序列，Mega程序提供了一下六种遗传距离模型：

“NumberofDifferences〞〔氨基酸差异数〕、“P-distance〞〔P距离模型〕、“PoissonCorrection〞〔泊松校正距离模型〕、“EqualInput〞〔等量输入距离模型〕、“PAMMatrix〔Dayhoff〕〞〔PAM距离矩阵模型〕、“JTTMatrix〔Jones-Taylor-Thornton〕〞〔JTT距离矩阵模型〕。

在“AnalysisPreference〞操作界面中，“PatternAmongLineages〞仅提供了一个选项：

“Same〔Homogenous〕〞“，也就是说样本之间是有一定同源性的。

“Ratesamongsites〞提供了两个选项：

“UniformRates〞和“Different〔GammaDistributed〕〞。

“UniformRates〞意味着所有序列的所有位点的进化速率是一样的。

选择“Different〔GammaDistributed〕〞，意味着序列位点之间的进化速率是不一样的，可以利用Gamma参数来校正，系统提供了四个数值可供选择：

2.0、1.0、0.5、0.25；

软件使用者也可以自行决定Gamma参数的大小。

设置完毕后，在此界面中点击“OK〞按钮，即可返回Mega操作主界面。

选择主操作界面“Distance〞中的“putePairwise〞选项，可以计算样本之间的遗传距离的大小，其操作界面如如下图所示：

“DataType〞显示数据的类型，图中为“Nucleotide〞。

“Analysis〞显示计算分分析的类型，图中为“PairwiseDistanceCalculation〞〔配对差异距离计算〕。

“pute〞显示所要运行的对象，又两个选项：

“Distanceonly〞〔仅计算遗传距离〕和“Distance&

Std.Err〞〔计算遗传距离和其标准误〕。

“IncludeSites〞显示利用哪些位点来计算，如果数据类型是不编码蛋白质的核苷酸序列，如此全部参与计算，如果是编码蛋白质的核苷酸序列，如此可以选择哪些位点〔如密码子的第2位等〕来参与运算。

“SubstitutionModel〞是替代的模型，在下边“Model〞中可以进展选择。

“SubstitutionstoInclued〞选择哪些替代类型〔如如下图所示〕被用于运算，d选项将转换和颠换全部包括在内，s选项仅包括转换，v选项仅包括颠换，R为转换和颠换的比值，L为所有有效的普通位点的个数。

“PatternamongLineages〞和“Ratesamongsites〞上文已有介绍，不再详述。

点击“pute〞按钮，即可开始计算。

其显示运算结果的界面如如下图所示：

上图是计算出的各个样本之间的遗传距离的矩阵。

在最下端的状态栏，显示的是所利用的遗传距离模型，如图中所示：

Nucleotide：

Kimura2-parameter。

“File〞按钮共有四个下拉菜单：

“ShowInputDataTitle〞〔显示输入数据的标题〕、“ShowAnalysisDescription〞〔显示分析信息的描述〕、“Export/PrintDistance〞〔输出或打印距离矩阵〕、“Quitviewer〞〔退出此操作界面〕。

“Display〞按钮共有四个下拉菜单：

“ShowPairName〞〔显示配对序列的名字〕、“SortSequence〞〔用何种方式对序列进展排序〕、“ShowNames〞〔显示序列的名字〕、“ChangeFont〞〔改变字体〕。

“SortSequence〞有两个选项：

“Original〞〔按原先输入的顺序〕和“ByName〞〔通过序列的名字〕。

点击“Average〞按钮可以计算平均的遗传距离，此按钮提供了四个下拉菜单：

“Overall〞〔所有样本之间的平均遗传距离〕、“WithinGroups〞〔组内平均遗传距离〕、“BetweenGroups〞〔组间平均遗传距离〕、“NetBetweenGroups〞〔组间平均净遗传距离〕。

在上述按钮下方还有六个按钮，如如下图所示。

点击第一个按钮可以使数据以下三角矩阵的方式显示；

点击第二个按钮可以使数据以上三角矩阵的方式显示；

选中第三个按钮可以显示配对的序列的名字，点击第四个按钮，可以减少数据小数点后的位数；

点击第五个按钮，可以增加数据小数点后的位数；

拖动第六个按钮中的小竖条可以改变数据显示的宽度。

点击“File〞下拉菜单中的“Export/PrintDistance〞选项，会弹出如如下图所示的对话框：

“OutputFormat〞选项可以确定输出数据的格式：

“Publication〞〔一般格式〕和“Mega〞〔Mega格式，把此数据保存可直接由Mega程序打开，进展构建系统发育书等遗传分析〕。

DecimalPlaces〔小数位的大小〕，“MaxEntriesperline〞〔每一行最多能显示的数据的个数〕。

通过“Matrix〞可以选择输出数据矩阵的方式：

“Lower-left〞〔下三角矩阵〕和“Upper-right〞〔上三角矩阵〕。

点击“Print/SaveMatrix〞按钮，可以输出数，会弹出如如下图所示的操作界面：

在上图中的数据和文字可以直接进展拷贝，粘贴到文本文档或MicrosoftWord文档中。

在此操作界面中，首先显示数据文件的一些信息，如数据文件的标题、总的样本个数、核苷酸替代的距离模型等。

然后是每个序列的名字，之后是序列之间的距离矩阵。

将此距离矩阵保存，可以用Mega或其他系统发育分析软件来做系统树。

点击Mega软件操作主界面的“Distances〞下拉菜单中的“puteOverallMean〞选项，可以计算所有序列的所有位点的平均遗传距离，其操作方法和界面同“putePairwise〞相仿。

其运算结果如如下图所示：

点击Mega软件操作主界面的“Distances〞下拉菜单中的“puteWithinGroupMeans〞选项，可

展开阅读全文