MEGA软件的使用Word文档格式.docx
《MEGA软件的使用Word文档格式.docx》由会员分享,可在线阅读,更多相关《MEGA软件的使用Word文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
浏览文件,选择要分析的数据打开,单击“打开”按钮,会弹出如下操作界面:
此程序操作界面,提供了三种选择数据选择:
NucleotideSequences(核苷酸序列)、ProteinSequences(蛋白质序列)、PairwiseDistance(遗传距离矩阵)。
根据输入数据的类型,选择一种,点击“OK”即可。
如果选择“PairwiseDistance”,则操作界面有所不同;
如下图所示:
根据遗传距离矩阵的类型,如果就是下三角矩阵,选择“LowerLeftMatrix”即可;
如果就是上三角矩阵,选择“UpperRightMatrix”即可。
点击“OK”按钮,即可导入数据。
如果就是核苷酸数据,则读完之后,会弹出如下对话框:
如上图,如果就是编码蛋白质的核苷酸序列,则选择“Yes”按钮;
如果就是不编码蛋白质的核苷酸序列,则点击“No”按钮。
之后,会弹出如下操作窗口:
此作界面的名称就是“SequenceDataExplorer”,在其最上方就是工具栏“Data”、“Display”、“Highlight”等,然后就是一些数据处理方式的快捷按钮,在操作界面的左下方就是每个序列的名称。
显示序列占了操作界面的绝大部分,与第一个序列相同的核苷酸用“、”表示,发生变异的序列则直接显示。
2、遗传距离的计算
点击Mega操作主界面的“Distances”按钮,会弹出一个下拉菜单。
从上图易知,此菜单包括如下选项:
“ChooseModel”(选择模型,即选择计算遗传距离的模型)、“ComputePairwise”(计算遗传配对差异)、“ComputeOverallMean”(计算包括所有样本在内的平均遗传距离)、“ComputeWithGroupMeans”(计算组内平均遗传距离)、“ComputeBetweenGroupsMeans”(计算组间平均遗传距离)、“ComputeNetBetweenGroupsMeans”(计算组间平均净遗传距离)、“ComputeSequenceDiversity”(计算序列分歧度)。
“ComputeSequenceDiversity”选项包括四个子菜单:
“MeanDiversityWithinSubpopulations”(亚群体内部平均序列多态性)、“MeanDiversityforEntirePopulation”(整个人群平均序列多态性)、“MeanInterpopulaionalDiversity”(群体内部平均序列多态性)、“CoefficientofDifferentiation”(遗传变异系数)。
点击“ChooseModel”选项,会弹出如下操作界面:
从上述操作界面可以瞧出,通过此对话框可以选择计算遗传距离的模型等。
“DataType”显示数据的类型:
Nucleotide(Coding)(编码蛋白质的DNA序列)、Nucleotide(不编码蛋白质的DNA序列)、AminoAcid(氨基酸序列)。
通过“Model”选项可以选择,计算遗传距离的距离模型。
点击“Model”一行末端的按钮会弹出一选择栏。
如上图所示,对于非编码的核苷酸序列Mega程序提供了八种距离模型:
“NumberofDifference”(核苷酸差异数)、“P-distance”(P距离模型)、“Jukes-Cantor”(Jukes与Cantor距离模型)、“Kimura2-Parameter”(Kimura双参数模型)、“Tajima-Nei”(Tajima与Nei距离模型)、“Tamura3-parameter”(Tamura三参数模型)、“Tamura-Nei”(Tamura与Nei距离模型)、“LogDet(Tamurakumar)”(对数行列式距离模型)。
对于编码的核苷酸序列,其遗传距离模型如下图所示:
如上图所示,对于编码蛋白质的DNA序列,Mega程序提供了一下几种模型:
“Nei-GojoboriMethod”,“ModifiedNei-GojoboriMethoed”、“Li-Wu-LuoMethod”、“Pamilo-Bianchi-LiMethod”、“KumarMethod”。
其中Nei-Gojobori方法与修正的Nei-Gojobori方法都包含三种距离模型:
“NumberofDifferences”、“P-distance”、“Jukes-Cantor”。
对于氨基酸序列,Mega所提供的遗传距离模型如下图所示:
如上图所示,对于氨基酸序列,Mega程序提供了一下六种遗传距离模型:
“NumberofDifferences”(氨基酸差异数)、“P-distance”(P距离模型)、“PoissonCorrection”(泊松校正距离模型)、“EqualInput”(等量输入距离模型)、“PAMMatrix(Dayhoff)”(PAM距离矩阵模型)、“JTTMatrix(Jones-Taylor-Thornton)”(JTT距离矩阵模型)。
在“AnalysisPreference”操作界面中,“PatternAmongLineages”仅提供了一个选项:
“Same(Homogenous)”“,也就就是说样本之间就是有一定同源性的。
“Ratesamongsites”提供了两个选项:
“UniformRates”与“Different(GammaDistributed)”。
“UniformRates”意味着所有序列的所有位点的进化速率就是相同的。
选择“Different(GammaDistributed)”,意味着序列位点之间的进化速率就是不相同的,可以利用Gamma参数来校正,系统提供了四个数值可供选择:
2、0、1、0、0、5、0、25;
软件使用者也可以自行决定Gamma参数的大小。
设置完毕后,在此界面中点击“OK”按钮,即可返回Mega操作主界面。
选择主操作界面“Distance”中的“ComputePairwise”选项,可以计算样本之间的遗传距离的大小,其操作界面如下图所示:
“DataType”显示数据的类型,图中为“Nucleotide”。
“Analysis”显示计算分分析的类型,图中为“PairwiseDistanceCalculation”(配对差异距离计算)。
“Compute”显示所要运行的对象,又两个选项:
“Distanceonly”(仅计算遗传距离)与“Distance&
Std、Err”(计算遗传距离与其标准误)。
“IncludeSites”显示利用哪些位点来计算,如果数据类型就是不编码蛋白质的核苷酸序列,则全部参与计算,如果就是编码蛋白质的核苷酸序列,则可以选择哪些位点(如密码子的第2位等)来参与运算。
“SubstitutionModel”就是替代的模型,在下边“Model”中可以进行选择。
“SubstitutionstoInclued”选择哪些替代类型(如下图所示)被用于运算,d选项将转换与颠换全部包括在内,s选项仅包括转换,v选项仅包括颠换,R为转换与颠换的比值,L为所有有效的普通位点的个数。
“PatternamongLineages”与“Ratesamongsites”上文已有介绍,不再详述。
点击“Compute”按钮,即可开始计算。
其显示运算结果的界面如下图所示:
上图就是计算出的各个样本之间的遗传距离的矩阵。
在最下端的状态栏,显示的就是所利用的遗传距离模型,如图中所示:
Nucleotide:
Kimura2-parameter。
“File”按钮共有四个下拉菜单:
“ShowInputDataTitle”(显示输入数据的标题)、“ShowAnalysisDescription”(显示分析信息的描述)、“Export/PrintDistance”(输出或打印距离矩阵)、“Quitviewer”(退出此操作界面)。
“Display”按钮共有四个下拉菜单:
“ShowPairName”(显示配对序列的名字)、“SortSequence”(用何种方式对序列进行排序)、“ShowNames”(显示序列的名字)、“ChangeFont”(改变字体)。
“SortSequence”有两个选项:
“Original”(按原先输入的顺序)与“ByName”(通过序列的名字)。
点击“Average”按钮可以计算平均的遗传距离,此按钮提供了四个下拉菜单:
“Overall”(所有样本之间的平均遗传距离)、“WithinGroups”(组内平均遗传距离)、“BetweenGroups”(组间平均遗传距离)、“NetBetweenGroups”(组间平均净遗传距离)。
在上述按钮下方还有六个按钮,如下图所示。
点击第一个按钮可以使数据以下三角矩阵的方式显示;
点击第二个按钮可以使数据以上三角矩阵的方式显示;
选中第三个按钮可以显示配对的序列的名字,点击第四个按钮,可以减少数据小数点后的位数;
点击第五个按钮,可以增加数据小数点后的位数;
拖动第六个按钮中的小竖条可以改变数据显示的宽度。
点击“File”下拉菜单中的“Export/PrintDistance”选项,会弹出如下图所示的对话框:
“OutputFormat”选项可以确定输出数据的格式:
“Publication”(一般格式)与“Mega”(Mega格式,把此数据保存可直接由Mega程序打开,进行构建系统发育书等遗传分析)。
DecimalPlaces(小数位的大小),“MaxEntriesperline”(每一行最多能显示的数据的个数)。
通过“Matrix”可以选择输出数据矩阵的方式:
“Lower-left”(下三角矩阵)与“Upper-right”(上三角矩阵)。
点击“Print/SaveMatrix”按钮,可以输出数,会弹出如下图所示的操作界面:
在上图中的数据与文字可以直接进行拷贝,粘贴到文本文档或MicrosoftWord文档中。
在此操作界面中,首先显示数据文件的一些信息,如数据文件的标题、总的样本个数、核苷酸替代的距离模型等。
然后就是每个序列的名字,之后就是序列之间的距离矩阵。
将此距离矩阵保存,可以用Mega或其她系统发育分析软件来做系统树。
点击Mega软件操作主界面的“Distances”下拉菜单中的“ComputeOverallMean”选项,可以计算所有序列的所有位点的平均遗传距离,其操作方法与界面同“ComputePairwise”相仿。
其运算结果如下图所示:
点击Mega软件操作主界面的“Distanc