1、基于高通量测序的基因序列分析软件基于高通量测序的基因序列分析软件使用说明第一章简介本软件是一款综合性的基因序列分析软件,界面友好、操作简单,能够快速方便的获取、贮藏和分析基因序列,并通过数据库查询获得的序列相关信息。本软件兼容性很强,能把几乎所有文本文件打开作为序列。当程序不能辨别序列的格式时(通过寻找常用序列格式的特征),会显示这个文件的文本形式, 以便你编辑生成正确的蛋白质或 DNA序列,编辑后可以再被载入程序。此外,本软件在一个项目中可以加入几千个序列或引物,并在整个 项目中分析这些序列及标题,每个序列或引物都会自动添加文本标题。第二章文件菜单1保存文件保存PSG文件一允许用户保存序列文
2、件的不同的亚组,依据不同的选项设置选定。2.查看菜单允许用户选定哪种类型的信息用于生成序列列表。如果方案包含超过 700个序列,用于展示序列列表的列表框容量将过载。为了避免这些,序列列表的每一行被修短以容纳当前方案中的所有序列。基于高通盘滴序的基因序列分析软杵Fileyie Sorting Quwtomi铮 Ref馆肉Ce:RilFriFrvOuiOuiIn(Sequence Dda w* Header, 1. LineHeader 2. LineHeader, 3. LireeHeader, 4. LineH加郎5 Line亡itias亡r asperiilus,2 homolog; 3Ch
3、izas. *e aldolase己 aldfllastmembrane protein porin ., m亡iubrane protein potin *transporte匚 phoS70r|G 亡 a-40s pcote I40s p匸o匸亡 Lipase 1 ptecuE3orHtif 1 s&c匚hanoitYU己凸 cerevisia&AdvancedHeader Section *Preference!3.加工菜单C00005-P.C00007-F.COCOlO-F.C00010-R,C00013-F.C00013-R. coccie-F. C00016-R. coooi0-r
4、.Main Displav Line TvpeD efine Substitute Line CriteriaDefine Remove Words CriteriaS elect Dptimisalion Method 匚0006 000900150016 019002000250026002700310D3200350337TOTAL = 31 LUSTED = 16 UNIQUE 三 14 NOT SHOWN: No info 5 QuUide range 1File View Sort Ptocesf 卜-1 40s ribaNormal DiplapC 匚aaO22-R.111224
5、0s ribosomal ptotem si !: Cellular serine proteinast Geh7 protein - grass milt Igg fc binding protein hoNormal Dhpla* Number$ First7 Nufriber$Nane - Numbers, Tvb Debmited, Names First Name - Numbers, TDelimited. Name? Last Percent, PrcjectPercent, Sorted ListInorganic phosphate transporter phoS7 gi|
6、2+ 0x2 sacchatouiYces cetevi3iaeRev亡unu transcriptase, tnaseh glcmecella Ci + + Pibosomal pcotein 122 homolog schizod Sensory kinase erwinia cacDtovota sub3.* Subtilislnlike setliie proteaa& podospota, T * TraiLScription initiation f actot: tf iid (tati. Fructose-bi sphosphat-e aldolase gi 1682321 p
7、ir. Outer mitochondri&l memtirane protein parin *-*5&-14C00016-F*oc3e-26C0D016-R+DC0.002C0D004-n+OC5e-29CDD0D7-F.oc0.005cooooa-p.M2e-5C0a005-FDC4&-Scaaai-5-R.OC4e-14coaoio-F.OCLe-S3匚aaai3-R.OCC111 wl14. 一般设置从下拉列表中选择的期望终止值被用于程序的每个部分以区别重要的和不重要的 blast 比对。选定的值被用于所有的 blast 程序选择。若用户希望使用不同的终止值用于 blastn 比对,
8、用户必须改变优先选择表中的值。5.截短行通过选择选项 2(only UID remnants) 或选项 3(UID remnants and name of the organism) 行的右端移除这些残余部分。基于髙通盘测序的基因序列分析软件 FGeneral Settings Unique Identifier | Hide Lines | Remove Words |Unique identifier options Di$ptay original header section lines f* Ise original header section lines Place uniqu
9、e identifier infornnation at end of line厂Remove unique identifier information from lineRight-huficale line optionshubii its gs b LLtiibtK sbi aaa au j j jj.i i.LhiihLBbiissBaaad4J4J4iiLf* ;Do not.dqhItruncate Iirie广 Remove remnants ol the unique identifi砂R emove remnants of unique idenkilier and org
10、anism nameClear Format Set Format6.隐藏行基于离通蜀测序的基因住列分析软件General Settings | Unique IdentifierWords identifying low ihfDonation lineshypothetical|unknowr|Hide Lines | ReinoYe Words |This option allots you to improve th巳 information displayed in the listIf the header line to be displayed includes one of
11、the words in the tist the next line of the selected header section 円ill :b& displayed insteadTiy for example unknown, hypothetical, predictedClea Format Sei Famat I7.移除行输入“()”强迫移除括号中的关键词。“-:”暗示:若在行的前15 字符找到“:”,行是被左截短的。选项对于“,”同样适用。基于岛通吐测序的基因序列分析软件Generaf Settings 1 Unique Identifier | Hide Lines Remo
12、ve WordsThis option allows you to improve alphabetical sorting of the listWords or single chafacters included in the two H$ts are removed if th刖 appear at the beginning d a line.(remove word if in brackets gi1120390-Md description list for seciuence COi Slayer-like protein Thermus aquat: GLUCOSE-REP
13、RESSIBLE GENE PROTEIN g: ENOLASE (2-PHOSPHOGLYCERATE DEHYDRAF ENOLASE (2-PH05PH0GLYCEPATE DEHYDFA h&at; shock ptrot&in 70 Trichophyton rith DNA helicasiChange File NamesFile Name Chars. (|WF P0S =Pos. |Pos. 00. J2Backup : ilerval = 10 DNAT3:format3.密码子使用表F表包含三个域,显示当前序列的密码子使用、主要密码子表和当前序列的序列数据。華于高通肚测序
14、的基丙序列分析软件-innFil& Current Main Build Ink Preference HelpCodon 倨自孚current Main codon table Sequence dataThe 口匸otein sequence lacks a start codan and may 匸epresent the C-terainai of & protein*Protein sequence:1 FLAIVKFDIF YHKVTPEDVG LSIGRYPKSP PRKFVLKLAD PRYIKQLNEF51 NPST*DNA sequence:Name : C00008-f*
15、 *Length: 165 base pairsBase composition:NumberPercentA :5835,2%C ;3320*0%1 U A *Codon frequency in codon usage table Ana$p cut使用主要的密码子使用表来逆向翻译蛋白质序列,以设计PCR引物。I 基于AiSA测*宇的基IS序列分析软件 1Fils CurrentMainBuild Info P(Terences Heip Frequency, Amtnc Acid$ F2%” Percentage, Amino Acids F3Ala:Fieque ncy” Ptotei
16、n Percentage, ProteinF4F5Asn: ARTAsp: GATCys :Total Number Of Codons FGGlu: GAAGly: GGT7 Preferred CodonsF7His :Avoided Codons F8Leu: TTALys: AAAMet:ATG Phe:ITTPro: CCTSer: TCTThr:ACA Trp:TGGTyr: TAGVai: GTTEnd:TAAThird pos: G=13.6焉 C=24.3% A=33.0%T=29. lscodon table*Sequence dataAna$p cutT otal cod
17、orrs: 33,894中。在用户可以减少允许用户为当前蛋白质序列增加或减少密码子使用数据到主密码子使用表 密码子使用数据之前务必显示和翻译想要移除的序列。Codon frequency (or translated fegion of sequence C00008-F. Frame 24.逆向翻译氨基酸序列1x1在回复翻译一个蛋白质序列之前,必须从文件菜单中选择密码子格式来装载密码子使用表。基于鬲轴址测序的基因序列分析软件File Current Main Build Info Prefers nc:虫The protein sequence 丄aclcs a start codon an
18、d may represent the C-terimina丄 of a proteinProte in sequence:1 FLAIVKFDIF YHKVTPEDVG LSIGRYPKSP PRKFVLKLAD PRYIKQLNEF51 NPST*DNA sequence:Maine : C00008-F *Length; 15 base pairsBase composition:Codori frequericy h codon usage table Ana$p. cut回复翻译的退化程度可以通过选择退化水平 1 - 6进行控制,1暗示只有首选的密码子才可 以使用于回复翻译(结果的链
19、是没有退化位点的) 。Back-Translation OptionsCodon File: ACC CUTDegeneration levelPreferred codons only * level 1 ODegeneration level 2 CDegene旭tion level 3 C fDegenefatipn level 4JDegeneration level 5 C All codons, level 6 OStrand T ranslate to Watson strand( Translate to Crick strand CCancel | Tianwlal |第四章
20、序列比对1.手动搜索点击“手动”命令按钮以隐藏方案选项,并且展示一个文本域以用于手动进入或经过一个寻求 行。一个DNA行必须至少是8个碱基,而蛋白质行则至少是 4个氨基酸残基。2.自动搜索点击“方案”命令按钮隐藏手动选项,同时允许用户选择包含于当前方案中的序列。3.比对两个序列相同的区域Search/Compare Two Sequences ”命令的比较是在选自于文件列表中的两个序列中进行的。另外,两个序列被展示在图谱中,并显示出相同的部分。4.比对两个序列点阵在比较序列之前,当用户点击“文件 /选择序列”时,这些序列必须从展示的文件列表中选择。在选择一个或两个序列之后,点击“建造”以生成完
21、整的点阵。对于长序列,可能需要一些时间。当矩阵完成时,点击“过滤”以清晰的展示矩阵。表大小可变,但是没有被刷新的话自己是不会重 画的。Finidied.Cutoff |p2Dot Matrix PlotFilterRefreshCkise(1)过滤矩阵用最小值4进行过滤:Dot Matrix PlotFileCoordinates: 307 716Cutoff | 4BuidFilterRefreshCkise用最小值5进行过滤:Dot MalrtK PlotCutoff5Buidf“ntefl| RefreshCloB用最小值9进行过滤:Dot Matrix PlotFinished.Cut
22、offRefreshBuild(2)寻找和观察一个匹配当用指示器搜索点阵时点下左鼠标键,展示在两个序列中的匹配的部分。释放左键并突然靠近 最近的对角线(如果用户靠得足够近的话)以显示匹配的 属性(对角线)。TxL Dot Matrix MatchPropatties of match: * ISeq 1: C00003-F. Len: 1049 Match: 1 - 1049Seq 2: C00008-F. Len: 1049 Match: 丄-1049Length o match = 1045 1 TlrillGG CAATA GTTAA GTTC GATATTTTCTATCATAAAGTGAC GC CTG51 AAGATGTA&GCCTCAGCATAGGCAGATACCCAAAAAGCCCCCCCAUAAAG1.01 TITGTGCTTAAATTGGCTATAGA SAC AA C GGGATTTCTC GAAGGCTC &AA151 GTGAAAGATAACAAGAT
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1