ImageVerifierCode 换一换
格式:DOCX , 页数:8 ,大小:19.94KB ,
资源ID:4764120      下载积分:12 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4764120.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Bowtie2用法祥解.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

Bowtie2用法祥解.docx

1、Bowtie2用法祥解Bowtie2用法祥解懒人必看对参考序列构建index$ bowtie2-build genome.fasta index尝试使用前10000个reads进行比对$ bowtie2 -u 10000 -p 8 -x index -1 reads1.fq -2 reads2.fq -S out.sam使用8个线程进行比对$ bowtie2 -p 8 -x index -1 reads1.fq -2 reads2.fq -S out.sam比对的sam结果中添加了read group信息$ bowtie2 -p 8 -rg-id sample01 -rg PL:ILLUMIN

2、A -rg SM:sample01 -x index -1 reads1.fq -2 reads2.fq -S out.sam 常用的参数进行比对,可以更改其中的参数获得更好的结果$ bowtie2 -q -phred33 -sensitive -end-to-end -I 0 -X 500 -fr -un unpaired -al aligned -un-conc unconc -al-conc alconc -p 6 -reorder -x -1 m1gt; -2 | -U -S 用法:bowtie2 options* -x -1 -2 | -U -S bowtie2-build用法bow

3、tie2-build默认情况下将fasta文件换成index的数据库。$ bowtie2-build 必须参数:-x 由bowtie2-build所生成的索引文件的前缀。首先 在当前目录搜寻,然后在环境变量BOWTIE2_INDEXES中制定的文件夹中搜寻。-1 双末端测寻对应的文件1。可以为多个文件,并用逗号分开;多个文件必须和-2中制定的文件一一对应。比如:-1 flyA_1.fq,flyB_1.fq -2 flyA_2.fq,flyB_2.fq.测序文件中的reads的长度可以不一样。-2 双末端测寻对应的文件2.-U 非双末端测寻对应的文件。可以为多个文件,并用逗号分开。测序文件中的r

4、eads的长度可以不一样。-S 所生成的SAM格式的文件前缀。默认是输入到标准输出。以下是可选参数:输入参数-q输入的文件为FASTQ格式文件,此项为默认值。-qseq输入的文件为QSEQ格式文件。-f输入的文件为FASTA格式文件。选择此项时,表示-ignore-quals也被选择了。-r输入的文件中,每一行代表一条序列,没有序列名和测序质量等。选择此项时,表示-ignore-quals也被选择了。-c后直接为比对的reads序列,而不是包含序列的文件名。序列间用逗号隔开。选择此项时,表示ignore-quals也被选择了。-s/-skip input的reads中,跳过前个reads或者p

5、airs。-u/-qupto 只比对前个reads或者pairs(在跳过前个reads或者pairs后)。Default: no limit.-5/-trim5 剪掉5端长度的碱基,再用于比对。(default: 0).-3/-trim3 剪掉3端长度的碱基,再用于比对。(default: 0).-phred33输入的碱基质量等于ASCII码值加上33.在最近的illumina pipiline中得以运用。最低碱基质量是“#”。-phred64输入的碱基质量等于ASCII码值加上64.最低碱基质量是“B”。-solexa-quals将Solexa的碱基质量转换为Phred。在老的GA Pipe

6、line版本中得以运用。Default: off. -int-quals输入文件中的碱基质量为用“ ”分隔的数值,而不是ASCII码。比如40 4030 40.。Default: off. end-to-end模式下的预设参数-very-fast Same as: -D 5 -R 1 -N 0 -L 22 -i S,0,2.50 -fast Same as: -D 10 -R 2 -N 0 -L 22 -i S,0,2.50 -sensitive Same as: -D 15 -R 2 -N 0 -L 22 -i S,1,1.15 (default in -end-to-endmode) -v

7、ery-sensitive Same as: -D 20 -R 3 -N 0 -L 20 -i S,1,0.50loca模式下的预设参数-very-fast-local Same as: -D 5 -R 1 -N 0 -L 25 -i S,1,2.00 -fast-local Same as: -D 10 -R 2 -N 0 -L 22 -i S,1,1.75 -sensitive-local Same as: -D 15 -R 2 -N 0 -L 20 -i S,1,0.75 (default in -local mode) -very-sensitive-local Same as: -D

8、 20 -R 3 -N 0 -L 20 -i S,1,0.50 比对参数:-N 进行种子比对时允许的mismatch数.可以设为0或者1.Default: 0.-L 设定种子的长度.*功能选项给bowtie的一些参数设定值的时候,使用一个计算公式代替,于是值的大小与比对序列的长度成一定关系。有三部分组成: (a)计算方法,包括常数(C),线性(L),平方根(S)和自然对数(G); (b)一个常数; (c)一个系数.例如:为L,-0.4,-0.6则计算公式为: f(x) = -0.4 + -0.6 * x 为G,1,5.4则计算公式为: f(x) = 1.0 + 5.4 * ln(x)*-i 设

9、定两个相邻种子间所间距的碱基数。*例如:如果read的长度为30,种子的长度为10,相邻种子的间距为6,则提取出的种子如下所示:Read: TAGCTACGCTCTACGCTATCATGCATAAACSeed 1 fw: TAGCTACGCTSeed 1 rc: AGCGTAGCTASeed 2 fw: CGCTCTACGCSeed 2 rc: GCGTAGAGCGSeed 3 fw: ACGCTATCATSeed 3 rc: ATGATAGCGTSeed 4 fw: TCATGCATAASeed 4 rc: TTATGCATGA* 在-end-to-end模式中默认值为”-i S,1,1.1

10、5”.即表示f(x) = 1 + 1.15 *sqrt(x).如果read长度为100,则相邻种子的间距为12.-n-ceil 设定read中允许含有不确定碱基(非GTAC,通常为N)的最大数目.Default: L,0,0.15.计算公式为: f(x) = 0 + 0.15 * x,表示长度为100的read最多运行存在15个不确定碱基.一旦不确定碱基数超过15,则该条read会被过滤掉.-dpad Default: 15.-gbar 在read头尾个碱基内不允许gap. Default: 4. -ignore-quals计算错配罚分的时候不考虑碱基质量.当输入序列的模式为-f, -r或者-

11、c的时候,该设置自动成为默认设置.-nofw/-norc nofw设定read不和前导链(forward reference strand)进行比对; -norc设定不和后随链(reverse-complement reference strand)进行比对.Default: both strands enabled.-end-to-end比对是将整个read和参考序列进行比对.该模式-ma的值为0.该模式为默认模式, -local模式冲突.-local该模式下对read进行局部比对,从而, read两端的一些碱基不比对,从而使比对得分满足要求.该模式下 ma默认为2. 得分罚分参数-ma 设

12、定匹配得分. -local模式下每个read上碱基和参考序列上碱基匹配,则加分.在end-to-end模式中无效. Default: 2.-mp MX,MN设定错配罚分.其中MX为所罚最高分, MN为所罚最低分.默认设置下罚分与碱基质量相关.罚分遵循的公式为: MN + floor( (MX-MN)(MIN(Q, 40.0)/40.0) ).其中Q为碱基的质量值.如果设置了ignore-qual参数,则错配总是罚最高分. Default:MX = 6, MN = 2.-np 当匹配位点中read, reference上有不确定碱基(比如N)时所设定的罚分值.Default: 1.-rdg ,设

13、置在read上打开gap罚分,延长gap罚分.Default: 5, 3.-rfg ,设置在reference上打开gap罚分,延长gap罚分. Default: 5, 3.-score-min 设定成为有效比对的最小分值.在end-to-end模式下默认值为:L,-0.6,-0.6;在-local模式下默认值为: G,20,8.报告参数-k 默认设置下, bowtie2搜索出了一个read不同的比对结果,并报告其中最好的比对结果(如果好几个最好的比对结果得分一致,则随机挑选出其中一个).而在该模式下,bowtie2最多搜索出一个read 个比对结果,并将这些结果按得分降序报告出来.-a和-k

14、参数一样,不过不限制搜索的结果数目.并将所有的比对结果都按降序报告出来.此参数和-k参数冲突.值得注意的是:如果基因组含有很多重复序列时,该参数会导致程序运行极其缓慢.Effort 参数-D 比对时,将一个种子延长后得到比对结果,如果不产生更好的或次好的比对结果,则该次比对失败.当失败次数连续达到次后,则该条read比对结束. Bowtie2才会继续进行下去. Default: 15.当具有-k或-a参数,则该参数所产生的限制会自动调整.-R 如果一个read所生成的种子在参考序列上匹配位点过多.当每个种子平均匹配超过300个位置,则通过一个不同的偏移来重新生成种子进行比对. 则是重新生成种子

15、的次数. Default: 2.Paired-end 参数-I/-minins 设定最小的插入片段长度. Default: 0.-X/-maxins 设定最长的插入片段长度. Default: 500.-fr/-rf/-ff 设定上下游reads和前导链paired-end比对的方向. -fr: 匹配时,read1在5端上游, 和前导链一致, read2在3下游, 和前导链反向互补. 或者read2在上游, read1在下游反向互补; -rf: read1在5端上游, 和前导链反向互补, read2在3端下游, 和前导链一致; -ff: 两条reads都和前导链一致. Default: -fr

16、. 默认设置适合于Illumina的paired-end测序数据; 若是mate-paired, 则要选择rf参数.-no-mixed 默认设置下, 一对reads不能成对比对到参考序列上, 则单独对每个read进行比对. 该选项则阻止此行为.-no-discordant 默认设置下, 一对reads不能和谐比对(concordant alignment,即满足-I, -X, -fr/-rf/-ff的条件)到参考序列上, 则搜寻其不和谐比对(disconcordant alignment, 即两条reads都能独一无二地比对到参考序列上, 但是不满足-I,-X,-fr/-rf/-ff的条件).

17、 该选项阻止此行为.-dovetail read1和read2的关系为dovetail的时候,该状况算为和谐比对. 默认情况下dovetail不算和谐比对.-no-contain read1和read2的关系为包含的时候, 该状况不算为和谐比对. 默认情况下包含关系算为和谐比对.-no-overlap read1和read2的关系为有重叠的时候, 该状况不算为和谐比对. 默认情况下两个reads重叠算为和谐比对.输出参数-t/-time -un 将unpaired reads写入到.-un-gz 将unpaired reads写入到, gzip压缩.-un-bz2 将unpaired read

18、s写入到, bz2压缩.-al 将至少能比对1次以上的unpaired reads写入.-al-gz . ,gzip压缩.-al-bz2 . ,bz2压缩.-un-conc 将不能和谐比对的paired-end reads写入.-un-conc-gz . ,gzip压缩.-un-conc-bz2 . ,bz2压缩.-al-conc 将至少能和谐比对一次以上的paired-end reads写入.-al-conc-gz . ,gzip压缩.-al-conc-bz2 . ,bz2压缩.-quiet 安静模式,除了比对错误和一些严重的错误, 不在屏幕上输出任何东西.-met-file 将bowtie

19、2的检测信息(metrics)写入文件. 用于debug. Default: metrics disabled.-met-stderr 将bowtie2的检测信息(metrics)写入标准错误文件句柄. 和上一个选项不冲突. Default: metrics disabled.-met 每隔秒写入一次metrics记录. Default: 1. Sam 参数-no-unal不记录没比对上的reads.-no-hd不记录SAM header lines (以开头).-no-sq不记录SQ的SAM header lines.-rg-id 设定read group ID为text。在SAM文件的头中

20、增加一行RG,在输出的SAM文件中添加Tag RG:Z:text。-rg 使用text作为RG的一列,比如SM:Pool1。在RG中加入多列,则多次使用该参数即可。在进行Variant calling的过程中需要RG头,SM信息和Tag RG。性能参数-o/-offrate 无视index的offrate值, 以取代之. Index默认的 值为5. 值必须大于index的offrate值, 同时越大, 耗时越长,耗内存越少.-p/-threads NTHREADS 设置线程数. Default: 1-reorder 多线程运算时, 比对结果在顺序上会和文件中reads的顺序不一致, 使用该选项, 则使其一致.-mm 使用内存定位的I/O来载入index, 而不是常规的文件I/O. 从而使多个bowtie程序共用内存中同样的index, 节约内存消耗. 其它参数:-qc-filter 滤除QSEQ fileter filed为非0的reads. 仅当有qseq选项时有效. Default: off. -seed 使用作为随机数产生的种子. Default: 0.-version打印程序版本并退出-h/-help 打印用法信息并推出

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1