1 介绍
基因组重测序是对已知基因组序列的物种进⾏不同个体的基因组测序,并在此基础上对个体或体进⾏差异性分析。 琼斯模型
基于全基因组重测序技术,⼈们期望快速进⾏资源普查筛选,寻到⼤量遗传变异,实现遗传进化分析及重要性状候选基因的预测。随着测序成本降低和拥有参考基因组序列物种增多,全基因组重测序成为动植物育种和体进化研究迅速有效的⽅法。 雅园玉道
· SNP 强调体在这个位点有多样性。
索南加乐
· Genotype 强调个体在这个位点是哪种基因型。SNV属于genotype的范畴,表⽰这个genotype 是个突变,是第⼀⽆⼆的。
gatk分析流程
gatk相关参数
2 基因组SNP calling分析流程
· ⾸先利⽤bwa,samtools,picard对参考基因组ref.fa建⽴索引,随后使⽤基因组⽐对软件bwa将fastq⽂件⽐对回参考基因组,⽣成sam⽂件(这⾥使⽤例⼦数据由于⼩于10M,所以使⽤bwa的-is参数,当参考基因组很⼤的时候,使⽤bwtsw参数)
特里伊格尔顿· 使⽤picard对sam⽂件排序后⽣成bam⽂件(这⾥如果使⽤samtools的话会删除重复位点,⽽picard只会标记重复并不会删除)。之后使
吴英案始末⽤samtools对bam⽂件建⽴索引,利⽤已经注释过的indel.vcf⽂件对indel周围进⾏realignment,这个
操作有两个步骤,第⼀步⽣成需要进⾏realignment的位置的信息,第⼆步 才是对这些位置进⾏realignment,最后⽣成⼀个重排好的BAM。
连续油管