巴黎公社原则>CHINESEGEY霸道太子如何根据染⾊体坐标快速得到基因组的DNA序列 第⼀种⽅法
这种⽅法的优点是速度较快,但略复杂,适合需要快速获取⼤批量坐标位置的情形,具体做法如下:原子核物理评论
提供了⼀个⽅便的⼩⼯具
剩女的黄金时代
python -m twobitreader hg19.2bit < example.bed
染⾊体的位置信息在 bed ⽂件中给出,.2bit ⽂件格式是 UCSC Genome Browser 的基因组序列⽂件索引格式,可以在
下载到。UCSC Genome Browser 也提供了命令⾏⼯具可以从基因组序列⽂件⽣成 .2bit ⽂件。
twobitreader 可以⽤ pip 直接安装,也可以在
下载源码安装。
第⼆种⽅法
这种⽅法的优点是简单,缺点是速度较慢,⽽且输出数据的格式是 XML。
通过 ucsc genome browser 提供的在线⼯具,例如想获取 chr13:32890466-32890664 区域上的 DNA 序列,访问如下 url genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=chr13:32890466,32890664
可以得到 chr13 上,start = 32890466, end = 32890664 之间的染⾊体序列。需要注意的是输出的是 xml 格式的数据。第三种⽅法
利⽤ samtools 的 faidx ⼯具,⽅法如下:
⾸先⽤ faidx ⽣成 fasta 序列⽂件索引
samtools faidx hg19.fa
然后利⽤命令⾏获取染⾊体区域序列
拳皇13卡
samtools faidx hg19.fa chr13:32890466-32890664
这种⽅法所得输出是 fasta 格式序列。
>昂达vx610w时尚版