如何根据染体坐标快速得到基因组的DNA序列

巴黎公社原则>CHINESEGEY霸道太子如何根据染⾊体坐标快速得到基因组的DNA序列
第⼀种⽅法
这种⽅法的优点是速度较快,但略复杂,适合需要快速获取⼤批量坐标位置的情形,具体做法如下:原子核物理评论
提供了⼀个⽅便的⼩⼯具
剩女的黄金时代
python -m twobitreader hg19.2bit < example.bed
染⾊体的位置信息在 bed ⽂件中给出,.2bit ⽂件格式是 UCSC Genome Browser 的基因组序列⽂件索引格式,可以在
下载到。UCSC Genome Browser 也提供了命令⾏⼯具可以从基因组序列⽂件⽣成 .2bit ⽂件。
twobitreader 可以⽤ pip 直接安装,也可以在
下载源码安装。
第⼆种⽅法
这种⽅法的优点是简单,缺点是速度较慢,⽽且输出数据的格式是 XML。
通过 ucsc genome browser 提供的在线⼯具,例如想获取 chr13:32890466-32890664 区域上的 DNA 序列,访问如下 url genome.ucsc.edu/cgi-bin/das/hg19/dna?segment=chr13:32890466,32890664
可以得到 chr13 上,start = 32890466, end = 32890664 之间的染⾊体序列。需要注意的是输出的是 xml 格式的数据。第三种⽅法
利⽤ samtools 的 faidx ⼯具,⽅法如下:
⾸先⽤ faidx ⽣成 fasta 序列⽂件索引
samtools faidx hg19.fa
然后利⽤命令⾏获取染⾊体区域序列
拳皇13卡
samtools faidx hg19.fa chr13:32890466-32890664
这种⽅法所得输出是 fasta 格式序列。
>昂达vx610w时尚版

本文发布于:2024-09-22 19:25:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/570834.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   获取   位置   需要   坐标   输出
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议