circos教程

rcos为了能准确地画出染体示意图,染体的定义,位置,大小,以及显示的形式都是circos需要考虑的。这些要素需要在数据文件当中定义出来。
数据结构
染体组型(karyotypes)是一类特殊的数据。一般的,它保存在名为文件当中。它将定义染体的大小,ID,名称和颜。每一行一条染体,格式如下:
chr - ID LABEL START END COLOR
最开始的chr表示,这一行将定义一个染体。然后是一个短线占位符。这个占位符通常用来定义所属关系,对于染体来说,没有所属。
ID是染体唯一且不能重复的标识。之后的LABEL是将来用于显示在图上的文本。如果一个染体组型文件里面包含多个不同来源的染体组,设置ID最好的办法就是使用前缀。比如hs=homo sapiens, mm=mus musculus等等。有时候你可以使用hs19做为前缀来明示数据来源版本。其实,即使是只有一个来源的染体组,也最好使用前缀,以规范文件格式。
START和END值定义了染体的大小。对于染体组型文件,需要指明的是,这里的START和END应该是染体本身的大小,而不是你想绘制部分的起止位置。指定绘制部分将由其它文件来定义。
COLOR是于定义显示的颜。如果染体组不以条纹(cytogenetic bands)图谱覆盖的话,那么就会以这里设置的颜显示。对于人类基因组而言,circos预设了与染体相同的名字做为颜名,比如chr1, chr2, … chrX, chrY, chrUn.
下面就是hg19的例子:
男生女生金版封面
chr - hs1 hs1 0 249250621 chr1
chr克曼模型 - hs2 hs2 0 243199373 chr2
chr - hs3 hs3 0 198022430 chr3
chr - hs4 hs4 0 191154276 chr4
chr - hs5 hs5 0 180915260 chr5
chr - hs6 hs6 0 171115067 chr6
chr - hs7 hs7 0 159138663 chr7
chr - hs8 hs8 0 146364022 chr8
chr - hs9 hs9 0 141213431 chr9
chr - hs10 hs10 0 135534747 chr10
msdchr 区域收入差距- hs11 hs11 0 135006516 chr11
chr - hs12 hs12 0 133851895 chr12
chr - hs13 hs13 0 115169878 chr13
chr - hs14 hs14 0 107349540 chr14
chr - hs15 hs15 0 102531392不给力英文 chr15
chr - hs16 hs16 0 90354753 chr16
chr - hs17 hs17 0 81195210天津信息港 chr17
chr - hs18 hs18 0 78077248 chr18
chr - hs19 hs19 0 59128983 chr19
chr - hs20 hs20 0 63025520 chr20
chr - hs21 hs21 0 48129895 chr21
chr - hs22 hs22 0 51304566 chr22
chr - hsx hsx 0 155270560 chrx
chr - hsy hsy 0 59373566 chry
一般的,我们都会在染体组型文件当中加上条纹图谱的信息,这样才会让染体图谱看上去有被染的效果。文件格式与之前的一致,也只有七列。

本文发布于:2024-09-20 15:28:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/570926.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:染色体   定义   文件   组型   颜色   前缀   显示   需要
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议