小试牛刀:教你3分钟分析DNA甲基化数据

⼩试⽜⼑:教你3分钟分析DNA甲基化数据
之前的推⽂跟⼤家交流的是关于⼀些甲基化概念的东西,从现在开始要跟⼤家开始聊聊真正的甲基化数据的分析和处理了。当然,⽬前有很多⽹站⽀持甲基化数据的在线分析,但是如果⼤家希望⾃⼰的数据分析更加个性化以及多元⼀点,还是建议⼤家下载原始数据或者矩阵数据进⾏处理。
废话不说,开始正式的讲解。
1
我们选择第⼀个进去。发现该数据集研究的是⾃发性肺纤维化。vb脚本
轮廓度
该数据集是由12个样本组成,其中前8个样本是肺纤维化,后⾯4个为正常对照组。在该数据集中,我们下载矩阵数据。可以直接点击Series Matrix file(s)直接进⾏下载。但是在这⾥,我们打算⽤代码进⾏下载和处理。
2
在正式下载之前,需要⼤家安装以下的包。
同时,我们需要⼈为地⽣成⼀个的⽂件。这个⽂件由两列构成,分别为group和sample。具体的需要根据每个数据集进⾏调整。
3
开始加载我们分析所需要的R包,并对数据进⾏下载,读取和简单的预处理。
这⾥我们可以看⼀下标准化之前和之后的箱线图的分布。我们可以看出,标准化处理之前的箱线图的中位值未处于同⼀⽔平线上。⽽标准化处理后的箱线图中所有样本均处于同⼀⽔平线上,使各种实验条件下的测量可以相互⽐较,消除测量间的⾮实验差异。这样所有的样本就具有可⽐性了。
4
我们需要对我们的数据进⾏质控,只有数据质量达到标准,我们后续的分析才能有保障。
这张densityBeanPlot图我们可以发现这批样本甲基化⽔平有两个峰,第⼀个峰位于0附近,第⼆个峰位于1附近,这⾥可以看到甲基化⽔平的⼀个整体的分布。
抚州地质学院5
我们对甲基化位点进⾏甲基化分析并绘制热图。focusaudio
妈祖城网
6
6
我们对甲基化差异的区域也需要进⾏分析。
7
我们打开dmrs.xls⽂件,发现没有基因的名字,所以最后⼀步,我们需要对这个⽂件进⾏注释。注释过程我们需要以下⼏列数据,chr, start, end, Ref,Alt。其中Ref,Alt这两列数据缺失,需要⼿动⽤0补充。
以上就是甲基化矩阵数据的分析过程,整个操作过程也⽐较简单,希望⼤家不要只看⼀下哦,最好是操作⼀遍。另外对每条代码也最好去仔细理解⼀下。下次推⽂开始,我们开始要讲解关于原始甲基化数据的处理!
征稿启事
七月论坛「医学⽅」现正式向粉丝们公开征稿!内容须原创⾸发,与科研相关,⼀经采⽤,会奉上丰厚稿酬(300-2000元),详情请戳。
“医学⽅”始终致⼒于服务“医学⼈”,将最前沿、最有价值的临床、科研原创⽂章推送给各位临床医师、科研⼈员。

本文发布于:2024-09-21 23:31:31,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/464569.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   分析   需要   下载
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议