二代测序体进化-GWAS分析及案例解析

⼆代测序体进化-GWAS分析及案例解析体进化-gwas分析
体进化基础分析
PCA
分析原理
PCA(Principal Component Analysis),即主成分分析⽅法,是⼀种使⽤最⼴泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的⼯作就是从原始的空间中顺序地⼀组相互正交的坐标轴,新的坐标轴的选择与数据本⾝是密切相关的。其中,第⼀个新坐标轴选择是原始数据中⽅差最⼤的⽅向,第⼆个新坐标轴选取是与第⼀个坐标轴正交的平⾯中使得⽅差最⼤的,第三个轴是与第1,2个轴正交的平⾯中⽅差最⼤的。依次类推,可以得到n个这样的坐标轴。通过这种⽅式获得的新的坐标轴,我们发现,⼤部分⽅差都包含在前⾯k个坐标轴中,后⾯的坐标轴所含的⽅差⼏乎为0。于是,我们可以忽略余下的坐标轴,只保留前⾯k个含有绝⼤部分⽅差的坐标轴。事实上,这相当于只保留包含绝⼤部分⽅差的维度特征,⽽忽略包含⽅差⼏乎为0的特征维度,实现对数据特征的降维处理。
简洁点来讲现在有这样的数据,100个样品,2M标记,即是2000000X100的矩阵,那么就通过数学降维的⽅法简化到100X3甚⾄100X2乘(即PC1,PC2)
分析软件
GCTA
tassel
EIGENSTRAT
结果展⽰
PCA结果矩阵(特征向量)
GWAS_1 0.0295707 0.0174155 -0.0245656
GWAS_10 0.0212291 -0.0552983 -0.0280335
GWAS_100 -0.0645872 0.00456635 0.00588907
GWAS_101 -0.0779853 -0.0317529 0.0138288
GWAS_102 -0.0790227 -0.0295285 0.0147819
GWAS_105 -0.0845384 0.000685319 0.0108059
GWAS_108 -0.0779536 -0.00380985 0.0101755
GWAS_109 -0.0789908 -0.00534946 0.012742
GWAS_11 0.0152839 0.0185823 -0.0305629
GWAS_110 -0.080786 -0.00255263 0.0131448
* 第⼀列样品名称,第⼆列PC1的值,第三列PC2的值,第四列PC3的值(也就是平时看到的结果图的横纵坐标来源)
* PCA解释数据结果(特征值)
54.402
32.2402
25.6809
18.0063
13.7968
9.6096
9.46086
9.00158
8.16587
7.60115
* 这个结果每⼀个值对应的维度的解释情况,⾏数与样品数量⼀致,第⼀⾏代表第⼀维,依次类推;每⼀⾏除以所有⾏数的和即是其第⼏维解释的⽐例PCA结果图
结果要点
结果图中相对分结果合理,⼤部分跟⽣产经验相⼀致
解释度可接受,这个⽅⾯想了解的话,可以看看⽂献的,不是硬标准
TREE
分析原理
系统发育分析中,最重要和最常见的内容为构建系统发育树。系统发育树也称为系统发⽣树(phylogenetic tree)、聚类树或者进化树(evolutionary tree)。以树状结构表⽰各个节点的进化关系,枝点可以是物种、同⼀物种的样本、基因等单元。
根据SNP或者Indel 构建其系统进化树,可以展⽰体中不同个体的相互关系,基因变异相似的往往会在同⼀个树的cluster中,⼀颗好的树可以给你⼀个体⼤概的分类(你这个体中有多少个cluster,⼀般同⼀个亚种或者有亲缘关系的个体会形成⼀个
cluster),这是体遗传中重要的⼀部分。其构建的核⼼原理就是把每个位点SNPs的信息提取,然后计算每个变异位点的差异得到算法中的“距离”。
分析软件
treebest
mega
taseel
snphylo
进化标记phylip
算法
nj 临近算法
ml 最⼤似然值
结果展⽰
结果要点
分清晰,⼤部分样品与已知⽣产经验⼀致STructure

本文发布于:2024-09-21 23:25:12,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/374751.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:坐标轴   结果   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议