第三篇:基因型数据可视化:kingship,LD,MDS,PCA
笔记计划分为六篇:
第一篇:读取plink基因型数据和表型数据
第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控
第三篇:基因型数据可视化:kingship,LD,MDS,PCA
第四篇:一般线性模型进行GWAS分析(GLM模型)
第五篇:混合线性模型进行GWAS分析(MLM模型)
第六篇:TASSEL结果可视化:QQ plot,曼哈顿图
已完成前两篇,本篇是第三篇。
上个教程中,质控后的数据:
读取到TASSEL中:
kinship矩阵是亲缘关系矩阵,是根据样本的SNP,构建样本间的亲缘关系矩阵,在GS中也叫G矩阵。
首先,选中基因型数据,然后点击Kinship按钮:
默认选项,点击OK
查看结果:
将Kinship矩阵导出到本地文件夹,通过R语言进行可视化。
设置名称:
导出到本地:
文件查看: 前三行,为文件的信息,第一列为ID,没有行头。
「使用R代码进行可视化:」
选中基因型,选择PCA按钮:
默认选项:
PCA结果1:PCA得分
PCA结果2:特征值及百分比及累计百分比
PCA结果3:特征向量
将PCA结果导出到本地:
「使用R语言绘制PCA图:」
当然,也可以画3D-PCA:
当然,这里可以见PCA不同的解释百分比加到坐标轴上,这里不再做介绍,感兴趣的可以翻看我之前的博客内容。
在GWAS分析时,MDS分析和PCA分析类似,都可以将成分作为协变量放到模型中,可视化也和PCA类似.
「MDS分析分为两步:」
这里我们做一下演示:
选中基因型,点击Distance Matrix
生成距离矩阵:
然后进行MDS分析:
生成结果:
导出到本地:
查看文件:
「使用R语言进行可视化:」
可以看到MDS的图和PCA的图比较类似。
下一章节,我们进行:的部分,到时候和R语言进行比较,深入理解GLM模型的本质。
下期见!