推广 热搜: 行业  设备    系统  参数  经纪    教师  机械  中国 

基因型数据绘制PCA图和聚类分析图

   日期:2024-11-10     作者:n19v1    caijiyuan   评论:0    移动:http://tiush.xhstdz.com/mobile/news/1543.html
核心提示:用PCA做为GWAS的协变量,相当于将品种结构考虑进去。它类似将不同品种作为协变量,或者将群体结构矩阵Q作为协变量。下面看一下利

用PCA做为GWAS的协变量,相当于将品种结构考虑进去。它类似将不同品种作为协变量,或者将群体结构矩阵Q作为协变量。

基因型数据绘制PCA图和聚类分析图

下面看一下利用基因型SNP数据进行PCA计算,以及可视化的分析。

很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。

绘制后的图如下:

2-D PCA图:

图片解释,将每个品种用不同的颜色表示,同时绘制置信区间圆圈,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。

3-D PCA图:

图片解释,将每个品种用不同的颜色表示,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异,Z坐标是PC3,解释1.02%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。

基因型数据:

共有3个品种A,B,C,共有412个个体。其中:

SNP个数为:41013

计算思路:

1,对数据进行清洗,将其转化为0,1,2的形式

2,计算G矩阵

3,计算PCA的特征向量和特征值

4,根据特征值计算解释百分比

5,根据特征向量和品种标签,进行PCA的绘制

绘制代码如下:

首先,使用plink命令,将基因型数据转化为012的raw格式:

结果生成plink.raw文件。

然后使用R语言,计算PCA,并绘制PCA图。

聚类分析思路:

1,计算个体的亲缘关系矩阵G矩阵

2,因为数据太多,随机选择100个,用于聚类

默认的作图,太挤。

画圈图:

可以看到,A,B,C三个品种,可以分开,分得很开。

本文地址:http://tiush.xhstdz.com/news/1543.html    物流园资讯网 http://tiush.xhstdz.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新文章
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新文章
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号