首页 > 其他专区 > EndNote >

Origin 如何做主成分分析?

EndNote 2023-01-12

最早了解到主成分分析(Principal Component Analysis,PCA)是在一位师兄的毕业答辩上,当时听得是云里雾里,一头雾水。其实,主成分分析是因子分析的一种常用方法,主要目的是为了减少变量数目,也就是降维。

在高通量测序中,主要基于基因表达量、种群丰度等进行样本的聚类,下图是一篇客户文章的基于表达量的PCA结果。  

下载.jpeg

(Plant biotechnology journal, 2018)  

那么该如何进行主成分分析呢?今天为大家介绍如何用Origin进行分析并完成散点图的绘制。

数据准备

本文所用的数据是OmicShare PCA分析工具的示例文件(如下图),大家可随意下载练习(http://www.omicshare.com/tools/Home/Soft/pca)。

下载 (1).jpeg

示例为6个样本的1300多个基因的表达量数据,接下来需要做得是把每个样本的对应的1300多个数据用2个数据表示,降到2维后,就可用二维的散点图展示。

这里每个基因的名称视作1个变量,因此需要对数据进行手动转置,为了分组着色,在前面加1列分组数据,如下图(Sheet1 →Sheet3)。然后打开Origin,将数据粘贴到Origin的表格中。

640.gif

对于这一点OmicShare的 PCA工具就显得智能和方便多了,直接上传数据,点提交任务就好啦。

分析作图

点窗口右侧的Apps,在弹出的窗口中点今天要用的PCA插件。

下载 (2).jpeg

   

然后选择输入数据(Input data),具体方法如下图,注意这里的数据添加小技巧。

640 (1).gif

在绘图设置中这里选2D的散点图,如下图,当然你也可以选3D的散点图(使用3个主成分),点OK 即可完成分析和作图。如果样本较多,也可以选择显示置信区间椭圆(Show Confidence Ellipse)。

下载 (3).jpeg

双击Score Plot中的图表,放大散点图,然后就可以对图表进行个性化调整,比如改变标记的形状、颜色、大小,显示数据标签等。

640 (2).gif

最终的的效果如下:

下载 (4).jpeg


Copyright © 2016-2023 office学习教程网 office.tqzw.net.cn. All Rights Reserved.