多文本导入今天介绍下如何一次导入71个txt文本,每个文本2列数据,一共142列。希望看完这个不要再一次次复制粘贴了,多次复制又累又容易出错。操作步骤很简单,在Data按钮下面选择impo......
2023-01-12
最早了解到主成分分析(Principal Component Analysis,PCA)是在一位师兄的毕业答辩上,当时听得是云里雾里,一头雾水。其实,主成分分析是因子分析的一种常用方法,主要目的是为了减少变量数目,也就是降维。
在高通量测序中,主要基于基因表达量、种群丰度等进行样本的聚类,下图是一篇客户文章的基于表达量的PCA结果。
(Plant biotechnology journal, 2018)
那么该如何进行主成分分析呢?今天为大家介绍如何用Origin进行分析并完成散点图的绘制。
数据准备
本文所用的数据是OmicShare PCA分析工具的示例文件(如下图),大家可随意下载练习(http://www.omicshare.com/tools/Home/Soft/pca)。
示例为6个样本的1300多个基因的表达量数据,接下来需要做得是把每个样本的对应的1300多个数据用2个数据表示,降到2维后,就可用二维的散点图展示。
这里每个基因的名称视作1个变量,因此需要对数据进行手动转置,为了分组着色,在前面加1列分组数据,如下图(Sheet1 →Sheet3)。然后打开Origin,将数据粘贴到Origin的表格中。
对于这一点OmicShare的 PCA工具就显得智能和方便多了,直接上传数据,点提交任务就好啦。
分析作图
点窗口右侧的Apps,在弹出的窗口中点今天要用的PCA插件。
然后选择输入数据(Input data),具体方法如下图,注意这里的数据添加小技巧。
在绘图设置中这里选2D的散点图,如下图,当然你也可以选3D的散点图(使用3个主成分),点OK 即可完成分析和作图。如果样本较多,也可以选择显示置信区间椭圆(Show Confidence Ellipse)。
双击Score Plot中的图表,放大散点图,然后就可以对图表进行个性化调整,比如改变标记的形状、颜色、大小,显示数据标签等。
最终的的效果如下:
相关文章
多文本导入今天介绍下如何一次导入71个txt文本,每个文本2列数据,一共142列。希望看完这个不要再一次次复制粘贴了,多次复制又累又容易出错。操作步骤很简单,在Data按钮下面选择impo......
2023-01-12
今天教大家如何绘制时间轴图,并展示网格线的使用方法和坐标后缀的编辑。通常,在GraphPad中的Column中,新建一组数据后,会自动生成散点图,然后对其进行相应的编辑,即可将一张散点图......
2023-01-12
在Origin软件绘图过程中经常会遇到以下情况,比如图表中出现很大一块空白区,这样既浪费空间,也使得数据不集中影响查看数据和排版的美观。为了使得数据更易读并节省空间,可以用设置......
2023-01-12
1、打开软件,选择空白;自动生成的表格只有两列,如果你的数据组多,可以在页面空白处单击鼠标右键增加新列,就出现很多啦。然后,将整理好的数据粘贴进来2、生成图形;全选需要做......
2023-01-12
Endnote是科研小伙伴们写作论文时最常用、功能最强大的文献管理软件之一。用Endnote写作中文论文,比如中文期刊论文、硕博士毕业论文,可以说是每一个科研小伙伴们的必修课。但由于......
2023-01-12