免费JIZZ大全

R語言對基因表達量數據RNA-seq做PCA分析

PCA(principal component analysis )主成分分析,可以分析樣品之間相關性,確定樣品總體上的差異,或者查看是否有批次效應等

輸入數據:

attachments-2018-06-4otjU74w5b23bb986f3fd.png

代碼部分,篩選基因也可以參照另一篇文章,而不一定是選取200個變化最大的基因,R篩選基因


myfpkm<-read.table("All_gene_fpkm.xls",header=TRUE,comment.char="",sep = "\t",check.names=FALSE,row.names=1)
probesetvar = apply(myfpkm, 1, var) #表達變化大的基因
ord = order(probesetvar, decreasing=TRUE)[1:200] #前200個基因,或者更多
pca = prcomp(t(myfpkm[ord,]), scale=TRUE)
ss=summary(pca) #繪圖:
plot(pca$x[,1:2],col=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))
#或者3D:
library(scatterplot3d)
scatterplot3d(pca$x[,1:3],color=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))

attachments-2018-06-XoRqbPhy5b23bba3a2692.pngattachments-2018-06-sN5ZObFx5b3447890610f.jpg

參考文獻:http://www.nature.com/articles/nprot.2009.97

更多生物信息課程:

1. 文章越來越難發?是你沒發現新思路,基因家族分析發2-4分文章簡單快速,學習鏈接:、

2. 轉錄組數據理解不深入?圖表看不懂?點擊鏈接學習深入解讀數據結果文件,學習鏈接:;

3. 轉錄組數據深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接:

4. 轉錄組數據怎么挖掘?學習鏈接:、

5.?、、

6. 生物信息入門到精通必修基礎課:、、、、、、

7. 醫學相關數據挖掘課程,不用做實驗也能發文章:、、 、、、、

8.其他,、、、

9.組學大講堂全部生物生信數據挖掘課程可點擊

  • 發表于 2018-06-04 15:21
  • 閱讀 ( 20284 )
  • 分類:轉錄組

0 條評論

請先 登錄 后評論
omicsgene
omicsgene

生物信息

529 篇文章

作家榜 ?

  1. omicsgene 529 文章
  2. 安生水 252 文章
  3. Daitoue 167 文章
  4. 生物女學霸 120 文章
  5. 紅橙子 78 文章
  6. CORNERSTONE 72 文章
  7. 生信老頑童 48 文章
  8. landy 37 文章