輸入數據:
代碼部分,篩選基因也可以參照另一篇文章,而不一定是選取200個變化最大的基因,R篩選基因:
myfpkm<-read.table("All_gene_fpkm.xls",header=TRUE,comment.char="",sep = "\t",check.names=FALSE,row.names=1)
probesetvar = apply(myfpkm, 1, var) #表達變化大的基因
ord = order(probesetvar, decreasing=TRUE)[1:200] #前200個基因,或者更多
pca = prcomp(t(myfpkm[ord,]), scale=TRUE)
ss=summary(pca) #繪圖:
plot(pca$x[,1:2],col=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))
#或者3D:
library(scatterplot3d)
scatterplot3d(pca$x[,1:3],color=rep(c(1,2,3,4,1,2,3,4),each=3),pch=rep(c(16,17),each=12))
參考文獻:http://www.nature.com/articles/nprot.2009.97
1. 文章越來越難發?是你沒發現新思路,基因家族分析發2-4分文章簡單快速,學習鏈接:、
2. 轉錄組數據理解不深入?圖表看不懂?點擊鏈接學習深入解讀數據結果文件,學習鏈接:;
3. 轉錄組數據深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接:
4. 轉錄組數據怎么挖掘?學習鏈接:、
5.?、、
6. 生物信息入門到精通必修基礎課:、、、、、、
7. 醫學相關數據挖掘課程,不用做實驗也能發文章:、、 、、、、
8.其他,、、、
如果覺得我的文章對您有用,請隨意打賞。你的支持將鼓勵我繼續創作!