免费JIZZ大全

20個轉錄組基本知識點-你必須知道!

做轉錄組實驗,發轉錄組文章,你不得不知道的20個基本知識點。

隨著測序成本的不斷下降,轉錄組測序分析已然成為生物學及醫學研究不可或缺的技術手段。

但是,對于大多數初學者來說,會遇到各種各樣的問題。這里,小編就給大家重點介紹一下轉錄組測序分析的相關知識。

Question and Answer

1、什么是轉錄組測序?

轉錄組廣義上指在某一生理條件下,細胞內所有轉錄組產物的集合,包括:mRNA、ncRNA、rRNA等;狹義上指所有mRNA的集合。

轉錄組測序的研究對象為特定細胞在某一功能狀態下所能轉錄出來的所有RNA的總和,主要包括mRNA和ncRNA。

轉錄組具有時間特異性、組織特異性、空間特異性等特點。

2、無參轉錄組和有參轉錄組的區別?

如果所研究的物種有組裝注釋質量較好基因組序列,且和該基因組序列比對效率較高,那么可以采用有參轉錄組的分析策略,直接進行分析。反之,則需要按照無參轉錄組的分析策略進行轉錄本組裝,構建unigene庫,然后進行后續分析。

3、普通轉錄組測序適用于哪些情況?

普通轉錄組測序主要適用于兩大類:一是不同的生長階段或者發育過程;二是不同的環境、藥物、病原菌等逆境脅迫處理。

4、轉錄組測序推薦的測序數據量?

轉錄組測序所需數據量與所研究物種的基因組大小有關,基因組越大,則所需數據量越大。按照我們的經驗來說:

常規物種一般建議6G數據即可;

基因組較大的物種推薦8G以上數據,比如:小麥建議10G數據起,甘蔗、甘薯建議至少8G數據。

5、轉錄組測序的取樣建議?

取樣要遵守三個原則:代表性和一致性原則、迅速性原則、低溫原則。具體可以參考小編之前發的一篇推文《藍字為鏈接可點擊

6、轉錄組測序必須做生物學重復么?需要幾個重復?

生物學重復是生物實驗所必須的,轉錄組測序也不例外,至少3 次生物學重復。

準備生物重復樣品時,通過對實驗的預先設計和控制,盡可能將與實驗處理無關的背景條件控制在同一水平,減少批次效應對結果的影響。

7、轉錄組測序可以同時測到mRNA、lncRNA、micRNA以及circRNA么?

我們通常所講的轉錄組測序只能測到mRNA。但是全轉錄組測序通過構建兩個測序文庫(一是小RNA測序文庫、二是lncRNA測序文庫)是可以測到以上4種RNA的。

8、有參轉錄組測序分析中,與參考基因組的比對效率多高才能夠滿足后續分析?

與參考基因組的比對效率與多個因素有關,包括基因組組裝質量、測序質量、有無污染等;一般來說,與參考基因組的比對效率在70%以上時,該基因組可以滿足后續的分析需求。當比對效率低于60%時,需要考慮換參考基因組或者按照無參轉錄組分析策略進行分析。

9、所研究物種有參考基因組時,必須按照有參的來分析么?

按照有參或者無參進行轉錄組分析,取決于基因組的質量、所研究物種與參考基因組的比對效率。具體如下:

若參考基因組質量較差,則可以選擇按照無參轉錄組分析策略進行分析;

若所研究物種與參考基因組比對效率比較低,則需要按照無參轉錄組分析策略進行分析。

10、做完轉錄組之后一定要進行Q-PCR驗證么?一般驗證多少個差異基因合適?

目前來說,Q-PCR驗證是轉錄組測序分析必不可少的補充驗證實驗,發文章必須。一般驗證15-20個差異基因比較合適。

11、Q-PCR與轉錄組測序結果的吻合度一般多高是合適的?為什么會出現不吻合的現象?

Q-PCR與有參轉錄組分析結果的吻合度在80%以上;Q-PCR與無參轉錄組分析結果的吻合度在70%以上。

出現結果不吻合現象的原因如下:實驗所用樣本弄混;沒有使用與轉錄組測序同一批的樣本進行Q-PCR驗證;挑選的基因表達量較低或差異不顯著。

12、轉錄組測序的后續補充分析有哪些?

做完轉錄組測序可以考慮以下分析內容做為補充,用于提高文章檔次和深度。

可變剪接的深入分析(對生信基礎要求較高)

基因家族分析()藍字為鏈接可點擊

WGCNA分析(藍字為鏈接可點擊

其他分析(參考其他人的高分文章,整理自己的個性化分析思路)

13、有參轉錄組測序分析的結果文件中有全部基因的cds序列么?在哪個文件中?

一般來說結果文件中有全部基因的cds序列。我公司有參轉錄組分析結果中的基因cds序列信息位于Gene_Func_Anno文件夾下面的NewGene中的All.longest_transcript.fa文件里。

14、轉錄組測序分析常用的數據庫有哪些?重點關注哪些注釋信息?

Nr:NCBI非冗余蛋白數據庫,包含的信息很全面,?注釋到的基因較多。

COG?:中文釋義即“同源蛋白簇”。COG?分為兩類,一類是原核生物的,另一類是真核生物。原核生物的一般稱為?COG?數據庫;真核生物的一般稱為?KOG?數據庫。

SWISS-PROT:經過注釋的蛋白質序列數據庫,數據庫中的蛋白質的功能經過了試驗驗證,注釋是精確的;

TrEMBL:數據庫全稱“Translation of EMBL”,是從EMBL中的cDNA序列翻譯得到的,其中TrEMBL收錄的是未經人工注釋的編碼DNA序列翻譯數據;

KEGG:翻譯成中文是京都基因與基因組百科全書,是一個整合了基因組、化學和系統功能信息的數據庫,旨在揭示生命現象的遺傳與化學藍圖。它是由人工創建的一個知識庫,KEGG數據庫最優的地方在于擁有描繪已知通路的代謝通路圖。另外KEGG中有一個“專有名詞”KO(KEGG Orthology),它是蛋白質(酶)的一個分類體系,序列高度相似,并且在同一條通路上有相似功能的蛋白質被歸為一組,然后打上KO(或K)標簽,一般用字母K后面加5個數字表示。KEGG_ID?是pathway的ID,表示方法是2-4個字母,后面跟上5個數字;

GO(gene ontology):是基因本體聯合會(Gene Onotology Consortium)所建立的數據庫,旨在建立一個適用于各種物種的,對基因和蛋白質功能進行限定和描述的數據庫。按照三大類別BP(生物學過程)、 MF((分子功能)、CC(細胞組分)對基因的產物-蛋白質進行了分類,并能隨著研究不斷深入而更新的語言詞匯標準。在GO數據庫中,本質上是一個有向無環圖的數據結構,在三大類別之下,又有小的分類層級,一層一層的分類下去。對于某個具體的GO號來說,代表一組同源蛋白,擁有相似的結構和功能;

Pfam:是一個被廣泛使用的蛋白家族數據庫,它有兩個數據庫,高質量,手工確定的Pfam-A,自動注釋的Pfam-B數據庫。

15、差異分析的篩選標準默認是多少?是固定不變的么?

差異分析的篩選標準默認為:Fold Change≥2且FDR<0.01。篩選條件要靈活,要根據情況進行參數調整,數據是死的,人是活的,要靈活變通。

16、unigene和轉錄本的區別?

unigene是轉錄本的子集。首先通過triniy組裝出來的視為轉錄本,然后挑選最長的一條轉錄本作為unigene。

17、差異基因太多,注釋信息太雜亂,怎么挑選目標基因?

可以根據KEGG和GO富集分析結果,挑選富集程度較高的代謝通路和GO terms,進而查看相關的差異基因;

對不同的差異組合進行維恩圖分析,挑選共有或者特有的差異基因作為后續的研究對象;

根據前人的文獻報道,挑選相關差異基因,不要局限在自己研究的物種上。

18、為什么原核物種只能做有參轉錄組分析?

由于原核生物的基因組中存在大量基因重疊區域、操縱子及多順反子,如果按照無參轉錄組分析策略進行組裝的話,難度較大,組裝結果存在較大風險。

19、差異基因數目多少比較合理?

不同的處理,不同的研究目標,差異基因的數目是不同的,從幾十個到幾千個都有可能。但是如果差異基因數目是個位數或者上萬,那么就需要和分析人員溝通一下,查一查是否有問題。

20、組學生物的轉錄組分析結果與其他公司的區別在哪里?

我們的標準分析在不斷更新,盡量做到國內做全;

后期個性化分析速度快,質量好,沒有大公司的拖延癥;

針對初學者,我們精心制作了配套的藍字為鏈接可點擊),確保您能看懂分析結果。

您可以掃描下方二維碼,關注我們組學大講堂公眾號,然后公眾號對話框內發送“轉錄組報告?獲取有參轉錄組測序分析結題報告

我們組學大講堂還有更多的生信分析技巧,具體可以掃描下方二維碼進行選擇學習。

attachments-2020-03-riDCInci5e747dfc0f6e9.jpg

更多生物信息課程:

1. 文章越來越難發?是你沒發現新思路,基因家族分析發2-4分文章簡單快速,學習鏈接:

2. 轉錄組數據理解不深入?圖表看不懂?點擊鏈接學習深入解讀數據結果文件,學習鏈接:

3. 轉錄組數據深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接:

4. 轉錄組數據怎么挖掘?學習鏈接:

5.?

6. 生物信息入門到精通必修基礎課,學習鏈接:

7. 醫學相關數據挖掘課程,不用做實驗也能發文章,學習鏈接:

8.其他課程鏈接:

attachments-2018-07-oF5cYErK5b4e8c480abf1.jpg

  • 發表于 2018-07-18 08:41
  • 閱讀 ( 35421 )
  • 分類:轉錄組

0 條評論

請先 登錄 后評論
生信老頑童
生信老頑童

50 篇文章

作家榜 ?

  1. omicsgene 559 文章
  2. 安生水 256 文章
  3. Daitoue 167 文章
  4. 生物女學霸 120 文章
  5. 紅橙子 78 文章
  6. CORNERSTONE 72 文章
  7. 生信老頑童 50 文章
  8. landy 37 文章