當前位置:首頁 > 技術交流 > 最新應用

技術交流

掃描二維碼
或添加“GeneGroup003
獲取更多最新資訊

商城訂購

掃描二維碼
或添加“生物通ebiobuy
手機下單,快人一步

GSEA基因集富集分析—基礎篇

版權所有,轉載請聯系基因市場部
2019-03-05

GSEA---Gene Set Enrichment Analysis首字母縮寫,基因集富集分析,最早由Broad Institute 研究團隊開發的一款針對轉錄組數據進行分析的工具。在對基因表達數據分析時,首先確定分析的目的,即選擇MSigDB中的一個或多個功能基因集,然后基于基因表達數據與表型的關聯度(也可以理解為表達量的變化)的大小進行排序,然后判斷每個基因集內的基因是否富集于表型相關度排序后基因列表的頂端或者底端富集,從而判斷此基因集內基因的協同變化對表型變化的影響。

 

已有GO和Pathway分析,為什么還要做GSEA分析?

 

翻閱經典的轉錄組研究文獻,大量采用GSEA,同樣是對基因表達差異進行功能關聯分析,GSEA到底有何獨特之處?

 

1. 常規的GO和Pathway分析往往側重于比較兩組間的基因表達差異,需要先設定篩選差異基因的閾值,往往集中關注少數幾個顯著上調或下調的基因,這容易遺漏部分差異表達不顯著卻有重要生物學意義的基因,忽略一些基因的生物特性、基因調控網絡之間的關系及基因功能和意義等有價值的信息。

 

2. GSEA合理解決了轉錄組數據分析以上瓶頸問題。GSEA不需要指定明確的差異基因閾值,算法會根據實際數據的整體趨勢, 即使在沒有先驗經驗存在的情況下也能在轉錄組層次上對多個基因進行分析,從而從數理統計上把轉錄組數據與生物學意義很好地銜接起來,使研究者們能夠更輕松、更合理地解讀轉錄組數據結果。當然,基于數據的可靠性及分析的穩健性,GSEA也同樣需要設置生物學重復樣本,每組推薦三個以上。

 

3. 目前,市面上絕大多數服務公司(包括上海貝晶),都會在差異基因列表基礎上提供給用戶Pathway 以及GO 富集分析,畢竟給予成百上千的差異表達基因以簡潔、明晰的生物學功能的概括,才是進行高通量生物學表達譜研究的主要目的。然而,在實際應用于生物學高通量數據時,它們都有一個重大的缺陷,即對于差異基因檢出的閾值,異常的敏感,用戶需要給出差異基因的一個明確的定義(閾值),例如abs(FC) ≧2.0 & p ≦ 0.05。這種一刀切的閾值,對于發現真正的生物學效應,許多時候是一種障礙,因為通過高通量的實驗觀測到的RNA 表達變化,很多是層層的負反饋調控后的結果,并且不同組織對于表達差異的敏感度是不同的如在神經遞質系統內,一個1.2 倍的表達差異就可能產生及其顯著的效應。

 

事例闡述

 

 如下圖,使用常見的差異基因篩選閾值,無論怎樣設置,如果僅做普通的Pathway 富集分析的話,一定會漏檢至關重要的Myc 通路。這個示例非常典型,不僅在于Myc 作為重要的癌基因廣為人知,并且這里Myc 在實驗條件下活性改變后引起的下游基因表達變化,非常具有代表性:即并非所有的下游基因都會展現出強烈的表達改變,但它們會呈現出一致的趨勢。而GSEA 的優勢就在于,能夠穩健的檢出微弱但是一致的趨勢。

http://img.xiumi.us/xmi/ua/1eAiE/i/4e3711c17cdaf922ff3cfb2ee4cedda7-sz_44939.pnghttp://img.xiumi.us/xmi/ua/1eAiE/i/429eada9e9c0cf3d9712d6307821ed97-sz_46458.png

 

Broad Institute免費分析軟件可以做GSEA,為什么要送到公司做服務?

1.該軟件并非優化好的商業軟件,沒有相關背景的研究者要花功夫琢磨如何使用這個網站,忍受操作不便,費時費力,可能結果還不如人意

2.官網提供的分析受計算容量所限,一次只能進行單個或者幾個功能基因集進行分析;其置換檢驗(Permutation)次數不足(最大置換次數1000),數據準確性也會受影響,最終得到的圖片質量也不盡如人意,具體參見以下事例

示例闡述

根據某種新藥在Cancer Cell Line上3vs3, Treat vs Ctrl的體外實驗通過GSEA分析得到的展示圖。展示的geneset是MYC target gene,也就是c-Myc(最著名的癌基因,是一個轉錄因子,在絕大多是癌癥中異常激活)的下游基因,這些下游基因一共有200個。分析的目的就是為了檢出,MYC通路是否在此實驗中激活或者抑制。



http://img.xiumi.us/xmi/ua/1eAiE/i/a994f3298e8b9681c5f4984c31086502-sz_13037.jpg?x-oss-process=style/xmorient



Broad Institude官網免費做出的GSEA圖片,圖形分辨率低,達不到文獻發表要求的質量。 

 


 

 

 





基因集團上海貝晶生物提供的GSEA服務,能很好地解決上述問題,圖片分辨率都是出版級別,還特別增加了陰影區域標示零假設分布,更容易比較看出P-value的顯著性,便于用戶更直觀比較數據結果的準確性。此外,分析采用足夠的10W次置換,遠超Broad Institute最大置換次數1000,使得P-value更接近真值,分析結果更準確。



 

 

    目前,上海貝晶生物的GSEA不僅對訂購芯片服務的用戶提供免費體驗,更有重磅升級,詳見GSEA基因富集分析—高階篇(二)。


歡迎關注“基因快訊”官方微信

滬公網安備 31010402003540號 滬ICP備13000399號-1

开心色色_成人开心网_久久爱_色爱AV综合区