GO功能註釋及富集分析
GO(Gene Ontology)是基因本體聯合會(Gene Ontology Consortium)所建立的資料庫,旨在建立一個適用於各種物種的,對基因和蛋白功能進行限定和描述的,並能隨著研究不斷深入而更新的語義詞彙標準,適用於各物種。透過建立一套具有動態形式的控制字集(controlled vocabulary),來描述基因及蛋白質在細胞內所扮演的角色,從而來全面描述生物體中基因和基因產物的屬性。GO資料庫總共有三大類,分別是生物學過程(Biological Process, BP)、細胞定位(Cellular Component, CC)和分子功能(Molecular Function, MF),各自描述了基因產物可能行使的分子功能,所處的細胞環境,以及參與的生物學過程。GO資料庫中一個基本的概念是節點,每個節點都有一個名稱,比如“Cell”、“Fibroblast Growth Factor Receptor Binding”或者“Signal Transduction”,同時有一個唯一的編號,如“GO:nnnnnnn”。基於鑑定到的蛋白ID,採用mapping的方式從Uniprot資料庫中得到蛋白質的GO資料庫註釋資訊,對蛋白質進行功能分類註釋。針對BP、CC和MF中所涉及的GO節點,列出所有相應蛋白質個數,同時分別對錶達蛋白的二級分類情況做出統計圖。
1. GO二級分類統計圖
注:橫座標為GO分類,縱座標左邊為蛋白數目所佔百分比,右邊為蛋白數目。此圖展示的是在差異表達上調蛋白和下調蛋白GO各二級功能的蛋白富集情況,體現兩個調節方向下各二級功能的地位,具有明顯比例差異的二級功能說明差異表達上調蛋白與下調蛋白的富集趨勢不同,可以重點分析此功能是否與差異相關。
2. GO levels分類統計圖
根據不同levels中GO節點註釋到的蛋白數量,選擇排名前20個GO節點進行展示,如圖所示:
注:橫座標是富集到蛋白的百分比,縱座標是按層級從小到大排列。不同level用不同的顏色顯示,每個柱子後面的數字是該分類中的蛋白數量。
3. topGO蛋白質富集分析
百泰派克採用topGO對差異表達蛋白進行富集分析,可以得到差異表達蛋白在GO節點中的富集顯著性。並對顯著富集的節點在GO體系中的層級關係以有向無環圖的形式進行直觀展示。topGO有向無環圖能直觀展示差異表達基因富集的GO節點(Term)及其層級關係,是差異表達基因GO富集分析的結果圖形化展示,分支代表包含關係,從上至下所定義的功能描述範圍越來越具體。在有向無環圖中,箭頭代表包含關係,即該節點的所有基因同樣註釋到其上級節點中。
差異表達蛋白的topGO分子功能有向無環圖如下:
注:對每個GO節點進行富集,在圖中用方框表示顯著度高的10個節點,圖中還包含其各層對應關係。每個方框(或橢圓)內給出了該GO節點的內容描述和富集顯著性值。不同顏色代表不同的富集顯著性,顏色越深,顯著性越高。
1. GO二級分類統計圖
圖1 差異表達蛋白的GO二級註釋
注:橫座標為GO分類,縱座標左邊為蛋白數目所佔百分比,右邊為蛋白數目。此圖展示的是在差異表達上調蛋白和下調蛋白GO各二級功能的蛋白富集情況,體現兩個調節方向下各二級功能的地位,具有明顯比例差異的二級功能說明差異表達上調蛋白與下調蛋白的富集趨勢不同,可以重點分析此功能是否與差異相關。
2. GO levels分類統計圖
根據不同levels中GO節點註釋到的蛋白數量,選擇排名前20個GO節點進行展示,如圖所示:
圖2 蛋白質在不同level中的註釋結果統計圖
注:橫座標是富集到蛋白的百分比,縱座標是按層級從小到大排列。不同level用不同的顏色顯示,每個柱子後面的數字是該分類中的蛋白數量。
3. topGO蛋白質富集分析
百泰派克採用topGO對差異表達蛋白進行富集分析,可以得到差異表達蛋白在GO節點中的富集顯著性。並對顯著富集的節點在GO體系中的層級關係以有向無環圖的形式進行直觀展示。topGO有向無環圖能直觀展示差異表達基因富集的GO節點(Term)及其層級關係,是差異表達基因GO富集分析的結果圖形化展示,分支代表包含關係,從上至下所定義的功能描述範圍越來越具體。在有向無環圖中,箭頭代表包含關係,即該節點的所有基因同樣註釋到其上級節點中。
差異表達蛋白的topGO分子功能有向無環圖如下:
圖3 差異表達蛋白topGO富集有向無環圖(分子功能)
注:對每個GO節點進行富集,在圖中用方框表示顯著度高的10個節點,圖中還包含其各層對應關係。每個方框(或橢圓)內給出了該GO節點的內容描述和富集顯著性值。不同顏色代表不同的富集顯著性,顏色越深,顯著性越高。
提交需求
How to order?