KEGG通路註釋及富集分析
KEGG(Kyoto Encyclopedia of Genes and Genomes)資料庫是系統分析基因產物在細胞中的代謝途徑以及這些基因產物功能的資料庫。KEGG該資料庫有助於把基因及表達資訊作為一個整體的網路進行研究。KEGG整合了基因組、化學分子和生化系統等方面的資料,包括代謝通路(PATHWAY)、藥物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因組(GENOME)等。
1. 所有鑑定蛋白KEGG Mapping結果統計
蛋白質 mapping 結果統計表
2. 所有鑑定蛋白KEGG結果註釋統計
KEGG 註釋結果統計表
3. KEGG通路註釋統計
在生物體內,不同的基因產物相互協調來行使生物學功能,對差異表達基因的通路(Pathway)註釋分析有助於進一步解讀基因的功能。差異表達蛋白的通路註釋圖,如下:
圖1 KEGG註釋結果通路圖
注:相對於對照組來說,紅色框標記的酶與上調蛋白有關,綠色框標記的酶與下調蛋白有關。藍色框標記的酶與上調和下調蛋白均有關,框內的數字代表酶的編號(EC number),而整個通路由多種酶催化的複雜生化反應構成,此通路圖中與差異表達基因相關的酶均用不同的顏色標出,根據研究物件間的差異,重點研究某些代謝通路相關蛋白的差異表達情況,透過通路解釋表型差異的根源。
4. KEGG通路分類
對差異表達基因KEGG的註釋結果按照KEGG中通路型別進行分類,結果如下圖所示:
圖2 差異表達蛋白的KEGG分類圖
注:縱座標為KEGG代謝通路的名稱,橫座標為註釋到該通路下的蛋白個數及其個數佔被註釋上的蛋白總數的比例。
5. KEGG通路富集分析
分析差異表達蛋白在某一通路上是否過出現(over-presentation)即為差異表達蛋白的通路富集分析。我們採用Kobas軟體進行差異表達蛋白的KEGG通路富集分析。差異表達蛋白的KEGG通路富集分析結果見下圖
圖3 差異表達蛋白KEGG通路富集統計圖
注:圖中每一個點表示一個KEGG通路,通路名稱見左側座標軸。橫座標為富集因子(Enrichment Factor),表示差異表達蛋白中註釋到該通路的蛋白比例與該物種蛋白註釋到某通路的蛋白比例的比值。富集因子越大,表示差異蛋白在該通路中的富集顯著性越可靠。
How to order?