RNA-seq的標準化方法羅列
RNA-seq資料標準化是爲了消除實驗中不可避免的技術偏差和樣本間的生物學變異,以確保基因表達資料的可比性。以下是一些常見的RNA-seq資料標準化方法:
1.RPKM/FPKM (Reads/Fragments Per Kilobase of transcript per Million mapped reads):
考慮了轉錄本長度和測序深度的影響。
2.TPM (Transcripts Per Million):
類似於FPKM,但在標準化轉錄本丰度前先進行了長度標準化。
3.CPM (Counts Per Million):
對每個樣本的讀數計數進行標準化,以每百萬對映讀數為單位。
4.TMM (Trimmed Mean of M-values):
透過edgeR包計算,用於校正樣本間的組成效應。
5.Quantile normalization:
將所有樣本的表達分佈調整為相同,使它們具有相同的統計特性。
6.DESeq/DESeq2:
使用負二項分佈模型對讀數計數進行標準化,計算基因表達變化。
7.Upper Quartile normalization:
透過調整樣本的上四分位數來標準化計數。
8.Z-score normalization:
計算每個基因在所有樣本中的標準分數(z-score)。
9.GC-content normalization:
考慮GC含量對測序覆蓋度的影響進行校正。
10.Batch effects normalization:
如Combat等方法,用於校正實驗批次效應。
不同的標準化方法適用於不同的資料集和分析目標,選擇適當的方法對於獲得準確和可重複的結果至關重要。
百泰派克生物科技——生物製品表徵,多組學生物質譜檢測優質服務商
相關服務:
How to order?