單細胞轉錄組數據的counts,TPM,log-TPM的概率分佈都是怎樣的?
- Counts是指在每個基因上觀察到的RNA分子的數量。它是透過對測序資料進行基因定量得到的。
- 在單細胞轉錄組資料中,counts的機率分佈通常是離散的,因為它是整數值。每個基因的counts值可以從0開始一直到非常高的數字。
- 在一個細胞中,每個基因的counts值可以表示該基因在該細胞中的表達水平。而在整個單細胞資料集中,每個基因的counts值的分佈可以反映基因在整個細胞群體中的表達模式。
- TPM是一種歸一化的表達方式,它將每個基因的表達量除以總的轉錄本數,並乘以一個標準化因子,通常是1,000,000。
- TPM的機率分佈是連續的,因為它是一個相對錶達量的度量,可以取任意實數值。
- TPM的優點是可以比較不同基因在同一樣本中的表達水平,以及在不同樣本之間的表達差異,而不受基因長度和測序深度的影響。
- Log-TPM是對TPM進行對數變換得到的表達方式,常用於降低表達量的偏斜性和增加低表達基因的可比性。
- Log-TPM的機率分佈也是連續的,因為它是對TPM進行變換得到的。
- Log-TPM的優點是可以更好地適應正態分佈的假設,使得後續的統計分析更加可靠。
1.Counts(計數):
2.TPM(每百萬轉錄本數):
3.Log-TPM(TPM的對數):
counts的機率分佈是離散的,TPM和log-TPM的機率分佈是連續的。在單細胞轉錄組資料分析中,我們可以根據具體的研究目的和分析方法選擇合適的表達方式。
百泰派克生物科技——生物製品表徵,多組學生物質譜檢測優質服務商
相關服務:
提交需求
How to order?