關於轉錄組測序雙端測序的問題,轉錄組測序時,pair end 雙端測序時,用FPKM計算爲什麼小於等於RPKM的2倍?
RPKM(Reads Per Kilobase of transcript, per Million mapped reads)和FPKM(Fragments Per Kilobase of transcript, per Million mapped reads)都是轉錄組資料分析中用於標準化基因表達水平的度量單位。它們考慮了每個基因的長度和測序深度,以便在不同的樣本之間進行比較。
1.RPKM 是用於單端測序資料的標準化方法。它考慮了基因長度和總的測序讀段數,以便在不同樣本間進行公平比較。
2.FPKM 通常用於雙端測序,考慮的是“片段”而不是“讀段”。在雙端測序中,一對讀段被認為是一個“片段”,即使它們是從同一DNA片段的兩端測得的。
儘管這兩種方法在技術上有所不同,但它們在數學上是等價的,因為它們都是透過考慮基因長度和總測序讀段(或片段)數來標準化基因表達的。因此,在單端測序的情況下,RPKM的值將等於FPKM的值,因為每個讀段都被視為一個獨立的單位。
在雙端測序的情況下,每對讀段被視為一個“片段”,因此理論上,如果每個片段產生一對讀段,你可能預期FPKM值會是RPKM值的兩倍。然而,FPKM值小於或等於RPKM值的兩倍的原因包括:
1.片段計數:
在FPKM的計算中,一對讀段(即一個片段)無論是否完全比對到參考基因組,都只計為一個片段,而不是兩個獨立的讀段。
2.讀段比對的複雜性:
並非所有讀段都能成功比對到參考基因組,有些可能因為質量問題或其它原因(如序列多樣性、測序錯誤等)而未被計入。
因此,FPKM值不一定是RPKM值的兩倍,而是取決於成功比對的片段數和這些片段如何分佈於特定基因的長度。在處理高質量的、成功比對的雙端讀段時,FPKM值通常會接近RPKM值的兩倍,但不會超過,因為它們都是對相同基礎資料的標準化表示。
百泰派克生物科技——生物製品表徵,多組學生物質譜檢測優質服務商
相關服務:
How to order?