RNA-Seq數據分析——原始數據質量控制(QC)
RNA-Seq原始資料質量控制(QC)是非常重要的一個環節,由於各種原因,例如測序平臺、實驗操作等,原始測序資料可能存在不少問題,如低質量讀段、接頭序列、汙染序列等。爲了確保後續分析的準確性,需要先進行質量控制。
一、常用工具:
常用的質量控制工具有FastQC、MultiQC等,這些工具能提供測序資料的基本統計資訊和質量報告。
二、QC主要步驟:
1.基本統計:
統計讀段數量、平均長度等。
2.質量評分:
評估測序讀段的質量分佈,通常使用Phred質量分數。
3.接頭和汙染序列檢測:
查詢和去除可能的接頭序列和其他非目標序列。
4.GC含量分佈:
檢查GC含量的分佈,以判斷潛在的偏見或汙染。
5.重複序列分析:
評估重複讀段的比例,高重複率可能意味著PCR偏見。
6.去除低質量讀段:
基於設定的質量閾值去除低質量的讀段。
7.後續步驟:
完成質量控制後,通常會進行比對、定量和差異表達分析等後續步驟。
百泰派克生物科技——生物製品表徵,多組學生物質譜檢測優質服務商
相關服務:
提交需求
How to order?