一般生物體中的的RNA中,rRNA占絕大多數(shù),含量超過90%,而mRNA的含量在1-2%,左右,轉(zhuǎn)錄組測(cè)序文庫是以樣本的Total RNA為基礎(chǔ),從中提取mRNA構(gòu)建測(cè)序文庫,因此文庫構(gòu)建包括mRNA富集和碎片化、mRNA反轉(zhuǎn)錄、接頭添加和PCR富集等過程。
mRNA富集
在生物的Total RNA中,mRNA所占比例很低,絕大部份時(shí)核糖體RNA (rRNA),因此如果直接使用Total RNA進(jìn)行測(cè)序,得到的結(jié)果必然是不準(zhǔn)確的,因此需要先將Total RNA中的mRNA分類純化出來。
轉(zhuǎn)錄組測(cè)序的文庫根據(jù)待測(cè)樣品的物種分為真核轉(zhuǎn)錄組和原核轉(zhuǎn)錄組。由于真核生物和原核生物mRNA結(jié)構(gòu)不同,因此在mRNA富集時(shí)所采用的方法也并不相同。
真核生物mRNA中含有polyA尾結(jié)構(gòu),因此可以使用oligoT與其特異性的匹配,從而在Total RNA中特異性的富集mRNA。
然而,原核生物并不像真核生物mRNA具有polyA的結(jié)構(gòu),因此,無法直接利用oligoT將mRNA純化出來,目前,提高原核生物中mRNA的量,最主要的方式是去除Total RNA中rRNA。
由于測(cè)序儀器不能直接對(duì)RNA測(cè)序,所以還要反轉(zhuǎn)錄成cDNA
鏈特異性文庫
由于轉(zhuǎn)錄組文庫構(gòu)建過程中要將mRNA反轉(zhuǎn)錄為雙鏈的cDNA,因此,在測(cè)序時(shí),即會(huì)同時(shí)得到cDNA雙鏈的序列信息,這就消除了mRNA單鏈的特性,無法區(qū)分cDNA中的正義鏈和反義鏈。
因此提出了另一種文庫構(gòu)建方式,鏈特異性文庫,其在文庫制備和測(cè)序中保留mRNA 的方向信息,使得有效數(shù)據(jù)增多,基因表達(dá)定量更準(zhǔn)確;基因注釋更準(zhǔn)確,新基因識(shí)別等分析更可靠;同該方法能夠鑒定與開放閱讀框反義的ncRNA、發(fā)現(xiàn)反義轉(zhuǎn)錄本。
其建庫原理與普通轉(zhuǎn)錄組類似,不同之處在于合成第二鏈cDNA時(shí),用dUTP代替dTTP,此時(shí)第二鏈cDNA上布滿了含dUTP的位點(diǎn)。
在接頭連接后用一種特定的酶,其可在尿嘧啶位置產(chǎn)生一個(gè)單核苷酸缺口,從而消化掉第二鏈cDNA,只保留第一鏈cDNA,隨后進(jìn)行PCR擴(kuò)增純化,得到只含第一鏈cDNA信息的文庫。