国产精品一区99久久久国产aaa精品国产91久久久久久国产又黄又粗又爽又色国产精品亚洲第一区|精品国产第一精品国产|亚洲v综合v国产v国产成人综合久久精品免费欧美91亚洲精品日韩已方久久99欧美精品v国产精品v日韩精品国产福利免费福利久久久一本|99久久久无码国产精品不卡|97亚洲va在线va天堂va国产|国产精品天干天干在线观看啪|成a人片免费在线观看,欧美a一二三三区,AV免费看一二区,人体无码AV

MobiVision轉(zhuǎn)錄組算法介紹

算法概覽

mobivision quantify可以用于分析MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),關(guān)鍵分析步驟如下圖所示:

細(xì)胞標(biāo)簽糾正

MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組分為3'轉(zhuǎn)錄組和5’轉(zhuǎn)錄組兩種,均可使用mobivision quantify進(jìn)行分析。

單細(xì)胞3'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

單細(xì)胞5'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

從Read結(jié)構(gòu)可知,無論是5'轉(zhuǎn)錄組還是3'轉(zhuǎn)錄組,其Read1的5’端均為細(xì)胞標(biāo)簽序列(20bp)和UMI序列(10bp)。為了確定Read1所攜帶的細(xì)胞標(biāo)簽序列是否正確,MobiVision會(huì)將測(cè)序片段中的細(xì)胞標(biāo)簽序列和已知白名單中的細(xì)胞標(biāo)簽序列進(jìn)行比對(duì)。目前MobiCube 高通量單細(xì)胞3'轉(zhuǎn)錄組v2.0試劑盒提供近3,000,000種細(xì)胞標(biāo)簽序列。符合以下條件的測(cè)序片段將被保留:

  • Read1的細(xì)胞標(biāo)簽存在于白名單中;
  • Read1的細(xì)胞標(biāo)簽不存在于白名單中,但與白名單中的細(xì)胞標(biāo)簽最小漢明距離<=2,并根據(jù)白名單中的細(xì)胞標(biāo)簽,對(duì)Read1中的細(xì)胞標(biāo)簽進(jìn)行糾正。

通過的測(cè)序片段,Read1僅保留糾正后的細(xì)胞標(biāo)簽序列和UMI序列,Read2在該步驟暫不做處理。

插入片段修剪

對(duì)于糾正細(xì)胞標(biāo)簽序列后的fastq數(shù)據(jù),理論上,Read1不再含有接頭序列,因此無需特殊處理。

  • 單細(xì)胞3'轉(zhuǎn)錄組的fastq數(shù)據(jù),Read2片段5'端可能存在30bp的TSO序列(“AAGCAGTGGTATCAACGCAGAGTACATGGG”),3’端可能存在poly A序列。而TSO序列和poly A序列的存在,會(huì)有效降低文庫的比對(duì)率,因此在比對(duì)前,需要將插入片段兩端可能存在的TSO序列和poly A序列去除。單細(xì)胞5'轉(zhuǎn)錄組的fastq序列,Read2片段的5’端可能存在poly T序列,3'端可能存在13bp的TSO反向互補(bǔ)序列(“CCCATATAAGAAA”),同樣需要在比對(duì)前去除。
  • 去除接頭序列及poly A和poly T可能導(dǎo)致保留下來的插入DNA片段過短,而過短的DNA片段會(huì)增加錯(cuò)配的概率,因此,在完成接頭序列去除后,還需要過濾除去插入DNA片段小于30bp的Read。

測(cè)序片段比對(duì)

mobivision quantify的采用STARsolo進(jìn)行比對(duì),比對(duì)注釋結(jié)果如下圖所示:

  • 當(dāng)測(cè)序片段有超過50%的長(zhǎng)度比對(duì)至外顯子區(qū)域時(shí),則認(rèn)為該片段為Exonic Read;
  • 當(dāng)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)內(nèi)含子區(qū)域時(shí),則認(rèn)為該片段為Intronic Read;
  • 當(dāng)測(cè)序片段可比對(duì)至基因組,但既不屬于Exonic Read,又不屬于Intronic Read時(shí),則認(rèn)為該片段為Intergenic Read;
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)antisense reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于或等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域的反義鏈方向,該片段就被定義為反義鏈read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域的反義鏈方向,才能被定義為反義鏈read。
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)transcriptomic reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域,該片段就被定義為transcriptomic read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域,才能被定義為transcriptomic read。

mobivision quantify記錄了所有比對(duì)到基因組上的測(cè)序片段,其中,當(dāng)測(cè)序片段比對(duì)質(zhì)量MAPQ=255時(shí),表示該測(cè)序片段比對(duì)至基因組唯一區(qū)域。而只有唯一比對(duì)至轉(zhuǎn)錄組區(qū)域的測(cè)序片段,才會(huì)進(jìn)入下游的UMI計(jì)數(shù)。

UMI計(jì)數(shù)

在進(jìn)入U(xiǎn)MI計(jì)數(shù)前,需要剔除Reads比對(duì)結(jié)果中,不符合條件的UMI。

  • 由相同堿基構(gòu)成的UMI需去除;
  • 含有N的UMI需去除;
  • 1個(gè)或多個(gè)相同的UMI比對(duì)到同一基因上時(shí),UMI Count記為1;多個(gè)相同的UMI比對(duì)到不同的基因上時(shí),保留比對(duì)至同一基因上UMI最多的比對(duì)情況,去除比對(duì)至其他基因的UMI,UMI Count記為1;
  • 兩個(gè)UMI之間僅相差1個(gè)堿基,且比對(duì)到相同基因,則認(rèn)為這兩個(gè)UMI相同,保留其中一個(gè)UMI,UMI Count記為1。

經(jīng)過上述過濾條件,保留下來的UMI信息和細(xì)胞標(biāo)簽序列可構(gòu)建生成raw-cell-gene-matrix矩陣。

細(xì)胞過濾

mobivision quantify目前提供兩種細(xì)胞過濾的算法,分別是CR2.2EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶需要指定細(xì)胞數(shù)目,也可通過--cellnumber INT 來選擇含有UMI數(shù)目排列前INT個(gè)的細(xì)胞標(biāo)簽作為有效細(xì)胞。

對(duì)于來源于兩個(gè)物種的混合樣本,例如人和小鼠,mobivision quantify將細(xì)胞分成了三種情況:來源于人的細(xì)胞、來源于小鼠的細(xì)胞及人鼠混合的細(xì)胞(multiplet)。mobivision quantify認(rèn)為,單個(gè)細(xì)胞標(biāo)簽中,只有不少于90%的UMI分子來源同一物種,該細(xì)胞標(biāo)簽才會(huì)被認(rèn)為來是源于這個(gè)物種的細(xì)胞。例如,當(dāng)某個(gè)細(xì)胞標(biāo)簽中,80%的UMI來源于物種1,另外20%的UMI來源于物種2,那么mobivision quantify會(huì)判定該細(xì)胞為multiplet。雖然mobivision quantify無法直接判斷文庫中的雙胞或多胞率,但是通過multiplet的計(jì)算,我們可以間接評(píng)估文庫中雙胞或多胞的情況。若文庫中存在雙胞或多胞的情況,那么理論上,物種1+物種1的情況應(yīng)占1/4,物種2+物種2占1/4,物種1+物種2占1/2。例如,某雙物種文庫中,multiplet rate為5%,可以估算,該文庫中,雙胞或多胞率應(yīng)在10%左右。

質(zhì)控報(bào)告

mobivision quantify默認(rèn)在filtered-cell-gene-matrix細(xì)胞表達(dá)矩陣生成后,對(duì)整個(gè)文庫的原始數(shù)據(jù)及分析結(jié)果進(jìn)行統(tǒng)計(jì),生成質(zhì)控報(bào)告。該報(bào)告是對(duì)整個(gè)文庫的如實(shí)反饋,旨在幫助用戶從宏觀角度了解文庫原始數(shù)據(jù)質(zhì)量及分析結(jié)果質(zhì)量,并未作任何數(shù)據(jù)上的篩選或過濾。如有需要,用戶可根據(jù)質(zhì)控報(bào)告結(jié)果,對(duì)文庫結(jié)果進(jìn)行調(diào)整后,再開始下游分析。