中國海洋大學在四膜蟲大核基因組注釋方面取得新進展
http://m.gerecailiao.cn  2024年12月16日  來源:華禹教育網(wǎng)

  一個完整且注釋精準的基因組是解析生物學功能和調(diào)控機制的核心基石;蜃⑨尠ň幋a蛋白基因的編碼區(qū)(CDS)、非編碼區(qū)(UTR)、轉(zhuǎn)錄起始位點(TSS)和轉(zhuǎn)錄終止位點(TES)、非編碼RNA,以及基因的可變剪切亞型等關鍵特征的識別的標注。只有通過高質(zhì)量的基因注釋,才能將基因組序列轉(zhuǎn)化為具有生物學意義的信息。


  嗜熱四膜蟲(Tetrahymena thermophila)是一種廣泛應用于基礎生物學研究的單細胞模式真核生物,曾因核酶和端粒酶的研究分別斬獲1989年諾貝爾化學獎和2009年諾貝爾生理或醫(yī)學獎。四膜蟲大核基因組已歷經(jīng)多次組裝和注釋,其中包括2020年由中國海洋大學海洋生物多樣性與進化研究所原生動物學團隊高珊教授課題組率先完成的端粒到端粒的完整基因組組裝。然而,現(xiàn)有的基因注釋仍存在諸多不足,例如基因錯誤注釋、TSS和TES位置不準確,以及UTR信息缺失等。近日,高珊教授課題組通過整合大規(guī)模的轉(zhuǎn)錄組數(shù)據(jù)和表觀遺傳學數(shù)據(jù),運用機器學習模型、人工核對和實驗驗證,深度優(yōu)化了嗜熱四膜蟲大核基因組的注釋,相關成果Comprehensive genomeannotation of the model ciliate Tetrahymena thermophila by in-depth epigenetic and transcriptomic profiling(利用大規(guī)模的轉(zhuǎn)錄組和表觀組數(shù)據(jù)深度優(yōu)化模式生物嗜熱四膜蟲的基因組注釋)于2024年12月9日在線發(fā)表于Nucleic Acids Research雜志上。

  研究團隊收集了四膜蟲不同生長階段(生長、饑餓和接合生殖)的大規(guī)模RNA-seq數(shù)據(jù),結合納米孔直接RNA測序(Nanopore DRS)、鏈特異性RNA-seq等技術,對基因模型進行了全面校正和重注釋。與此同時,還引入了H3K4me3、H2A.Z、6mA、核小體等表觀遺傳標記,使用機器學習算法進一步優(yōu)化了基因注釋。通過對表觀組和轉(zhuǎn)錄組數(shù)據(jù)的整合(圖1),團隊成功預測了24351個TSS,并基于Cap-seq數(shù)據(jù)驗證了這些TSS的準確性。最終,優(yōu)化后的基因組新增了2481個基因,并對23936個基因模型進行了修訂,其中包括外顯子改變、基因合并、基因拆分以及基因方向反轉(zhuǎn)等。此外,研究團隊首次注釋了26047個基因的UTR,并鑒定出5500個基因的8,339種可變剪切亞型。這些優(yōu)化顯著提升了四膜蟲基因組注釋的完整性和準確性,不僅強化了四膜蟲作為遺傳工具在生物學研究中的實用價值,還為其他真核生物的基因組注釋提供了有益的借鑒。

  團隊同時鑒定了5525個天然反義轉(zhuǎn)錄本(NATs),并發(fā)現(xiàn)約20%的蛋白編碼基因存在反義轉(zhuǎn)錄。NATs通常較短且低表達,但在四膜蟲的有性(接合)生殖階段,其表達水平顯著升高。進一步分析表明,大部分NATs與其正義蛋白編碼基因呈現(xiàn)互斥的時間特異性表達模式,可能通過與正義基因相互作用,調(diào)控其轉(zhuǎn)錄或翻譯。這一發(fā)現(xiàn)為揭示四膜蟲的轉(zhuǎn)錄調(diào)控機制提供了新的視角。


        整合轉(zhuǎn)錄組和表觀遺傳數(shù)據(jù)優(yōu)化基因模型示意圖

  中國海洋大學海洋生物多樣性與進化研究所原生動物學團隊高珊教授為文章的通訊作者。博士生葉飛、山東大學陳曉教授和博士畢業(yè)生李源為共同第一作者。碩士生鞠艾利、博士畢業(yè)生盛亞嵐、博士生段麗麗、張佳晨和張喆,以及美國布拉德利大學Naomi A. Stover副教授等對本文亦有重要貢獻。該工作得到中國海洋大學海洋生物多樣性與進化研究所超算集群、嶗山實驗室高性能科學計算與系統(tǒng)仿真平臺和中國海洋大學高等海洋研究院海洋大數(shù)據(jù)中心等計算資源的資助。

  通訊員: 張川
 關于中國海洋大學更多的相關文章請點擊查看 

特別說明:由于各方面情況的不斷調(diào)整與變化,華禹教育網(wǎng)(m.gerecailiao.cn)所提供的信息為非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性,僅供參考,相關信息敬請以權威部門公布的正式信息為準。