檢測到您當前使用浏覽器版本過于老舊,會導緻無法正常浏覽網站;請您使用電腦裡的其他浏覽器如:360、QQ、搜狗浏覽器的極速模式浏覽,或者使用谷歌、火狐等浏覽器。
轉錄因子(TFs)作為基因表達的“指揮家”,通過與雙鍊DNA(dsDNA)上的特定序列—轉錄因子結合位點(TFBS)結合,來調控基因的轉錄。傳統TF與dsDNA的結合序列的确定實驗是由DNA酶切的“足迹”(Foot-printing)法獲得。借助“足迹”法,科學家發現了很多不同DNA結合序列,即Motifs。 随着基因組學的發展,成千上萬個TFs已被确定出來。如何高效、準确地識别和刻畫TF的TFBS,特别是理解這些不同的TFs是如何快速靶向其特異結合位點,一直是分子生物學家探索的難題之一。科學家相繼開發了ChIP-seq方法及其多種現代版本、SELEX 及其HT-SELEX (high-throughput systematic evolution of ligands by exponential enrichment)方法和PBM (protein binding microarray),以及MITOMI等單分子實驗進行體内和體外實驗來探索該問題。 在計算方面,通常采用位置權重矩陣(PWM)來描述和計算TFBS Motif的特征,但PWM方法假設堿基間相互獨立,得到Motif(通常長度在8‑10 bp)受實驗方法和序列比對的影響并不一緻,且該方法隻能從序列的角度總結TF的特異性結合規律,無法從物理機制角度來解釋TF如何高效識别并結合到目标位點。近年來的研究還表明,TF在基因組中的搜索過程可能受到TFBS周圍重複簡并序列的引導。基因組中普遍存在的短串聯重複序列(STRs;2‑6個堿基對的串聯重複)在轉錄調控中也發揮着重要作用。然而,這些DNA結合方式的具體機制細節仍不清晰,也很難用傳統的Motif概念來解釋。
2025年3月26日,beat365/生物醫學前沿創新中心(BIOPIC)蘇曉東課題組在Advanced Science上在線發表了題為DNA–Protein Binding is Dominated by Short Anchoring Elements的研究論文。該研究揭示了TF與DNA結合時短序列(3-4個堿基對)起到主導作用,并将該短序列命名為錨定元件(Anchoring Elements, AEs)。論文還指出AE的密度(AED)能夠吸引相應TF并促進其進一步搜索并結合到其TFBS上。
研究團隊此前已經基于二代深度測序技術(NGS)開發了一種全面測量熱平衡态下TF與所有可能的DNA序列的結合能力的實驗方法KaScape(Chen, H., Xu, Y., Jin, J. et al. Sci Rep 13, 16595 (2023))。本研究進一步以拟南芥WRKY1和人類PU.1等轉錄因子為模型,利用KaScape方法系統分析了TF與DNA的結合特性。研究發現,結合能力較強的序列中均含有一段共有的3-4個堿基對的短序列且隻要含有該短序列,其結合能力均較強,這說明該短序列在TF與DNA的結合中起決定性作用。由此,本研究将該短序列命名為錨定元件(Anchoring Element;AE)。拟南芥WRKY1的AE為GAC/GTC(GAC和GTC為反向互補序列),而人類PU.1的AEs為GGAA/TTCC(GGAA和TTCC為反向互補序列)。為了進一步驗證AEs的作用,研究團隊開發了AEEscape算法。該算法能夠計算随機序列區域每個位置的k-mer結合能量,将PWM從1-mer拓展到了k-mer。該算法發現,以WRKY為例,當短序列長度為2時,各個位置的2-mer結合能全景圖不一緻;當短序列長度為3時,各個位置的結合能全景圖類似,GAC或者GTC在随機區域的各個位置的結合能力均最強;當短序列長度為4時,随機區域各個位置的結合能力最強的那些4-mer序列均含有GAC或者GTC。以上分析客觀系統地說明了AE是TF與DNA結合時的最核心、最基本的元件。本研究随後使用AEEscape算法得到的k-mer能量全景圖預測了基因組中TFBS區域的能量譜,發現在TFBS區域存在“能量漏鬥”現象,該現象的存在說明TFBS周圍的序列能夠幫助TF快速搜索到其目标位點。進一步研究發現,該現象與TFBS附近AE的密度有關。
圖1. WRKY1 N端DNA結合結構域(WRKY1N)與DNA的複合物結構(6j4e.pdb)。WRKY1N覆蓋的區域(Foot-printing or Motif region)用藍色雙箭頭标出,結合時起主導作用的短DNA序列Anchoring Element(AE)對應的堿基由藍框标注。兩條DNA鍊分别标注為Watson strand和Crick strand。對于WRKY1N來說,其主要與Crick strand上的GTC(AE)相互作用。
為了探究AE的廣泛存在性,本研究還進一步分析了公共數據庫中相應TF的PBM數據。結果發現了非常有趣的相似現象,驗證了AE的廣泛存在性。本研究中鑒定的AEs與DNA-蛋白質複合物結構研究中描述的“核心序列”很好對應(圖1),複合物結構可以解釋結構的穩定性及相互作用的細節,但是目前的計算方法還無法很好得到結合能,因而不能确切鑒定到最小相互作用單元的必要的核心序列。這些核心序列代表了參與靜電、氫鍵、範德瓦爾斯等相互作用的關鍵堿基。這些相互作用對于DNA與TF結合的熱力學穩定性和“特異性”至關重要,隻要這些“核心”堿基存在于實驗的序列中,KaScape方法即可以将其拉下來(pull-down), 因此,與本研究中的AEs類似,這些“核心序列”較短,一般遠小于Motif長度。綜上所述,AE可以被視為負責TF結合的最小結構(序列)單元,也表明構成AE的短k-mer序列與TF相互作用時,應被視為一個整體,而不是獨立的堿基。由于僅從複合物結構無法準确計算出結合能,基于結構來定義“核心序列”具有一定的主觀性和随意性,而KaScape實驗的pull-down富集結果客觀地得到了這些“核心序列”在DNA結合機制中起關鍵作用的客觀而重要的結論。
這項研究不僅為TF與DNA結合的分子機制提供了全新的視角,還為基因表達的調控研究開辟了新的方向,為未來設計基因調控工具和開發基因治療策略提供了重要的理論基礎。陳紅博士為論文的第一作者。beat365官方网站/生物醫學前沿創新中心蘇曉東教授為該論文的通訊作者。研究團隊未來将進一步探索AEs在更複雜生物系統中的作用,例如在染色質環境下TF與核小體DNA的相互作用,以及多TF協同調控基因表達的機制。這些研究将有助于更深入地理解基因調控的複雜性,并為生物信息學、精準醫學和合成生物學提供新的工具和方法。
論文鍊接: https://advanced.onlinelibrary.wiley.com/doi/full/10.1002/advs.202414823