香港大學李嘉誠醫學院研究團隊發現更有效的 CRISPR-Cas9 變體,可應用於基因治療。是項研究將人工智能中的「機器學習」應用於大型蛋白質篩選,從有限的蛋白變體實驗數據,拓展出更龐大的虛擬數據作分析,令變體數據可增至原有的20倍,加快篩選的速度。團隊將此方法成功地應用於改良多個Cas9蛋白,並設計出具有增強基因編輯效率的新金黃葡萄球菌Cas9(SaCas9)的變體。相關研究成果現已在國際科學期刊《自然-通訊》,並就此提交專利申請。
是項研究探索如何結合「機器學習」方法去進行多點突變的蛋白篩選,將結構導向的突變數據庫中的實證數據,再以「機器學習」方法進行虛擬篩選,以準確識別稀有和性能更好的變體,以作進一步的深入驗證。團隊亦根據早前發表的Cas9變體篩選之數據作為測試機器學習的框架,印證機器學習只需憑藉5%至20%的實驗數據,即可識別性能最佳的變體。
挑選定點突變的位置均集中於Cas9蛋白內的間隔序列前體臨近基序(PAM)相互作用(PI)結構域和WED結構域,因為這兩個結構域靠近目標脫氧核醣核酸(DNA),及圍繞帶有PAM的DNA雙鏈體的位置。研究團隊將「機器學習」融合至高通量篩選平台,結合PI和WED結構域中的多點突變以設計活性更強的SaCas9蛋白。PAM對於Cas9的可編輯目標相當重要,透過減弱PAM與DNA之間的相互作用,從而減少PAM所帶來的編輯限制,這樣可以讓Cas9編輯更廣泛的基因目標,為了彌補與DNA之間被減弱的相互作用,需要同時於WED結構域加強與DNA的相互作用,以增強Cas9的編輯能力。
在篩選和隨後的驗證中,研究人員辨別新的變體,包括當中名為KKH-SaCas9-plus的變體,它在特定基因組位點的活性增強高達33%。而蛋白質建模分析亦預測新改良的變體,有機會增加在WED和PI結構域與帶有PAM DNA雙鏈之間的新相互作用,這亦可解釋多點突變如何增強新變體的編輯效率。
結構導向設計一直主導著Cas9改良工程的領域,然而只探索少數位點、氨基酸殘基突變和多位點的組合突變。是項研究發現在結合「機器學習」到多點組合突變的篩選研究中,有助將實驗數據產出最大化,降低實驗的篩選時間和成本,並從更多的變體中尋找到更高效的變體KKH-SaCas9-plus。領導是項研究的港大醫學院生物醫學學院助理教授黃兆麟表示,這方法將加速Cas9蛋白的改良,使基因組編輯技術得以更有效地應用於治療遺傳疾病。
星島新聞集團慶回歸25周年專題網站,請即瀏覽
立即下載|全新《星島頭條》APP:https://bit.ly/3yLrgYZ