新型電腦程序可以讀取任何基因組序列並破譯其遺傳密碼

舒爾金娜與哈佛大學生物學家Sean Eddy在《eLife》雜誌的一篇新論文中描述了一種全新電腦程序,可以讀取任何基因組序列並破譯其遺傳密碼這個名為Codetta的程序有可能幫助科學家擴大對遺傳密碼如何演變的理解,並正確解釋新測序生物體的遺傳密碼。

遺傳密碼是一套規則,告訴細胞如何將核苷酸的三個字母組合解釋為蛋白質,通常被稱為生命的組成部分。幾乎每個生物體,從大腸桿菌到人類,都使用相同的遺傳密碼。這就是為什麼該代碼曾經被認為是一成不變的。但是科學家們已經發現了少數離群索居的生物體,即使用替代性遺傳密碼的生物體存在着一套不同的指令。

QQ圖片20211111232306.png

這就是Codetta可以大顯身手的地方。該程序可以幫助識別更多使用這些替代性遺傳密碼的生物體,幫助揭示遺傳密碼甚至發生變化的新線索。目前,Codetta已經分析了超過25萬個細菌和其他被稱為古細菌的單細胞生物基因組序列,以尋找替代的遺傳密碼,並且已經發現了五種從未見過的情況。在所有五個案例中,氨基酸精氨酸的代碼被重新分配到一個不同的氨基酸上。據信這標誌着科學家首次在細菌中看到這種交換,並可能暗示改變遺傳密碼的進化力量。

研究人員說,這項研究標誌着對替代遺傳密碼的最大篩選。Codetta基本上分析了所有可獲得的細菌和古細菌的基因組。該程序的名稱是密碼子和羅塞塔石碑之間的交叉,羅塞塔石碑是一塊刻有三種語言的石板,密碼子是由三個核苷酸組成的,構成了遺傳密碼的一部分。

舒爾金娜在過去五年中發展了Codetta背後的統計理論,編寫程序,測試它,然後分析基因組。它的工作原理是讀取生物體的基因組,然後利用已知的蛋白質數據庫來產生一個可能的遺傳密碼。它與其他類似方法不同,因為它可以分析基因組的規模。舒爾金娜在2016年加入了艾迪的實驗室,該實驗室專門從事基因組的比較,在她設計的解讀遺傳密碼的算法上向他尋求建議。

到目前為止,還沒有人對替代性遺傳密碼做如此廣泛的調查。該系統有可能被用來確保存放蛋白質序列許多數據庫的準確性。研究人員說,這項工作的下一步是利用Codetta搜索病毒、真核生物以及線粒體和葉綠體等有機體基因組中的替代編碼。

(0)
上一篇 2021-11-11 23:59
下一篇 2021-11-12 00:06

相关推荐