麻省理工學院的生物學家對重複的蛋白質序列有了新的認識

計算分析顯示,許多重複序列在不同的蛋白質中是共享的,並且在從細菌到人類的物種中是相似的。大約70%的人類蛋白質包括至少一個由單一氨基酸重複多次組成的序列,其中還夾雜着一些其他氨基酸。這些”低複雜性區域”(LCRs)也存在於大多數其他生物體的蛋白質中。

Amino-Acid-Sequence-Dot-Plot-Matrix.jpg

儘管包含這些序列的蛋白質有許多不同的功能,但麻省理工學院的生物學家們現在已經想出了一種方法,將它們作為一個統一的群體進行識別和分析。他們的技術使他們能夠檢查來自不同物種的LCRs之間的相似性和差異,並幫助他們解決這些序列的功能和它們所處的蛋白質。

利用他們的技術,科學家們分析了在八個不同物種中發現的所有蛋白質,從細菌到人類。他們發現,雖然LCRs在不同的蛋白質和物種之間可能有所不同,但它們往往有一個類似的作用–幫助發現它們的蛋白質加入一個更大規模的組件,如核仁,一個在幾乎所有人類細胞中發現的細胞器。

麻省理工學院的一名研究生Byron Lee說:”我們沒有研究特定的LCR和它們的功能,因為它們參與了不同的過程,所以看起來是分開的,而我們更廣泛的方法使我們能夠看到它們的特性之間的相似性,這表明也許LCR的功能畢竟不是那麼懸殊的。”

研究小組還發現了不同物種的LCRs之間的差異。他們表明,這些特定物種的LCR序列對應於特定物種的功能,如形成植物細胞壁。

Lee和研究生Nima Jaberi-Lashkari是這項研究的主要作者,該研究最近發表在《eLife》雜誌上。麻省理工學院生物學助理教授Eliezer Calo是該論文的資深作者。

Repetitive-Sequences-Are-Shared-Across-Proteins.jpg

通過計算分析,研究人員發現許多重複序列在整個蛋白質中是共享的,並且在從細菌到人類的物種中是相似的。資料來源:研究人員提供

大規模的研究

先前的研究顯示,LCRs參與了多種細胞過程,包括細胞粘附和DNA結合。這些LCRs通常富含一個氨基酸,如丙氨酸、賴氨酸或谷氨酸。

找到這些序列,然後單獨研究它們的功能是一個耗時的過程,因此科學家們決定使用生物信息學–一種使用計算方法來分析大量生物數據集的方法–將它們作為一個更大的群體來評估。

生物信息學是一門相對較新的科學分支學科,它將生物學和計算機科學的元素結合在一起,目的是開發高效和強大的方法來分析和解釋大量的生物數據,如DNA、RNA和氨基酸序列或關於這些序列的註釋。

Jaberi-Lashkari說:”我們想做的是退一步,不看單個的LCR,而是試着看一下所有的LCR,看看我們是否能在更大的範圍內觀察到一些模式,這可能有助於我們弄清楚那些被分配了功能的LCR在做什麼,也有助於我們了解那些沒有被分配功能的LCR在做什麼。”

為了做到這一點,麻省理工學院的團隊使用了一種叫做點陣圖的技術(見頁面頂部的圖片),這是一種直觀地表示氨基酸序列的方法,以生成研究中的每個蛋白質的圖像。接下來,他們使用計算圖像處理方法來同時比較數以千計的這些矩陣。

利用這種技術,研究人員能夠根據哪些氨基酸在LCR中最頻繁地重複而對LCR進行分類。他們還根據蛋白質中發現的每種LCR類型的拷貝數對含有LCR的蛋白質進行分組。分析這些特徵有助於研究人員更多地了解這些LCRs的功能。

作為一個示範,研究小組挑出了一個人類蛋白質,稱為RPA43,它有三個富含賴氨酸的LCR。這種蛋白質是構成一種叫做RNA聚合酶1的酶的許多亞單位之一,該酶合成核糖體RNA。科學家們發現,富含賴氨酸的LCR的拷貝數對於幫助該蛋白整合到核小體(負責合成核糖體的細胞器)非常重要。

生物學集合體

在對八個不同物種中發現的蛋白質進行比較時,研究人員發現一些LCR類型在物種之間高度保守,這意味着這些序列在進化的時間尺度上變化很小。這些序列往往在蛋白質和細胞結構中發現,這些結構也是高度保守的,如核仁。

Lee說:”這些序列似乎對核仁的某些部分的組裝很重要。一些已知的對高階組裝很重要的原則似乎在起作用,因為拷貝數,可能控制一個蛋白質可以進行多少次相互作用,對蛋白質整合到該區間很重要。”

麻省理工學院的團隊還發現了在兩種不同類型的參與核小體組裝的蛋白質中看到的LCR之間的差異。他們發現,一種被稱為TCOF的核仁蛋白含有許多富含谷氨酸的LCR,可以幫助形成組裝的支架,而只有少數這種富含谷氨酸的LCR的核仁蛋白可以被招募為客戶(與支架互動的蛋白質)。

另一個似乎有許多保守的LCR的結構是核斑點,它在細胞核內發現。研究人員還發現參與形成更大規模集合體的LCR之間有許多相似之處,如細胞外基質,一個為植物和動物的細胞提供結構支持的分子網絡。

研究小組還發現了具有LCR的結構的例子,這些結構似乎在物種之間發生了分歧。例如,植物有獨特的LCR序列,它們用這些蛋白質來支撐它們的細胞壁,而這些LCR在其他類型的生物體中是看不到的。

現在研究人員計劃將他們的LCR分析擴展到其他物種。

Lee說:”有很多東西需要探索,因為我們可以把這個地圖擴展到基本上任何物種。這使我們有機會和框架來確定新的生物組合。”

(0)
上一篇 2022-10-09 15:45
下一篇 2022-10-09 15:57

相关推荐