我們知道,生物體的基因型是由DNA序列組成的,而表型是由基因型所編碼的特征,比如眼睛的顏色、身體的形狀或者蛋白質的結構?;蛐秃捅硇椭g的關系被稱為基因型-表型映射(GP映射),它是生物進化的核心機制之一。GP映射決定了一個生物體在面對突變時能否保持其表型不變,或者能否產生新的表型變異的能力。這種能力被稱為突變穩(wěn)健性,它是衡量GP映射質量的一個重要指標。
突變穩(wěn)健性可以分為兩種:基因型穩(wěn)健性和表型穩(wěn)健性?;蛐头€(wěn)健性是指一個給定的基因型在發(fā)生突變后仍然保持相同的表型的概率。表型穩(wěn)健性則是指所有映射到一個給定表型的基因型的平均基因型穩(wěn)健性。表型穩(wěn)健性反映了一個表型在GP映射中所占據(jù)的空間大小,也就是說,它反映了一個表型有多少個不同的基因型可以實現(xiàn)。表型穩(wěn)健性越高,意味著一個表型越容易在進化過程中被發(fā)現(xiàn)和保留,也越容易在中性漂變中探索新的表型變異。
那么,什么樣的GP映射可以使表型穩(wěn)健性達到最大呢?這個問題并不容易回答,因為GP映射有很多種可能的形式和復雜度。為了簡化問題,我們可以考慮一些理想化的模型,比如二進制字符串作為基因型,而某些離散值作為表型。這樣,我們就可以用數(shù)學和計算機科學的工具來分析和模擬GP映射。
在最近發(fā)表的一篇論文中,作者使用了編碼理論和數(shù)論的一些結果,來證明了一個非常有趣和美麗的定理:在二進制字符串上定義的GP映射中,當且僅當基因型被組織成磚瓦圖(bricklayer’s graphs)時,表型穩(wěn)健性才能達到最大值。磚瓦圖是一種特殊的哈明圖(Hamming graph),它類似于砌墻工人如何填充一個哈明圖。哈明圖是一種用來表示二進制字符串之間距離的圖形結構。磚瓦圖是哈明圖中一種具有高度對稱性和規(guī)則性的子圖,它可以用一種遞歸的方式來構造。
作者還給出了這個最大值是多少,并且發(fā)現(xiàn)它是由一個分形函數(shù)給出的,這個函數(shù)叫做布朗芒函數(shù)(blancmange function),也叫做數(shù)字和函數(shù)(sums-of-digits function)。這個函數(shù)是連續(xù)但無處可導,它的性質非常奇妙,可以用來描述一些自然界中的現(xiàn)象,比如山脈的輪廓或者海岸線的長度。
更令人驚訝的是,作者發(fā)現(xiàn)了一些真實的GP映射,比如RNA二級結構和HP模型的蛋白質折疊,它們的表型穩(wěn)健性竟然恰好等于這個理論上的最大值!這說明了這些GP映射具有非常高的優(yōu)化程度,也說明了這個理論結果在生物學上具有重要的意義。
作者還探討了當表型被粗?;瘯r,表型穩(wěn)健性會如何變化,并且推導出了一個公式和一些界限,來描述不同粒度的表型之間的轉換概率。粗粒化是指將一些細節(jié)相似或者功能相似的表型合并成一個更大的表型類別,這樣可以簡化GP映射的復雜度,也可以揭示一些更高層次的規(guī)律。
總之,這篇論文展示了一個非常優(yōu)美和深刻的結果,它將數(shù)學、物理、計算機和生物學等多個領域的知識和方法結合起來,揭示了GP映射中的一個普遍性質。它不僅提供了一個理解和評估GP映射質量的工具,也為進一步探索GP映射中的其他特征和規(guī)律提供了啟發(fā)和靈感。
版權聲明:本文內容由互聯(lián)網用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內容, 請發(fā)送郵件至 舉報,一經查實,本站將立刻刪除。