在构成人类基因组的大约30亿个碱基对中,只有大约2%的碱基对编码蛋白质,剩下的98%的碱基对功能不太明显。
实际上,被一些人视为无用的垃圾DNA,它的起源、作用以及在生命进化中的潜在用途,自20世纪60年代首次被发现搅乱我们的染色体以来,就一直吸引着生物学家的关注。
现在,来自以色列特拉维夫大学的研究人员对非编码DNA持续存在的原因,又添加了一些重要的见解,这有助于我们更好地了解整个生物世界中基因组大小的丰富多样性。
1977年,理查德·罗伯茨(Richard Roberts)和菲尔·夏普(Phil Sharp)两位科学家分别注意到,这些杂乱的DNA中有很大一部分不仅分散在我们的基因之间,而且经常在基因序列中间中断,这一发现后来为他们赢得了诺贝尔奖。
它们被称为内含子,似乎给像我们这样的复杂细胞增加了负担,而对像细菌这样的简单细胞却没有影响。他们还在将DNA转化为物质的过程中增加了大量的劳动力。
每一次新制造的蛋白质,这些中断都必须从基因模板中删除,需要将编码指令重新拼凑在一起,然后才能解释为蛋白质。这种日常的比较,就像为了读一个句子而不得不删除成千上万个无意义的单词。
这种看似浪费的操作方式在整个自然界都是必要的,那些幸运的细菌和其他原核生物是例外。
不同物种的内含子数量也有很大差异;人类有近14万个内含子,老鼠大约有3.3万个,普通果蝇有近3.8万个,酵母(酿酒酵母)只有286个,单细胞真菌兔脑原虫只有15个。
为什么进化没有通过自然选择来清理这种混乱,让我们变得更有效率呢?
而且,当基因组随着时间的推移,有一种删除DNA而不是添加DNA的已知自然偏见时,即使经过数百万年的进化,垃圾DNA似乎从来没有变得更短?
上图:当DNA转录成mRNA时,内含子被去除,只留下外显子编码区。
这项针对内含子的最新研究的科学家们表示:有趣的是,事实恰恰相反,因为与原核生物相比,真核生物拥有更大的基因组、更长的蛋白质和更大的基因间隔区。
研究人员提出,删除编码区域周围的任何侵入性DNA片段可能会损害动物的生存,因为编码部分也可能同时被剪掉。他们表示:发生在边界附近的缺失偶尔会突出到保守区域,因此受到强烈的净化选择。
这种边界诱导选择,即一个中性序列位于编码区域之间,因此会对短的非编码DNA序列产生插入偏向。
从本质上讲,垃圾DNA就像一个突变缓冲器,保护包含编码蛋白质所需的更敏感序列的区域。
为此,研究人员创建了一个数学模型来展示这些动态的作用。
该团队解释说,此前有人提出,缺失偏见会导致基因组随着进化时间的推移而缩小。即使在强烈的缺失偏向下,也能出现长的中性进化序列,这一违反直觉的结果是由于对侵入中性序列高度保守边界的缺失的排斥。
虽然,他们的模型为一个物种内内含子长度的变化提供了一个合理的解释,但它不能解释为什么不同物种之间存在差异。
他们写道:一个微不足道的解释是,模型参数本身是进化的。因此,不同物种的插入/缺失比率不同,在内含子中出现保守区的倾向可能也不同。
了解其中的偏差,可能有助于解释我们在自然界中看到的各种内含子,以及为什么有些生物在基因上似乎比其他生物更混乱。
这些干扰的来源也是一个正在进行的研究领域,有很长一段历史的病毒和过时的基因被认为是来源。
毕竟,它甚至可能不是非编码的,它的任务只是我们还没有意识到的功能。近年来,随着更多可能的功能被发现,包括内含子被转录成监督蛋白质生产的RNA链,科学界越来越不再将所有内含子描述为垃圾DNA。
随着时间的推移,我们曾经认为是垃圾的东西,可能会被视为基因宝藏。这似乎是一种复杂的构建生物体的方式,但经过数十亿年的进化,似乎只有大自然知道自己在做什么。
这篇论文发表在《开放生物学》杂志上。
如果朋友们喜欢,敬请关注知新了了!
免责声明:内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,本网站所提供的信息只供参考之用。