众所周知,脱氧核苷酸是基因的基本结构和功能单位,决定生物的多样性的就是脱氧核苷酸中四种碱基(a、g、t、p)的排列顺序不同。
所谓的遗传物质表达,便是体内的dna分子在各种酶的作用下按照其内碱基对的顺序对氨基酸分子进行拼接形成肽链,最终形成蛋白质的过程。
蛋白质是人体重要的组成部分,也是人体实现各项功能的最重要核心。
如果能够探明人体之内的dna密码,了解其基因所表达出来的蛋白质,便能够从最根源的深处了解人体的所有奥秘。
为了达成这个目的,1985年5月在加州santa cruz由美国doe的sinsheimer rl主持的会议上提出了测定人类基因组全序列的动议,形成了美国能源部的“人类基因组计划”草案。
到了1990年10月1日,经美国国会批准美国hgp正式启动,总体计划在15年内投入至少30亿美元进行人类全基因组的分析,这也标志着人类基因组计划正式开始。
历经十年的时间,先后全球国家不断加入,最终到了2001年,人类基因组计划的研究真正完成。
随着上个世纪人类基因组计划的完成,有关于人体之内遗传的奥秘也解开了冰山一角,全部人类基因组约有2.91gbp,约有39000多个基因,平均的基因大小有27kbp,如此庞大的数据,几乎是难以想象。
而在如此庞大的遗传数据之外,更是存在着更深处的奥秘,一个dna分子之中,一共存在着30亿以上的碱基对,而并非是每一个碱基对都会在人体内进行基因编译表达。
在所有的dna中,只有1%-1.5%dna能编码蛋白,在人类基因组中98%以上序列都是所谓的“无用dna”,分布着300多万个片段的“无用”序列。
那是人类对于人体遗传物质上认知的荒漠,它们为何会出现在那里,到底有着什么样的作用,为何人类dna分子之中会有如此之多的冗余?
没有人知道。
然而,随着当今时代,全球复苏的大环境之下,那绝大部分荒废的dma片段似乎看到了某些曙光。