血红蛋白和肌红蛋白都属于珠蛋白,血红蛋白又可分为阿尔法和贝塔两大类,每一类各有一些亚型,比如兔子的贝塔血红蛋白就有贝塔1、贝塔3、贝塔4三种,分别由贝塔1、贝塔3、贝塔4基因编码,这三个基因连在一起成为一串,就象三个相关的电脑文件被写在硬盘上的同一个cluster。这三个基因都非常相似,可以推测是从一个原始基因不忠实地复制而来的。为什么没有贝塔2呢?原来贝塔2是一个没有编码功能的假基因,它插在贝塔1和贝塔3之间,基因结构与贝塔1相同,二者的序列也非常相似;但是贝塔2的调控区发生了改变,使它没法被转录;它的“编码”区在开始部分发生了点突变,即使被转录了也会很快中止;在这重重保险的抑制下,使得贝塔2完全丧失了转录的机会,而成为无用的假基因。由于贝塔2与贝塔1极为相似,我们可以推测它就是由贝塔1复制变来的,比较二者的序列可以计算出这个复制事件发生在大约五千五百万年前。
贝塔2也不是一开始就完全没有功能的,从序列比较可以推测它作为一个真基因活动了大约两千两百万年,以后堆积了太多的突变,而在大约三千三百万年前丧失了功能,变成了假基因。如果我们不需要一个电脑文件了,我们可以发出指令把它删除;而实际上,这个文件并没有从硬盘上抹去,它还在硬盘中,只不过删除指令取消了操作系统指向这个文件的指针,使得它在文件名单中消失了。细胞对于那些已经丧失了功能的基因也是采用同样的策略处理,并没有把它们清除,只是加了种种限制防止它们的表达,而把它们作为“化石”保留了下来。有时候这些限制失灵,让这些“化石”基因复活了,就出现了返祖现象。