生命科学的研究有很大一部分集中于研究基因及其产物的功能。到底有哪些方法可以用来研究基因功能呢?本文初步总结为“七大绝招”和“三板斧”。掌握了这“七大绝招”和“三板斧”,设计实验更容易,看文献听学术报告也更轻松。
第一招: 天地人合
无论是学习还是研究,必须遵循的一个原则是“从生活中来,到生活中去”。学习的时候,如果与日常生活中熟悉的、简单的事情结合起来理解,就可以化繁为简,化难为易。学习的目的是为了应用,学到的东西,必须应用到日常生活中去。
怎样研究基因的功能?要回答这个问题,我们先看怎样研究人的功能。假如你是男生,喜欢上了一个“女生”,可是这个“女生”长得扑朔迷离,帅气中带着妩媚,羞涩中透出豪爽。所以,你面临的第一个问题就是:TA到底是男还是女?第二个问题是:TA是不是学生?如果是的话,是本校的吗?你不认识TA的任何朋友,所以也没法打听。为了回答这几个问题,你决定翘课跟踪TA。你发现,白天的大多数时间,TA去了本校教学楼的教室。你守在教室的洗手间旁边,观察TA下课的时候上洗手间,去的是男洗手间还是女洗手间。高兴的是,你发现TA去了女洗手间(终于松了一口气)。不过你比较小心,为防万一,你又跟踪她,看她晚上回宿舍去的是男生宿舍还是女生宿舍。不出所料,她去了本校的女生宿舍。这下你终于放心了:她是本校的一个女生。
因为她去女洗手间和女生宿舍,提示她是女的。因为她白天去本校教室,晚上去本校女生宿舍,提示她是本校女生。上述事例告诉我们:一个人什么时候,在哪里活动可以提示其身份。同样,基因表达的时间和部位,常常可以提示其功能。例如,如果基因A在胚胎发育过程中表达,成年后不表达,则提示该基因与发育有关。基因B在在大脑的海马中表达,而海马与记忆有关,那么这个基因可能与记忆有关。
接下来的问题就是:她是哪个系的?她有什么兴趣爱好?你发现,她有两个形影不离的好朋友。你恰好有同学认识她的这两个朋友。同学告诉你:她两个好朋友都是中文系的,都喜欢打羽毛球。这时,你基本上就可以认为这个女生是中文系的,爱好之一是羽毛球了。
以上所述可以归纳为三点:天时,地利,人和。“天时”指基因及其产物什么时候表达,“地利”指的是基因及其产物表达于哪个部位。“人和”可以进一步引申为两点:1. 近朱者赤,近墨者黑。就是说一个人会与他经常接近的人相似。基因也是如此,相互作用的一些基因常常具有类似的功能,它们为了完成同一个功能而通力合作。例如,如果实验发现蛋白C与蛋白D相互结合,而基因D是某一信号通路的受体,则基因C可能也是该信号通路的成员。2. 近猪者吃,近墨者喝。就是说一个人不仅会经常接触与自己类似的人,还经常接触自己的工作对象。例如,一个经常与学生接触的人,既可能是学生(近朱者赤),也可能是老师(近猪者吃)。同理,与一个基因接触的其它基因或者物质,也可能是其作用的对象。例如,如果蛋白质F与DNA结合在一起,则提示其对DNA发挥作用,可能参与DNA复制、转录等。
“合”指的是合理。亿万年的进化使不合理的基因基本上都被淘汰了,所以存在的基因其功能必定是合理的,至少具有合理性的一面。合理的表现就是能够促进个体的生存和繁衍。合理遵循两个原则:一,经济原则。生物不会浪费物质和能量在一个无用或者冗余的基因上。凡是一个基因可以实现的功能,没有必要用两个基因。二,有效原则。基因的功能应该促进而不是损害生物的生存和繁衍。根据合理性原则,无需任何实验证据,我们不难想到非编码DNA序列是有用的,不是无用的垃圾。
第二招:患得患失
有人说,金钱不是万能的,但是没有金钱是万万不能的。那么,金钱到底有什么作用呢?有两种方法可以知道答案。第一种方法是你去一个陌生的地方,突然钱包被偷,所有的现金、信用卡和可以换钱用的物品都没有了。此时,你就知道钱的作用是什么了。第二种情况是你买彩票突然中了一千万,很快,你也可以知道钱的作用是什么。得到和失去,都可以让我们知道事物和人物的功能,而其中失去更为有效。
得,指的是基因的过表达(Overexpression);失,指的是基因敲除(Knockout)或者低表达(Under-expression)。例如研究的假说是基因A与记忆力呈正相关,那么可以这样设计实验:先过表达基因A,预期结果是记忆力增强,再降低基因A的表达水平,或者完全敲除(如果不是lethal的话),预期结果是记忆力减弱。一个高质量的实验设计,一般应该“患得患失”,两方面的实验都要做。
我们不仅要“患得患失”,还要“斤斤计较”。因为过表达或低表达的水平不同,表型改变可能也不同,甚至看不到表型改变。例如,用RNAi Knockdown一个基因的表达水平的70%也许看不到任何变化,但是Knockdown 90%就能观察到表型改变了。所以,当过表达或者低表达研究基因却没有得到预期结果的时候,就需要考虑基因表达水平的变化是否不足。
有时即使完全敲除一个基因也看不到任何表型的改变,此时也不能下“研究基因与研究表型无关”的结论。这就好比一个桥有十个桥墩,如果只去除掉桥墩4,在非过负荷的情况下,桥可能不会倒塌,可以正常通车。可是,如果先去除掉桥墩5,再去除桥墩4,桥就会倒塌了。我们能够认为桥墩4是无用的吗?当然不能。桥墩在这里好比处于同一个通路具有相似功能的基因,桥是否可以通车好比基因的表型是否正常。所以,在敲除一个基因A看不到表型改变的情况下,可以在基因B(与A的功能具有相似性,或者是上下游的基因)敲除的动物模型上敲除基因A,观察敲除后是否有变化。
有时候,全身性的过表达、低表达或者基因敲除会出现我们不想要的结果。例如,全身性的基因敲除会致命。为了解决这个问题,现已开发出许多种组织特异性和时间特异性的过表达、低表达和基因敲除技术,使得基因调控更加准确。
第三招:上下求索
基因需要经过转录为RNA、翻译为蛋白质至少两步才能发挥功能。所以,研究一个基因的功能,就可以在DNA、RNA和蛋白质的水平分别进行研究。DNA的水平相同,不代表RNA的水平相同;同样,RNA的水平相同,不代表在蛋白质的水平相同。哪怕就是在RNA水平,还有不同的剪切的可能。
一个基因翻译成蛋白质之后,常常需要同其它的基因及其产物相互作用才能发挥功能。例如基因S,翻译成蛋白质S,如果它是配体,就需要和受体结合,然后受体激活信号通路。如果S鉴定出来了而其余的通路基因没有鉴定出来,那就可以研究上游的配体和下游的信号通路基因分别是什么。一个转录因子,常常可以激活或抑制一系列基因的表达,究竟可以控制哪些下游基因,也值得研究。蛋白质发挥功能,常常会有正性调控和负性调控因子。从上游来看,哪些基因及其产物可以促进或抑制研究基因的表达水平?具体机制是怎样的?从下游来看,哪些基因及其产物可以增强或者减弱研究基因的功能?具体机制是怎样的?这些都可以研究。
所以,研究一个基因,就可以在不同的表达水平和不同的作用水平上“上下求索”。
第四招:背井离乡
背井离乡,指的是misexpression,就是在非正常时间、非正常位置、非正常物种(时间、地点、人物)表达一个基因。如果在正常情况下,研究基因具有特定功能,而且在非正常时间、非正常位置和非正常物种间表达的时候同样导致该功能,则我们下“该基因具有该特定功能”的结论就更有把握。
值得注意的是,misexpression不产生预期表型,并不能认为研究基因与该表型无关。因为一个基因发挥作用,需要很多其它基因的帮助。如果misexpression的部位、时间、物种缺乏该基因发挥功能需要的辅助基因,或者多了可以抑制该基因功能的其它基因的表达,则可以导致预期表型无法产生。如果misexpression产生了某一表型,不代表该表型是该基因的正常功能,原因同上。所以,misexpression告诉我们:该基因“可以”做什么,不代表该基因实际上做了什么。打个比方,我们把一个教授放到农村去,他没法接触到做科研需要的设备、文献等,而且迫于生计,他不得不自己种田维持生存。我们能够下结论说:教授的社会职能是种田吗?当然不可以。但是我们可以说:教授是“可以”种田的。
第五招:内外兼修
体外实验(In vitro)简单便捷,可以很快得到结果。可是,体外实验的条件和体内的情况不一样,体外实验得到的结果一般还需要体内实验(In vivo)来验证。“内外兼修”指的是既做体外实验, 又做体内实验。这一招不是太常见,有些文章不一定同时做体内和体外实验。
第六招:十面埋伏
当你论证一个观点的时候,可能会有人反驳你。一篇好的文章,必须提前想到这些反驳,并通过做相应实验设下“埋伏”,反驳这些可能的反驳;此外,还应通过类似实验重复验证来增加结论的可靠性,这就叫做“十面埋伏”。
中医诊治病人,需要“望闻问切”,把四种方法得到的信息综合起来才能做出正确的诊断,这叫“四诊合参”。(题外话:电视剧里仅仅通过望诊或者仅仅把脉就开药的中医,基本上都是骗人的。实际生活中遇到这样的中医,可以判断为江湖游医。)历史学上有一个说法叫做“孤证不立”,就是说如果只有一条证据支持一个论点,那么这个论点是不可靠的。生活中,如果有一个人说某人有问题,他不一定真的有问题。可是如果很多人都说他有问题,那他就很可能真的有问题了。
如果仅仅从一篇文章的角度来考虑,做这么多的实验不是很有必要。例如,做了第一个实验,结论成立的可能性是80%,做了第二个,可能性上升到95%。可是,科研是积累性的,你的结论是别人推理的基础,你推理的基础则是前人的结论。假如A1引用了你的文章,A2又引用了A1的文章,如此反复一直到A10。如果每篇文章结论正确的概率是80%,则A10文章结论正确的概率是0.8010=10%,如果每篇文章结论正确的概率是95%,则A10文章结论正确的概率是0.9510=60%。差别从一开始的15%,变成6倍了。所以,多做实验增加结论的可靠性,对于科学的长期发展是至关重要的。
看文献的时候,你会发现作者做了一大堆实验,这么多的实验就像唐僧在你耳边念经一样,把你弄得晕头转向。为了提高看文献的效率,一般只看关键实验,次要的实验可以略过。当你做学术报告时,由于时间有限,只报告关键实验。等到观众提问时,这些次要实验就可以派上用场了。例如,听完你的报告,有听众提问说:“我觉得你的结果还有两种可能的解释,包括。。。你怎样得出这个结论的呢?”此时,你就可以从容自若的说:“这是一个很好的问题。针对第一种可能,我们做了XX实验,结论不支持这个可能。针对第二种可能,我们做了XX实验,发现。。。” 看到了吧?这就是“十面埋伏”的妙处。
第七招:一网打尽
如上所述,每一个基因都有作用于它的上游基因,也有受它作用的下游基因。每一个上游基因和下游基因又分别有自己的上下游基因。除了上下游基因及其产物,细胞内、机体内的其它物质例如离子等也都会作用于基因自身。用马哲的观点来说就是联系无处不在,无时不有。这些联系构成了一个复杂的网络。目前生命科学的一个发展趋势就是研究基因网络。所以,研究一个基因的功能,还可以构建出它所处的网络。
三板斧:天时地利,患得患失,十面埋伏
为了增加适用范围,上面一共总结出了七大绝招,但却不够简练。一个研究或者一篇文章,常常只用到其中的一部分。为了更加简洁,可以总结为最重要的“三板斧”:天时地利,患得患失,十面埋伏。“天时地利”,指的是基因何时何地表达。“患得患失”,其中“患失”比“患得”重要得多。“十面埋伏”,指的是立体论证。基本上,每一个研究都离不开这三板斧,上述文章就是一个很好的例子。而只要学会这三板斧,就可以做大部分科研了。所以,科研就是这么简单!(生物谷 Bioon.com)