我国现存最早的中医医药典籍《本草经》记载:“神农尝百草,日遇七十二毒,得荼(茶)而解之。”这说明了茶的神奇功效。茶树起源于我国的云南、四川等地,在从中国向世界各地数千年漫长传播历程里,与全球多元文化邂逅交融,发展形成了今天地球上复杂而美妙的茶文化。茶之所以广受欢迎,除了有迷人的香气和令人愉悦的滋味,还因为茶叶中含有许多对人们健康有益的特征性成分,诸如多酚、茶氨酸、咖啡因、维生素、芳香油和矿物质等。
一直以来,业内对于茶叶的香气、风味和品质之间的关系,以及茶树为什么可以在全球扩散并种植等问题,认为需要通过基因组学策略来研究。耗时7年,中国科学院昆明植物研究所研究员高立志带领的团队于2017年首次成功破译了茶树基因组。
日前,高立志在接受《中国科学报》记者采访时表示:“如果说化石可以帮我们找到山茶属植物最早起源与演化的证据,那么基因组测序可以探究茶的生物学奥密。”
立志破译茶树基因
如今,茶树被种植在全球超过380万公顷的土地上。来自国际茶树委员会的数据显示,2016年,全球茶叶产量546.3万吨,其中,中国产茶量235万吨。高立志说:“茶叶不仅在中国而且在世界范围内具有巨大的经济、医药、科研和文化价值。”
然而,在世界三大饮料植物中,咖啡和可可的基因组相继被欧美国家完成了测序,唯独茶树基因组迟迟未被破译。
2006年,高立志从美国回到云南,加盟依托于中科院昆明植物所的中国西南野生生物种质资源库。回国后他做的第一件大事就是购买了我国第一台二代高通量测序仪Solexa GA II,随后他带领团队在国际上首次破译了稻属植物5个物种全基因组。
有了水稻基因组测序的项目经验,2010年,高立志带领植物种质资源、基因组学与生物信息学研究团队,首次在国际上启动了茶树基因组计划。
茶树基因为何难测
高立志团队联合华南农业大学、云南农业大学、广东省农业科学研究院、辽宁师范大学、云南省茶叶科学研究所、金华国际山茶园、华中农业大学和华盛顿大学等单位的相关研究团队,率先在国际上完成了栽培茶树大叶茶变种国家级良种云抗10号核基因组的测序和组装,获得了约30.2亿碱基对的高质量基因组参考序列,注释得到36951个蛋白编码基因。
深入研究后团队发现,茶树基因组庞大的原因居然是长末端重复序列反转录转座子家族。在过去5000万年以来,茶树基因组中长末端重复序列反转录转座子家族经历了多次特别是近期的大量爆发,它们长期而缓慢地扩增,却又缺少有效的DNA删除机制,导致茶树基因组变得十分庞大。
高立志指出:“现在的茶树基因组跟人类基因组差不多大,咖啡基因组大小仅为它的四分之一,而水稻和可可的基因组大小只有它的八分之一左右。”
茶树为什么如此复杂,使得基因组测序很困难?因为茶树是一种高度自交不亲和的异交植物。高立志举了一个形象的例子:“茶树的花粉落到自己的株头上很难成功授粉,这使得几乎每个茶树个体都是杂种,新个体产生时候只知道自己的茶树妈妈是谁,不知道爸爸是谁。”
茶树这样基因组高度杂合的特点,显然给开展基因组测序带来了很大的麻烦。高立志团队发现,茶树基因组杂合度高达2%;重复序列含量极高,约占整个基因组的80.9%。高立志将测序工作简单地描述为以下几步:先将一条很长的DNA链剪成一个个小段,接着用二代高通量测序仪测序,最后也是最重要的一步是拼接还原。杂合度高、重复序列含量也高的基因组,不仅组装复原困难,而且非常容易出错。
最后一步组装工作极其困难,高立志团队花了4~5年时间才完成,最终攻克了茶树这样高杂合、高重复和基因组庞大的植物基因组测序的难题。
为何只有茶组植物适合制茶
茶树所在的山茶属植物多达119种,一个重要却长期困惑人们的问题是,为什么只是茶组植物的叶子适合制茶,而非茶组植物,比如人们熟知的茶花和油茶等的叶片不能作为茶饮。
为此,高立志带领团队对大多数茶组植物和非茶组的代表植物进行了植物化学成分的比较分析,发现茶树和其他的茶组植物富含茶多酚和咖啡因,从而区别于非茶组物种。
研究还发现,茶树近期曾经发生过一次全基因组重复事件,加上大量的特异基因家族的扩增,导致茶树基因组里与茶叶的香气、风味与品质密切相关的基因显着地扩增了,扩增的结果是不仅促进茶树适应全球多样化环境,还通过优胜劣汰的自然选择促进了茶树抗病基因家族的增长,使其成为世界性饮料植物。
高立志总结道,山茶属中第一个基因组的获得,不仅可以了解山茶属植物基因组与基因的进化规律,还促进了世界四大木本油料植物之一的油茶、世界十大名花山茶花和被誉为“植物大熊猫”的金花茶的遗传育种。
通过与不同团队的合作交流,高立志已成为一位茶学专家,并在研究中进一步证实野生茶跟栽培茶树风味不一样的遗传基础。茶树野生近缘物种因蕴藏着丰富的优异新基因,有望开拓新的茶叶市场,使中国的茶文化在国家的“一带一路”倡议中再次走向世界。(生物谷Bioon.com)