生命科学 医药健康 基础科学 工程技术 信息科学 资源环境 前沿交叉 政策管理
 
作者:贺根生 来源:科学时报 发布时间:2009-5-5 22:0:56
计算变异学:一项没有资助的创新成果
 
最近,一项被来自上海交大、南京大学、中科院上海生命科学研究院、四川大学、兰州大学、复旦大学和美国哈佛大学的权威生物信息、生化、数学专家称之为“令人瞩目的成果”——计算变异学,通过了广西壮族自治区科技厅组织的成果评审,评审委员会认为该项成果达到了国际领先水平、为提升中国的基础理论研究水平作出了贡献。而此项成果却是在没有任何资助的情况下,由广西科学院研究员严少敏和客座研究员吴光共同完成的。
 
追梦,干自己喜欢的事
 
吴光、严少敏是大学同学。上学时,他们就有一个共同的梦想:创立一个独特的研究领域,憧憬有一天中国人也能获得诺贝尔奖。大学毕业后,他们又多了一重关系:由同学成为夫妻。共同的理想,把他俩紧紧地连在一起。
 
1992年,当先期出国留学的吴光希望严少敏出去陪伴的时候,严少敏毅然中断了她在中国医学科学院药用植物研究所的工作,来到俄罗斯陪读。以后,她又随吴光先后到了日本、意大利、瑞士。在意大利,严少敏找到了自己人生的新起点,在锡耶纳大学医学院拿到了博士学位。
 
吴光不满足大学实验室里那根据导师设计好、按部就班的科研方法,在完成导师课题的同时,他总是利用业余时间去做自己喜欢的研究题目,此时严少敏就成了吴光最好的帮手。
 
怎么想到搞计算变异学?吴光说:“这纯粹是个人爱好。”
 
吴光在乌迪内大学医学院实验室时,因科研和发表论文与导师发生不愉快,感到还是要从事基础理论研究。
 
他从诺贝尔奖获得者杨振宁从事理论研究中得到启示,认为理论研究可以最大限度地发挥个人主观能动性和创造性。理论研究的成果主要体现在论文,而科研论文的产生,犹如工厂生产产品。首先,是获取原料实验数据;其次是经过“工厂”加工,这个“工厂”就是科研工作者,将获得的数据分析、研究、处理,最后得到“产品”——论文。因此,实验数据是开展研究工作的前提与基础,研究人员的创新能力与素质,则是论文质量的关键。
 
怎样才能打开一个新研究领域,却又不受环境、条件的制约?吴光想到了蛋白质基因的测量研究。因为随着生命科学研究的不断深入,互联网上提供的基因数据越来越多,而且可以免费使用。
 
1999年7月,吴光通过对从网上下载的蛋白质数据分析研究,撰写了自己第一篇关于研究蛋白质变异的论文《一阶、二阶马尔可夫链分析血红蛋白?琢链的氨基酸序列及其三个低携氧性变异》,发表在《国际比较血液学》杂志上,由此便一发不可收拾。2000年,他在法国马赛大学做博士后的一年中,利用业余时间在国际杂志上发表的论文就有15篇,其中11篇是写计算变异学的。
 
2000年,严少敏也加入到吴光的课题中来。随后,她谢绝了乌迪内大学附属医院院长Beltramin教授的再三挽留,停掉了工作7年的心脏研究,全心身地投入计算变异学研究。在这之后的研究中,他们俩作了明确分工:吴光主要负责计算机编程,严少敏主要负责计算。
 
2002年6月,吴光因父亲去世先期回国,7月严少敏也携子回到国内。
 
回国后,天津中新药业曾想聘他们,他们没去。美国也有多家科研机构邀请他们前去工作,他们也拒绝了。他们一心想的是努力完善研究,不让自己打开的这门新领域中的成果落到外国人手里。在回国的6年时间里,他们就靠着自己留学时攒的一点钱维持日常生活。
 
作为个体研究者,他们所遇到的不仅是生活上的困难,更难的是因为没有单位,他们对外联系、发表论文都师出无门。为了让自己的研究能坚持下去,他们在深圳成立了一家公司,取名“追梦科技”,以圆“由中国创立新学科”之梦。而这家公司没有任何业务,只是为了发表论文。
 
经过10年的努力,这个梦想正在变成现实。至今他们已在Amino Acids、Biochemical and Biophysical Research Communications、Cancer Letters等27种英文国际学术期刊上发表了66篇论文,其中期刊的最高影响因子达到10.9。论文被79个检索库收录481篇次,其中SCI收录46篇,Chemical Abstracts收录29篇,Biological Abstracts收录23篇。2008年9月由他们撰写的《计算变异学讲义(英文版)》由美国纽约新科学出版社正式出版,标志由中国学者创立的计算变异学由此诞生。
 
创新,计算生物学的新学科
 
何为计算变异学?
 
严少敏首先谈了她了对该学科发展的基本认识。
 
她说:“成功而有效地量化蛋白质,是研究蛋白质变异和进化的基础,也是进一步数学建模的前提。”
 
科学研究发展到最高阶段,必然与数学紧密相联,最终可以数学公式、数学模型来表示。她进一步解释,目前,国内外多以蛋白质和氨基酸的理化属性等指标来量化蛋白质。但是,理化属性等指标不能随蛋白质的长度、氨基酸的构成、氨基酸的位置以及相邻氨基酸的不同而变化。因此,用理化属性作量化指标有着很大的局限性,不适合研究蛋白质的变异和进化。
 
她认为,研究的起步都是从测量开始的,例如,欧几里得几何学是从测量土地开始,爱因斯坦的相对论是从测量光速开始,又如,IQ是测量智力的一个指标,等等。
 
随着生命科学的发展,对DNA、RNA、蛋白质的测量也逐渐引起研究人员的注意,产生了用二十几种字母来表达蛋白质序列的方法。但它们仍无法把DNA、RNA和蛋白质序列进行简单量化。经过科学家的努力,已有近550种氨基酸的理化属性和生物学特性用于量化蛋白质。如一种氨基酸的重量是一个数,这样,以一组字母表达的蛋白质序列就转化为一组数的序列,有了相应的单位,可以用数学工具来处理。
 
可是新的问题也随之而来,一是理化特性是物理、化学家为其研究对象创立的,难以为生物学家所用;二是物理化学单位与生物的单位有时不一样,用它描述关系时还得用系数来平衡。然而,最不合适的还是理化属性是“死”的,如一种氨基酸的重量,在蛋白质序列的任何位置是一样的,而蛋白质却是“活”的,是在不断变异过程中进化。
 
为了寻找对蛋白质量化的科学方法,吴光、严少敏从1999年开始,经过近10年的努力,应用随机原理先后创立了对相邻氨基酸的变化敏感、对氨基酸位置的变化敏感、对氨基酸时间指向变化敏感的3种定量蛋白质的新方法。这3种方法均可将整个蛋白质及其氨基酸序列数值化,而且得出的数都没有单位,这就免去了采用理化特性方法平衡单位的难题。
 
为了检测这3种方法是否可行,吴光编写了大量的程序,严少敏计算了数以万计的蛋白质。实践证明,这3种方法的确有效,从而改变了传统蛋白质测量指标一成不变的现状,为蛋白质量化打下了良好基础。
 
他们用这些方法分析蛋白质的变异,并从2005年开始在他们发表的英文论文中连续使用“Computational Mutation”(计算变异)。虽然在英文中没有“变异学”这一单词,考虑到中文的用法,和其理论框架,他们在用中文表述时还是称之为“计算变异学”。
 
圆梦,仍须继续拼搏
 
2008年,迫于回国多年没有经济来源,而从国外带回的积蓄也所剩无几,经英文《氨基酸》杂志编辑、美籍学者周国城的建议和推荐,严少敏从深圳应聘到广西科学院生物研究中心工作,在该院院长兼中心主任黄日波的支持下,继续从事计算变异学研究。
 
今年3月,她和吴光的“计算变异学研究”成果通过了由广西壮族自治区科技厅组织的评审,来自上海交大、南大、复旦、中科院上海生命科学研究院、美国哈佛大学等国内外7名教授,给予了这项成果极高的评价。
 
评审委员会认为:这项研究成果无论在应用上和还是学术上都有着极其重要的意义,为提升中国的基础理论研究水平作出了贡献。
 
目前,《计算变异学讲义》一书已在各国销售,中国国家图书馆、美国国会图书馆、大英图书馆及北京大学、耶鲁大学等20多个国家和著名大学图书馆已收藏此书。
 
严少敏说,计算变异学的研究方向的确立和学科领域体系的形成,只是圆梦的第一步,下一步是将成果推广应用,它关系到计算变异学能否在更大的范围应用、得到更多的专家学者的认可,以进一步证明其科学性和实用性;同时在广泛的推广应用中,还需对测量方法不断完善。
 
她表示,他们将再用一个10年来完成第二步的任务,相信到那个时候,由中国人创立新学科的梦想将可真正成为现实。
 
在接受记者采访前,他们刚从上海交通大学生命科学院讲学回到南宁,这是他们首次应邀到大学介绍计算变异学。听讲座的师生很感兴趣,而且已有两个课题组正在应用他们的计算变异学方法,开展流感病毒和药物代谢酶的研究。这也是计算变异学推出后的第一家使用单位,对吴光和严少敏来说无疑是一个极大的鼓舞。
 
《科学时报》 (2009-5-6 A2 国内)
发E-mail给: 
    
| 打印 | 评论 | 论坛 | 博客 |

小字号

中字号

大字号