人,一个人在选择他的敌人时要特别仔细。
——奥斯卡·王尔德,《道利·格雷的肖像》
只有圣洁的头脑才能为了一个实验结果监视隔壁实验室与他们竞赛的某些人,并且丝毫不会心烦意乱。
——詹姆斯·沃森,《倾情DNA:基因,基因组和社会》
第一手确凿的证据表明,在我声明我要以空前的速度测序人类基因组后不久,我就进一步冒犯了基因组科学领域的体制。一旦公共资助的科学家们决定他们不想再和我或我的小组有任何关系,TIGR申请政府资助就被拒绝,并且现存资金马上被弗朗西斯·科林斯提取。事后,不可避免地,我与公共计划同时启动的携手共建人类基因组计划的尝试注定要告吹了。
在美国,国家卫生研究院控制了基因组研究资助的流向。几个月以来,我们起草和完善了研究资金的申请,然后将它递交给国家卫生研究院,十几个在这个特殊领域有见识的科学家对它进行了“同行评审”。但是当然,在一个新出现的学科领域,现有的专业知识可能很少,甚至在一个已确定的领域亦是如此,某位领先人物可能太忙而无法审阅这些资助申请或者尽职尽责地研究它们。专家们于是建立团队——研究部来决定它们的命运——可以说当时那些美国生物医学研究的资助申请就是这样在贝塞斯达破旧的旅馆里被这些人决定命运的。那里同行评审们对申请给定一个优先分数,界于1.0(最好)和5.0(不可资助)之间。分数决定钱的流向,事实上,分数高于1.5就意味申请被否定。
对于一项资助计划,失败的所有原因在于,十几个评审中有一个或更多人不喜欢该领域、该研究者、该制度或者该方法。一位评审可能钦佩拟定资金申请的科学家并且尊重他的研究,但是在一个激烈竞争的领域里,阻碍对手获得资助可能会增加自己的实验室得到资助的机会。类似的,它也会导致一种新方法难以有效展开,这个新方法在评审人自己的实验室,轻易被判为“不起作用”而一笔勾销。成功地毁掉一个竞争对手的资助申请不需要彻底的敌意和刻薄的话语,仅仅使用冷淡的态度或只提供微弱的称赞就可以了。
马克·亚当斯和我递交的关于测序人类DNA的申请的失败当然是命中注定的。我们的分数大于1.5,如果我们的计划只是普通冒险的一部分,我们的建议不久就能复活——注定要胎死腹中,没有第二次机会的原因是,它花了9个月时间完成资助评审程序,所以即使你有突破性想法重新递交,也会拖延1~2年,这样你就肯定不会处于一个领先的地位了。
发生在我身上所不同的是,我能找到替代的支持者,感谢我与伯金艾尔莫的新协商,更重要的是,我的新赞助者们保护我的计划不受同行评审的保守主义的影响。在这个过程中,有一个基本的令人左右为难的循环难题:一个人必须游说他的同行支持新科学并且支持“好”科学(也就是起作用的科学)。但是,无论在哪里,新思想被关注,也不可能知道它们是否确实组成了“好”科学,直到实验完成。任何人使用未被测试的方法,新颖的观点,以及独特的见解都相当于遭遇一场战争。以我为例,我正倡议一种新方法,它不能保证人类基因组这样规模的研究的成功,即使它能保证,也会在测序中留下许多小漏洞,这两方面,我都已经公开承认了。
有些谣言不胫而走,我已经听说过一些高层人物,比如弗朗西斯·科林斯、埃里克·兰德、鲍勃·沃特斯顿、约翰·萨尔斯顿以及他的老板在威尔康信托公司已经讨论了怎样否定我的计划。他们最初在关于是否加速和改变他们自己的策略或者坚持他们现有的计划上有分歧。美国基因公共阵营担心,如果国会确定公共计划是浪费金钱,他们将会失去一切。威尔康公司重申了它对现有计划的承诺。沃森说,为使公共计划进行下去,从而获得国家卫生研究院的支持,这是“至关重要的,至少在心理上是”。[1]
问题是他们对于我的工作的多数分析并不是发生在贝塞斯达的关着的门后面,而是在国家媒体上,在新闻报纸上,电视上和主要的科学期刊上。随着时间推移,攻击变得更猛烈了。塞雷拉生产的是“基因组草图”或是“瑞士奶酪”、“导读”形式的人类基因组。
那年6月,一个国会小组委员会召开了一次有关我的计划将怎样影响联邦资助计划的听证会。科林斯已经到了,像我一样穿着运动夹克和长裤打着领带,我们匹配的服装正好象征了“我们是怎样将在各个方面成为合作者的。”[2]华盛顿大学的梅纳德·奥尔森抱怨说,他所知道的关于我的计划都来自于新闻发布会。尽管如此,尽管奥尔森有自己的不良记录——他的实验室酵母菌假染色体实际上已经延搁了基因组的工作——他还是自信地预言塞雷拉的方法存在“悲惨的问题”,他警告说,我最终将在人类基因组中产生10万个“严重漏洞”。[3]在我的演说中,我提醒每个人,测序基因组不是一场竞赛,而是理解和治疗疾病的研究。对公共计划的臧否应该由它怎样主动工作决定,而不是由它与我们怎样竞争决定的。甚至连我的诽谤者也承认我赢得了这轮特殊的公共辩论。就像萨尔斯顿后来承认的,我以我的完整的可信性脱颖而出,而奥尔森的批评只能算是酸葡萄心理作祟。
也许在这场与公共计划相争中,最让我低落的时刻是在1998年6月,那天《今日美国》的科学记者蒂姆·富兰德(Tim Friend)采访了弗朗西斯·科林斯后,引用了他的最后的话。他们的谈话结束了,但是科林斯显然灵机一动,想了一个更诡异的说法描述我们在塞雷拉辛苦工作的最终结果。最初,他认为我们最后将拥有基因组的《读者文摘》版本。科林斯把蒂姆·富兰德叫回来,问他是否愿使用“疯狂的杂志版本”来形容我的基因组。你确定吗?是的,科林斯向富兰德保证。后来,当科林斯因为这句评论受到攻击时,他否认了他曾经说过的话,使用了千百年来政治家惯用的“射杀信使”的传统手段。
最让我灰心的是被该领域的一些偶像们开展游击战,当众嘲笑和诽谤,这可能会挫败我的小组和支持者们的士气。我最担心的是舆论界将托尼·怀特塑造的委琐形象对他本人造成的负面影响,他确实很在意媒体的注意力,但令他不满意的是,这些注意不是直指他。怀特已经雇用了一位新闻刀笔试图获得更多的注意,并且悲痛地抱怨在塞雷拉墙上挂着的新闻复印件,尽是些关于他的暴发户党羽克雷格·文特尔的特写。
怀特不仅继续显示出对塞雷拉商业计划缺乏理解,而且怨恨所有的那些专栏。虽然他已经接受了我的一个先决条件,即我有权利发表我的数据和把测序公之于世,但是他经常试图违背协议。他对旧式的基因组学商业秘密和专利策略保留一份热爱。在与HGS打了这么多交道后,我已精确地知道怀特思想的根源在哪里,在我的演说中,我仍然拿它来开玩笑:一个生物技术企业的口头禅“一个基因,一种蛋白质,一笔10亿美元的进账”。因为实际上,有几份人类基因价值数十亿,人们就普遍认为有数百或数千个同样能产生利润的基因。逻辑既简单又天真。生物技术公司(HGS)和因塞特在人类基因专利方面占领先地位,但是今天它们的股票交易低于它们的现金价值,尽管它们是广泛的人类基因专利证券组合。现在大多数人都明白了我一直都坚信的事:人类基因专利收益通常低于研究它们所耗的成本。在23000个左右的人类基因中,为商人或患者产生了真正的价值的不到12个。
与托尼·怀特的冲突从第一天起就很激烈,而且只会变得更糟。不论我什么时候拜访洛克维尔,他总是对着职员大叫或者表现粗鲁来恫吓他们。事实上,托尼并未遭遇什么困难处境,因为他似乎从艾波拉(Applera)股份公司日复一日的业务中解脱出来了,该公司现在拥有塞雷拉和应用生物系统公司。托尼已经购买了(用公司的钱)一架3千万的喷气式飞机(他把旧的那架给了亨克皮勒,而后者很少使用它),并且一个月左右去洛克维尔一次,我感觉他把他大部分时间花在飞行于他不同的住处间(他正在亚特兰大建造了一所新住处)。托尼让艾波拉首席财政长官送给他一份每日备忘录,根据当天的股票价格计算他的净值,并且他一周至少打一次电话抱怨价格太低。然而塞雷拉是一家新运作的公司,是一项长期投资计划,他却不能比季度报告和股票估价看得远一点。
基因不是故事的全部
检查我的DNA,并且与其他生物,例如我的狗“影子”或一只果蝇的DNA作比较,你会发现一个强烈的提示:曾经被当成无意义的垃圾的大片区域,容纳着一个至今未被认识的“遗传语法”,使我们的基因语言变得比以前所认为的更加复杂。进化力量尽力保留重要的DNA序列,同时允许次要的序列发生改变,这说明为什么所有哺乳动物种群的基因是类似的。在《科学》杂志上,日内瓦医学院的斯蒂利亚诺斯·安东(Stylianos Antonarakis),马里兰基因组研究所的艾文·科克尼斯和他们的同事们把我的DNA与狗的以及像大象和小袋鼠那样关系甚远的物种的DNA进行了比较,显示大部分原以为是“垃圾”的片段几乎是相同的。总之,哺乳动物3%基因组序列不能编码蛋白质,但仍然被精密地保存下来,由此一定是有意义的。曾经被称为垃圾的这些区域已经重命名为“保存的非基因序列”或者缩写为CNG,标记它们不是常规基因。另外一项来自一个国际小组的研究,它由威尔康信托基金桑格研究所以及布罗德研究所(Broad Institute)的研究员们所共同指导,他们发现的补充证据显示,这些区域发挥了重要作用。尽管CNG不是易变的,它们可能仍然携带着可能对人类有害的变异,从而引起多因子疾病。但是我们仍然无法理解它们的影响。
也许它们包含蛋白质的结合位点,蛋白质调节基因怎样轻松被开启,并且蛋白质附着于所谓的转录因子(比如前面提到的我的一个类似猿的因子)上,转录因子在中基因组中大约有1800个。也许它们是不确定的外显子,即我们还未曾识别的部分基因。也许它们帮助保留基因组的结构完整,确保解码的细胞机构的正确形态,从而可以正确地诠释编码,或代表了一些其他有待确定的功能单位。比如,由一个染色体的额外副本引起的唐氏综合征的一些症状可能与附加CNG的出现有关。
怀特会经常回到他最喜欢的主题上——我能再次向他解释我把人类基因组序列公布出去,并且仍然能使塞雷拉挣钱吗?——甚至当他感到太尴尬而不好重复这个问题时,他会打电话来托词一个老朋友正问他相同的问题。他当然知道答案,但是不知道怎样对它做到确信无疑。我得再次解释未经处理的基因组序列对于科学家、生物技术公司、制药公司或者公众是没什么价值的。托尼发现理解人类遗传密码是胡乱排列的30亿个字母,只是无数A、C、G和T串,对于无能力识别解码蛋白质的微小片段的人来说是毫无价值的。
至于弗朗西斯·科林斯和他的朋友们,可以把他们的公共基因组工作描述成“纯粹的”和无专利的而从不被质疑,它产生的大多数数据未被分析理解和讨论就放进基因银行——DNA序列公共储藏库里。真正有价值的是用来讨论它意味着什么的遗传密码复杂分析。为了精确地完成这个任务,塞雷拉正在为致力于做这项工作的世界最高级的计算机建造新型软件工具。测序人类基因组后,我们将测序老鼠基因组,提供一个重要的工具——比较基因组学——区别真正重要的部分,所谓的进化保守区,在两个基因组中都有,并决定它们的功能。我们也会在基因组中寻找拼写错误(单字母的核苷酸多态性或者缩写思尼普斯,SNP),它和疾病、药物副作用或支配治疗效果的风险都有关系。
所以我们卖的究竟是什么呢?托尼经常探问它的答案。我说,我们正努力提出基因组世界的视窗软件的类似物,尽管我开玩笑说我不是新闻界称呼的“基因组的比尔·盖茨”。我喜欢的另一种方式是我们想成为“生物学的彭博咨询”:我们想卖信息使用权,这些信息被采集、整理和组织在一个综合、容易使用的数据库中。我们想把前沿分子生物学与重量级的计算结合起来,为我们付过钱的顾客显示生物学的逻辑。托尼从来不喜欢这个答案。
来自伯金艾尔莫成为塞雷拉的业务总监的彼得·巴瑞特懂得数据库商业模式。他是一个精明的(他取得了化学博士学位)和蔼可亲的家伙,并且尽力在20年间在伯金艾尔莫股份公司立住脚并取得成功。由于他在管理方面极其不信任其他人,而且不太合群,他可能不是帮助塞雷拉的最好人选。据说,甚至在我们测序第一个字母之前,他就已把110%的努力投入到了构建事业并帮助我们收入了数百万。
我坚定地相信,正如我现如今仍在做的,数据库业务是一种切实可行的模式,使塞雷拉成为一家盈利的公司,我认为我完全能实现我做的交易。彼得确实对专利问题保持敏感,相信生物技术和制药公司的真言。我努力辩护称我们的序列没有申请专利的观念,除非它们对于新的诊断学或制药学的发展有明显的价值,就在这时,塞雷拉的专利律师罗伯特·缪尔曼背着我向怀特抱怨。与我的愿望相抵触,缪尔曼想为每一个序列申请专利,对我们已有的序列用法律术语进行地毯式轰炸。
缪尔曼的行为对我来说并不奇怪:毕竟,1995年,他已经与比尔·黑斯特林(Bill Haseltine)一起研究了一份文件的起草,该文件旨在防止第一批基因组——流感嗜血杆菌的发表。现在他正处于他认为的专利乐园里——或者,正如他所指出的,一个“专利律师的春梦”。[4]他想掌控基因的远见也激发了威廉·索奇(William B.Sawch)的想象,后者是艾波拉公司首席法律顾问,他鼓励缪尔曼越过我这一级,缪尔曼开始向托尼·怀特汇报。他抱怨说,我正把钱扔出窗外,因为不论是果蝇、人类或老鼠都没有让他们申请专利。至于一个序列里是否包含一个基因,可以用计算机生成猜测,缪尔曼想对已付过钱的顾客设置专利权,更不用说我们的竞争者们了。
斗争一路进行到艾波拉董事会,在那里,我不得不声明只有当价值清晰时我们才申请专利。我必须为我和我的小组的诚实作斗争,因为我们已经许诺使人类基因组能够公开使用。有时我感到我几乎顶不住这种压力了。那时,我已经有些了解比尔·克林顿了,而且被他有效处理巨大的工作压力、媒体压力和政治对手的方式所激励。对你的攻击者来说,不让他们看见你的畏缩和不安,可能比咆哮着回击他们更好(尽管后者可能十分让你满意)。
尽管有这些阻碍,塞雷拉的士气不仅高涨,而且强烈。每个拜访我们的人都会评价它。人们高兴、兴奋和活跃,我以前从来没有经历过。我们喜欢人们在塞雷拉参观,尤其是我,因为我为我的小组所创造的一切感到非常自豪,塞雷拉就像一座科学的亚瑟王宫殿一般。新的思想、新的方法和新的技术马上得到鼓励,并付诸实践。那里的每个人都知道他或她正为整个事业做着贡献,我们正在创造历史。
我对每个区域的专业小组有基本相同的指示:完成不可能完成的任务。我也强调如果任一小组失败了,整个过程就会失败,因为在霰弹枪测序法中,每一步都依赖于前一步的成功。我的每一个武士们培养他们自己快乐的男人和女人的亚文化群。为了庆祝他们研究出基因组学新的运算法则和计算方法,以吉恩·梅尔斯和格兰杰·萨顿为首的小组培养了一批真正的黑客文化,由高辛烷浓咖啡制造商、福斯足球和乒乓桌组成。梅尔斯甚至称他的追随者们是“黑客团队”。每个星期一,一场战斗就开始了,当黑客们头戴塑料海盗钢盔帽,身配塑料枪,射击泡沫球,偶然也在球里填充豆蔻香料,他们对生物信息学团队发动战争,这个团队用塑料弩作为他们武器。在战斗中,瓦格纳的“女武神之骑”经常在音箱中轰鸣。海姆·史密斯小组有一对年轻、有魅力的技术员,他们帮助拼接复制品文库,我喜欢称他们为海姆的后宫。我们没有一张圆形桌,但是我们在地下室确实有一个极好的自助餐厅,大厨师保罗给我们做好吃的食物。自助餐厅成为中心集会点,几乎每个人每天都在那里吃饭、集合和自由讨论。不论何时我感到情绪低落,只要用我自己的眼睛看见我们所建造的,而且和塞雷拉小组成员谈谈话,我就总是能重新恢复活力和能力继续战斗下去。
我们现在住在我们的两栋9000平方米的大楼里,它包括四个楼层和一个地下室。在1号楼的第一层是行政办公室、我的办公室和那些高级科学家们的办公室;第二层安置了蛋白质学设备;第三层将专用于ABI 3700 DNA测序机的使用和测序技术员的小卧室;顶层是处理DNA的地方。
基因组工作将在顶层与海姆·史密斯和他的小组一起开始运作,他们将通过在喷雾器中使用剪力建构序列文库——通过一个小喷嘴喷洒DNA溶液,轻轻地把染色体中DNA分裂成更小的片段。适当地通过喷雾器后,然后通过凝胶剂,所得到的DNA片段就可以根据大小被分类。海姆可以分离2000、1万和5万个碱基对长度的片段。然后DNA的随机片段将被插入质粒载体,它能使DNA片段插入大肠杆菌中并复制数百万次。以这种方式,我们想创造数以千万计的片段来制造三个不同的文库:一个2000个碱基对、一个1万个碱基对和一个5万个碱基对长度的文库。
文库然后被传送下大厅到细菌设备处,那里每个文库都将被“镀金”。细菌被稀释以至于当最终的细菌稀粥被涂抹在一个琼脂生长盘里时(一种蜡质物质,包含有培养细菌重要的营养),每个细菌都和它的邻居分离开一毫米。当细菌细胞一次一次分离时,包含有一个单独的人类DNA片段的大肠杆菌菌落群将在每一个点上生长,一天以后就变得更明显了。
不久前,为了制造更多的DNA,科学家们利用无菌牙签把细菌从这样的群落转到一个生长管里。在一间我们称为采集室的房间里,我们用大型自动机械替换了牙签和技术员,这种自动机械使用一种十分精确的附有摄像机的机械设备来研究群落。如果细菌太近了,自动机械就忽略它们,因为不同的群落可能混合起来。但是如果显示屏清楚地显示单个群落,那么自动机械设备就用一根金属探针刺它,并把它珍贵的DNA物质转移到一个生长盘(一个塑料盘,含有384个包含有生长介质的小孔),在这里,细菌将繁殖数百万次。探针每次都自动清理,一天之内,我们的四个自动机械可以加工处理10万多个复制品。它们被人们着迷地观察并且将成为拜访的摄制组最喜欢的事物。
把人类DNA从细菌中析出来是其中比较困难的一步。DNA本身在质粒中生长,质粒与细菌染色体分离。在一个典型的分子生物学实验室中,一名好的技术员每天可以做一百个质粒处理工作。为了处理从采集室涌出的复制品,我们将需要1000个技术员。
生长盘有384个孔位,孔位大约深3.8厘米,很窄,它产生一些特殊的问题。早期测试显示,孔底没有足够的氧气,这就限制了细菌在那里生长。我的小组以一种巧妙的方式解决了这个问题,把不锈钢球(霰弹子弹大小)放进孔里。大量盘子被放在一个圆形平台上,然后慢慢旋转放在不同高度的一系列磁铁,磁力使钢球上升、落下穿过细菌介质。通过这种方式混合孔内所有物质,于是我们获得了一致生长的细菌。
同时我们的化学小组设计了一种新方法很快打开细菌细胞,释放包含有人类DNA的质粒。通过把盘子置入一个离心分离机中,我们就可以把细菌的残留物和它们的DNA甩到孔底,把质粒和它里面的珍贵的人类DNA物质留在溶液里。质粒DNA然后被一种新方法迅速纯化,这种方法为我们处理加工的每个生长盘节省1美元以上。