【基础科研】基因工程与分子生物学的新发展（一）

2015-08-25 11:49

当我在博士班面临高能物理理论界正在集体转型为偽科学的困境时，最羡慕的就是住在同一个理工学院宿舍但属于进步很大很快的新科学学科的其他博士生，尤其是研究基因工程的生物系学生。美国联邦政府自1984年开始筹划Human Genome Project（HGP，人类基因组计划），准备以15年时间，投资30亿美元，由20个一流大学分工协力，将占有人类基因90%的Euchromatin（真染色质）完全解码。这个计划在1990年正式启动，哈佛也是参与的重点学校之一，所以就有我在宿舍和餐厅常碰面的研究生也在其中。他们当然是神采飞扬，和我这种误上贼船而自己又心知肚明的倒霉蛋成了鲜明的对比。那时大家都知道将人类基因组完全定位对21世纪的医学进步会有极大的贡献，参与这个庞大的计划自然看来就是职业生涯的极佳起点。

结果人算不如天算，HGP所用的80年代最先进方法到1995年就完全落伍了；有人发明了新的散弹枪测序技术（Shotgun Sequencing）。所谓的散弹枪技术就是把极大的DNA分子复制后随机打成极多很小的碎片，然后用机器来分析这些小碎片，最后才用电脑程式把它们像拼图游戏一样重组起来。这和以往的Primer Walking技术的差别在于不须要小心翼翼地把DNA切成预定长度的小段，所以可以高度自动化，速度提升不只一个数量级。到了1998年，HGP的最大测序机器供应商Perkin-Elmer Biosystems（Perkin-Elmer的总部就在我家隔壁那个镇）做了一个内部评估，发现如果他们自己用散弹枪技术来重做HGP的分析工作，从设计制造新机器到完成整个计划只需要三年，也就是到2001年就可以完全解码人类的真染色质，比HGP要提早四年，而且花费只有2亿美元。这个计划很快就被批准，Perkin-Elmer全力投入，开创了一家子公司，叫做Celera Genomics。

读者或许觉得奇怪，2亿美元虽然比30亿少，但毕竟也是一笔大数目，Perkin-Elmer花这笔钱又不能对人类基因拿下专利，有什么好处呢？一开始Celera只说查询他们的基因资料库是要收费的。这下子主管HGP的大师们群情激愤了：你们没来由地出头和我们竞争，只是对我们个人的羞辱，还算小事一件，现在居然还要把属于全人类的学术成果拿来当极庸俗的赚钱工具，是可忍孰不可忍，所以我们一定也要提前在2001年就把计划完成。而且Perkin-Elmer雇来的Celera总裁叫做Craig Venter，他从1995年起就吵着要改用散弹枪技术，被大师们嗤之以鼻，逐出学术主流，如果大师们被他打败了，面子上实在挂不住。那么唯一的办法就是回头向国会解释Celera和Venter有如何如何的邪恶，无论如何必须赶在他们之前完成基因解码，让无限慈悲和睿智的国会当初批准的HGP能顺利成为原先计划的大突破，为人类的未来提供免费的服务。

我并没有找到他们要到多少钱之类的详细资讯，以下这段分析主要是我自己的猜想，只有环境佐证（Circumstantial Evidences），请大家姑妄听之。HGP临时想要提前进度，只能靠增购机器，一开始他们还不好意思跟着买新的高速机器，所以只好在1998年先买了一批旧型的。Celera买了2亿元的新机器，世界各国的实验室在1998年也买了1亿多美元。到1999年，新机器的性能被证实比广告预期的还要好，HGP忍不住了，才开始大买特买。于是Perkin-Elmer的销售额成指数成长，在1999年和2000年得以连续做企业重组，在股票市场捞了几百亿美元。所以我认为，实际上Perkin-Elmer原本的考虑是在1995-1998年间就希望全球第一大客户HGP能採购新机器，如此一来可以对同样的一个產能需求卖两次，但是主管HGP的老顽固们不愿意（其实避免重复投资，为公家省钱，是有其道理的），于是最后只能用上激将法。刚好遇上互联网泡沫，Perkin-Elmer在股市上一本万利，大获全胜。后来一旦大批订单已经进了Perkin-Elmer，Celera就放弃了对资料收费的计划，结果当然无法收回老本（其实要跟订户收回2亿美元，而HGP的资料却是免费，原本就是痴人说梦），Venter也在2002年初就被解雇（兔死狗烹）。我所看到的报导都说Celera是个彻底失败的事业，我个人则觉得它是当代最成功的商业权谋运作之一。

Perkin-Elmer的新机器成为21世纪基因工程突飞猛进的原动力，我在前文《鸟类的演化》里已经提到了一些它在基础科研上的应用。今年初我和纽约大学基因实验室主任聊天时，问他如果给他一个完全未知的样本，最快要多久可以完成分析其基因组；他说原始数据只要两天。1995年之前，这是要花15年的事，可见基因工程进步的脚步之大，前途不可限量。那么为什么我们还没有真的看到基因工程在医疗上的应用呢？这是因为解码基因组只是前一半的工作，后一半是根据分析的结果来修復基因。这比解码还要困难得多，但是在2012年，终于有了大突破，我在下一篇文章再详细介绍。

Patchin1

2015-08-25

当年在实验室用Perkin-Elmer 的分子束磊晶机器烂透了至今对这个名字感冒不知他们在基因工程做得这么好

不是產品做得好，而是在行销上做到独霸。

frances

2015-08-25

to be continued? hope the part two will come out soon...
1. i seem to have become over paranoid nowadays, fast moving advancing technology sometimes worries me so much as there almost alyways were some "creative" people who found ways of abusing/owning it to profit themselves...2. I laughed at the way you described the U.S. Congress...very cinycle (or cynicle?)??
3. when you commented on Celera being the company with very successful operation strategy...did you meant it helped its mother company P-E to profit billions from increased sales and hugely inflated share prices? I wonder what it's like nowadays re share price?
Please ignore those questions if too silly

Wait for the second part, and you WILL be concerned.

R.R

2015-08-25

我们还没有真的看到基因工程在医疗上的应用呢
因为要实际应用在医疗上,就必须要有很强大的evidence 作为证据, 而这样的过程是非常漫长而且需要通过法规单位认证的, 除此之外, 看似有用的基因做出来的结果不一定有用, biomarker 的开发就像是大海捞针一样, 不是一蹴能及 (就算知道序列也是一样, 因为你不知道这个序列代表的意义跟可以表现的功能) , 理解一个biomarker 尚且如此困难, 就更不用说开发出相对应的药品了, 所以很多都停留在实验室等级, 说穿了就是骗钱的东西, 有的就算再过一百年也不可能上市! 不只美国,台湾也一堆这样的诊所或小医院(不是大医院)乱搞.. 说穿了, 那些东西不会有结果
这个东西会挡人财路, 我就不公开PO, 长期拜读您大作, 分享一点心得

不是的。

现在一堆骗人的东西，正因为没有真的；而真的做不出来，是因为一直到三年前，没有可靠的方法可以修改既有的基因。看了下一篇你就知道未来15年，会是医疗进步的黄金时代。

caspase

2015-08-26

目前真正有用的biomarker少之又少，而且biomarker即使是真的，也只是作为疾病诊断的指标，极少有针对它开发对应药物的价值。一个例子就是肝炎诊断的biomarker甲胎蛋白，它升高了只是代表肝细胞受到损害而已，但是它没有用来开发药物的价值。而基因组测序能够提供全面的基因信息，结合遗传学和生物信息学，可以从根本理解疾病的原因。而过去十年兴起的genome editing技术，则提供了从根本上修正这些错误的基因的手段，这种手段跟再生医学一结合，必将爆发出巨大的能量。我想先生下一篇会重点讲12年底13年初出现的新的gene editing手段。

是的，准备要讲CRISPR。

打酱油

2015-08-26

王老师,你好,正好说道生物技术,以下是一篇帖子,其中介绍了生物技术的困境,他认为目前生物学出现了大量的博士民工,就是因为生物学还处于最原始阶段，处于数据整理阶段,其质变的突破遥遥无期.他的整篇文章写的挺好,请点评一下.
空间受限下的经济危机和人类社会的热力学平衡: 技术大进步的停滞
bbs.tianya.cn/post-develop-1503114-1.shtml[%E8%B5%84%E6%B0%B4%E4%B8%9C%E6%B5%81]
以下是其文章的原话:
　　首先要表明，本人的教育背景都是数理方面的，做项目的时候，间接了解过某些生物方面的知识，主要是神经信号，CT图片等等，但没有系统学过生物知识。
　　但本人认为，科学之所以是科学，就在于从从事科学研究中学到的方法和评价原则是通用的，某些时候，从外行的角度来看问题，反而能避免内行的利益角度和自我炫耀。
　　生物技术给我的总体印象就是一个词：
　　矛盾!
　　学科预期和现实的矛盾！
　　从业者自我认识和社会承认之间的矛盾！
　　宣传和就业的矛盾！

　　生物技术的症结究竟在哪里？个人认为，
　　生物技术的门槛不是社会伦理，
　　而是生物学还处于最原始阶段，处于数据整理阶段。
　　生物学的哥白尼有了，施莱登，施旺，达尔文和孟德尔，
　　生物学的伽利略也有了，双螺旋结构的发现者，沃森和克里克
　　但生物学的牛顿和莱布尼茨迟迟不能出现，
　　生物学的瓦特更是不见踪影。

我觉得他的逻辑很乱，但是总结起来基本上就是“生物不像物理那样有简单规律，所以不是科学“。前一句话当然是对的，后一句则当然是错的。科学只是一个坚持事实与逻辑的态度（详细的定义我以前已经讨论过了），用同样的态度去研究不同的现象，自然会有不同的需求和不同的成果。其实生物只是因为研究对象太复杂，所以没有简单规律；在物理方面也有类似的分支，基本上一切都是靠实验观察，例如流体力学。

他列举了很多生物方面的吹嘘夸大，可是却没注意到物理和工程上其实也有很多这样的例子，超弦更是纯粹的偽科学。

你等到下面两篇文章出来，就会了解为什么我对基因工程如此兴奋乐观了。

frances

2015-08-26

I was still indeed excited by the advancing scientific developments...just being a over worrier, i fear many best technology/science become damaging when fell in the wrong hands...

I'm afraid that the genie is truly out of the bottle. There is no going back. We will just have to learn to adapt.

Midas

2015-09-02

其实误上贼船的不只你们高能物理的, 那些学基因工程的也是. 过去数十年来生命科学的进步吸引了无数学子投入这个领域, 但这些进步却无法转换成更多的工作机会. 美国生物领域人力严重过剩相信您也知道, 我在数年前在哈佛做博后时, 光一个哈佛医学院及合作教学医院就有超过3000个博后, 每个都跟我一样梦想有一天可以拥有自己的实验室或是到业界领高薪. 实际上大部分的人可能花了五到十年都达不到这个目标, 对年轻人而言这个学科变成可怕的泥沼. 爬不出来的只能越陷越深.

王先生在后面两篇文章提到的发展当然令人振奋,不过科学技术的发展需要时间沉淀过滤, 吹牛夸大的会自爆现形, 遇到showstopper的也会慢慢黯淡, 大家再观察几年吧.

其实美国基础科学的人才太多，并不算误上贼船（偽科学才是），只是供需不平衡；而且生物已经比物理和化学好些了。美国在二战后一直试图独霸基础科研，但是近年来，一方面在经济上力不从心，一方面有些基础科研开始完全脱离工业现实，所以才会有人才过剩的情况。

基因工程并没有脱离现实，所以只要转移到有经济能力的国家去，就业的问题就应该可以解决。你考虑过到大陆做研究吗？

KELLY

2016-03-11

台湾的阳明医学大学也有参与HGP的研究计画优~
就好像前阵子的重力波.台湾也有参一咖
华人的智商真的不是盖的..
可惜台湾现在在搞内耗...
"
台湾人也是这样；原本可以成为新霸主的科技核心，世界的新硅谷，现在没等人家来打，就先把全岛搞烂了。或许蠢气相投才是台湾人崇日的原因。

本来台湾可以选择跟大陆合作互利双赢.北京中央让台湾扶持成为中国的科技岛科技强省.但湾仔自己选择要跟中国对抗的道路.逼得大陆自己扶持高科技业来抢台湾订单.台湾最后绝对搞不过中国国家队.这是台湾自己找死.怨不得人..现在小瑛也开始要搞台湾国家队了..颗颗 "

搞国家队是20年，几千亿美金的大工程。臺湾连个体育馆都盖不起来了，唉。

JAL

2016-11-04

Intel 由 dual-CPU 600 - 800 MHz Pentium-3 跨出 1 GHz barrier 的多核心 Xeon CPU 时才真正在 Linux Supercomputer non-sequential (DNA 无法排序) calculations 展现功力，Celera 在 1998 年併购南加州 Paracel，我在 2001 - 2005 组装 Linux Clusters supercomputers 给 Paracel，他们以 $1,500 per CPU 的年租金收取使用 DNA 资料库的费用，当然强处是他们的 algorithms ，在 non-sequential 运算上比 IBM 快 4 倍以上，也正是 Celera 併购 Paracel 的主因，基因库是被政府强迫公开的，ㄧ套做蛋白质对比的机器由 16 - 64 CPU 串接而成，很赚钱的.