陳潤生院士:中國生物信息學啟蒙、傳承的三十年「大江大河」

..

1990年4月6日這一天,陳潤生記了30多年,當時他49歲。

那是一個普通的日子,離陳潤生從德國紐倫堡大學學成回國,歸隊中國科學院生物物理研究所已有兩年多,期間他拿到「863蛋白質工程」資助,升任研究員。

他一直思考未來的研究方向,讀了不少關於人類基因組計劃(HGP)的報道和討論。

就在這一天,陳潤生看到一篇由James Watson(被譽為「DNA之父」)發表於《Science》 的文章:「The Human Genome Project: Past, Present, and Future」。

在論文開頭,Watson寫到,「 HGP所用花費要比登月計劃少一個數量級,但它對人類生活的影響是更大的……當我們最終能解讀DNA分子中編碼的遺傳信息時,它不僅能幫助我們了解正常人有什麼功能,還能在化學水平上解釋遺傳因子在許多疾病中的作用,如奪走了成千上萬人的生命的癌症、老年痴呆症、精神分裂症。」

這些描述讓陳潤生激動不已——世界對岸有人搞起了人類遺傳密碼。他決定給Watson寫封信,表明對這一卓越科學事件的理解與支持。

陳潤生當時只是一個普通科研人員,毫無知名度,而Watson早在20世紀中期就拿下諾獎,並時任美國國立健康研究院(NIH)首位人類基因組研究中心的主任。

兩人素昧平生、身份懸殊,「我寫信過去並不指望有何反饋或回報,國內根本找不到同行 ,只是想宣洩一下自己的情緒 。」

一個月後,陳潤生收到了來自NIH的郵件,信是Watson委託美國人類基因組計劃辦公廳的主任而寫,並隨信附了兩本材料。其中一本是被陳潤生珍藏多年、封皮起皺的美國人類基因組第一個五年計劃的正式文本。

這份漂洋過海的文本,開啟了陳潤生後半生重要的生信方向,也翻開了中國人類基因組研究的第一頁。

一封漂洋過海的來信

1987年,一位在美國工作的馬來西亞華裔林華安博士(Hwa A. Lim),首創生物信息學(Bioinformatics)一詞。他給出Bioinformatics的定義:生物信息學是一門收集、分析遺傳數據以及分發給研究機構的新學科。

1990年10月,人類基因組計劃在美國正式啟動,生物信息學這一新學科也相伴發展。在美國人類基因組計劃正式文本中,着重提到了基因組信息學:它是一個學科領域,包含着基因組信息的獲取、處理、存儲、分配 、分析和解釋的所有方面。

1991年,我國科學家討論如何參與基因組研究,重擔落到了時年66歲的吳旻身上。

吳旻1961年從蘇聯學成回國,開始創建中國的現代人體細胞遺傳學研究,70年代投身於食管癌的遺傳病因領域,在國內首倡並開展對人類疾病進行基因治療,1986年在「863」資助下開展基因治療研究。

到90年代,吳旻身兼數職,當選中國科學院學部委員(院士),並擔任中國科學院生物學部副主任。時局促動下,吳旻成為中國開啟人類基因組計劃和生物信息學科的牽頭人。

1991年5月,吳旻被任命為國家自然科學基金委員會生命科學部主任,任期至1995年。

吳旻想在任期里把參與HGP的事情辦成。1991年底,他向基金委遞交了中國人類基因組計劃的重大課題建議書,提出並組織我國人類基因組計劃重大項目。

吳旻

這一舉措獲得了中國很多著名科學家的支持,有談家楨(中國現代遺傳學奠基人)、鄒成魯(近代中國生物化學的奠基人之一,時任中國科學院生物學部主任)、強伯勤(主要從事腦發育以及神經系統疾病相關基因的結構與功能研究)、陳竺(從事人類白血病和基因的研究)、羅遼復(80年代初由物理學向研究理論生物物理研究)、張春霆(80年代中期由物理學轉而研究計算生物學和生物信息學)等,不一而足。

鄒成魯、談家楨、強伯勤、陳竺、羅遼復、張春霆

1992年國慶節的第兩天,吳旻游完泳穿衣時腳下一滑,身體向前撲倒,面部着地、滿臉是血,后經醫院照X光發現鼻樑兩處骨折,左眉尖上縫了5針,打了破傷風針。

此時,正是中國人類基因組計劃的重大課題建議書評審的關鍵時刻,4天後又要在基金委進行一次答辯。時任生命科學部副主任的趙宗良心急如焚,卻無法替代上場。

10月6日,答辯如期進行,吳旻頭裹紗布報告了我國人類基因組計劃項目實施的重要性和深遠意義。

這場一波三折的答辯,終於收穫了順利通過的結果。吳旻在他的「我與科學基金」一文中提到:萬幸我沒有感染。

另一邊,陳潤生也在時刻關注國內人類基因組研究的線索。這位42歲(1983年)加入中國共產黨的黨員,迫切想加入學術大集體中。

陳潤生仔細閱讀了美國HGP的正式文本。他認為,信息分析包括序列的組裝與功能元件的標識,是本項目的關鍵。

1992年,陳潤生得知吳旻正組織我國的人類基因組研究項目。但他不認識吳旻,更不知如何把想法告訴吳旻。

陳潤生想了很久,非常怕被拒絕。他了解到,吳旻組織的團隊主要來自醫學研究部門,沒有中科院的單位和人員。

那時候,陳潤生是中科院生物物理所的研究員,直接找吳旻既怕不見,又怕被拒,這樣就沒有迴旋的餘地。

思來想去,陳潤生還是讓自己的研究生徐軍試一試。

徐軍本科在清華大學就讀(現在美國加州洛杉磯工作),不僅聰明而且機敏。對於上門拜訪這件事,陳潤生囑咐, 如能見到吳先生,只談兩點:

「一是以我的名義,說我已經跟Watson聯繫過,並拿到美國HGP正式文本,一直想歸隊。我們做理論生物研究,是基因組研究所必需,也是互補的,希望能讓我們參加,補上序列組裝和數據分析這一環;二是我們知道經費緊張,我們理論研究只要帶着計算機和腦子就可以工作,不分經費。」

沒想到,吳旻很順利地接見了徐軍,告知徐軍回去等消息。這邊吳旻立馬找到強伯勤、陳竺商議,並最終由強伯勤出面歡迎陳潤生團隊的加入。

萬事開頭難,陳潤生感慨:「如果吳先生沒有接見徐軍,我肯定沒有機會在國內最早從事生物信息學研究,也不會成為基因組學和生物信息學專家。」

1993年3月,江蘇無錫的放射原子研究所內,召開了一場重要的「中國人類基因組評審研討會」。

經過充分討論,基金委全委會最終通過了吳旻的建議書。會後吳旻感言,「此項目歷經一年多的多次評審,終於完成了立項。」

吳旻那時已經67歲了,考慮到人類基因組研究是一項跨世紀的長期任務,應該讓年輕的科學家來擔此重任,故推舉當時還年輕的陳竺、強伯勤擔任此項目的負責人,並吸收一批中青年科技骨幹承擔項目的主要任務。

1993年9月28日,由國家自然科學基金委員會生命科學部組織的,以談家楨教授為組長的專家組,在滬論證並通過了強伯勤教授、陳竺研究員申請的《中華民族基因組中若干位點基因結構的研究》重大項目,中國人類基因組計劃(CHGP)正式啟動。

江蘇無錫江蘇放射原子研究所內的中國人類基因組評審研討會,吳旻(前排右一)

儘管與美國啟動HGP的30億美元相比,中國的經費僅有300萬人民幣,但項目組仍然為陳潤生的課題分配了經費。

陳潤生課題組的任務是DNA序列的拼接、組裝和功能元件(主要是編碼基因)識別的方法研究。

為此,他們建立了DNA序列的統計分析、分維分析、神經網絡、複雜性、局域簡併度等多種方法,特別是在國際上首次提出密碼學方法,並將這些方法綜合起來用於基因識別等,提高了預測的成功率。

能把密碼學知識用於DNA序列分析也是機緣巧合。

大約是1991年下半年,陳潤生聽說曾肯成教授、裴定一教授要組織一個密碼學培訓班。他想看看遺傳密碼是否與軍事或商業中使用的密碼有關聯,因此和徐軍一起參加。

徐軍用了一年左右的時間完整地參加了培訓,陳潤生只參加了講座。

雖然了解了皮毛,但他們也學了一些方法,並嘗試把一些公式改成能計算四個字符(CGAT)的 DNA 序列,得到的結果頗佳。於是,密碼學分析技術也用到了基因組分析。

儘管陳潤生團隊發展和應用了多種算法,但是在基因組序列上依然只找到很少的編碼區。通過和國內外同行交流,大家逐漸產生一個共識:人類基因組中用於編碼蛋白質的序列很少。

陳潤生表示,「最初議論大約也就是10%,很快發現10%也估高了。」

如今,業內知道的是人類基因組中編碼蛋白質的基因序列,只佔人類基因組的3%左右。但在上世紀九十年代初,雖然不能精確知道編碼序列所佔的比例,「但只佔一小部分的概念是非常清楚的。」

彼時,國內外學術界很多人將約97%的「非編碼蛋白質的序列「稱為 「junk」DNA ,  但陳潤生有了大膽的想法:這麼大比重的 「junk」 不舒服,也不合邏輯!我堅信 「junk」DNA一定有功能。

1993年底,陳潤生決定把自己課題組的主要精力放到「基因組非編碼序列」的研究上。

儘管在理論物理所、生物物理所和一些學術會議上不斷談到這一研究,但最初幾年的外界響應和課題組進展都不大,原因很簡單,缺乏實驗數據。

與此同時,在吳旻的推動下,由陳竺和強伯勤組織領導的中國人類基因組研究,規模還很小,只是檢測了某些特定的基因位點,而沒有開展全基因組測序。

無論如何,中國的人類基因組研究邁出了重要的第一步。

中國人類基因組計劃的群體接力

中國人類基因組計劃和生物信息學的發展,還離不開另一撥人的努力。他們是此後成為華大基因早期骨幹的楊煥明、于軍、汪建、劉斯奇。他們更為年輕,是國際 HGP 的見證者和參與者。

自1994年後,四人陸續回國,促使CHGP開始與國際HGP接軌。

華大四位創始人,左起:汪建、劉斯奇、于軍、楊煥明

1993年,于軍辭去紐約大學研究助理教授職務,加入「華盛頓大學基因組研究中心」,與人類基因組計劃的策劃和領導者之一的Maynard V.Olson成為同事。

在那裡,于軍參與共建了HGP所需要的關鍵物理圖技術,成為早期參與該計劃的唯一華人科學家,以及四人中離HGP最近的人。

Maynard V.Olson

1993年,于軍最先找到汪建。他們同在華盛頓大學,二人商量后一致認為應當把人類基因組研究推廣到國內。為此,他們還聯繫了在丹麥的楊煥明和在德克薩斯的劉斯奇。

1994年,汪建在四人中第一個回國,創建北京華大吉比愛生物技術有限公司(GBI)。他是行動派,充滿挑戰欲,從1991年主導成立西雅圖華人生物醫學協會,到去往世界最高最深以及南北兩極的事迹中可見一斑。

汪建憑藉丙肝和艾滋病試劑生意賺了第一桶金,這筆錢也成為在中國發展HGP的啟動資金。

楊煥明也於1994年回國,進入中國醫學科學院基礎所。

回到陳潤生這邊。長期紮根中國的陳潤生注意到,中國的基因組研究隊伍正在壯大。在留洋學者回國的趨勢下,他走出國門與國外同行交流技術心得。

從1994年開始的十年裡,陳潤生先後到訪香港中文大學、加州洛杉磯大學、哈佛大學、日本大阪大學蛋白質研究所、台灣理論科學中心等。

這些訪問大多為期三個月,陳潤生解釋到,「三個月能夠做成一件事兒,不然你去了跟別人聊聊天,什麼也沒有落成。」

陸續的訪問開拓了陳潤生的視野,他成為很早就轉向結構模擬的學者,做了大量的電子結構和空間結構的分析。

1996年9月,他在蛋白質空間結構模擬和DNA序列分析領域的工作,被CODATA(是國際科技數據委員會,為國際科學聯合會下屬一級學術機構) 邀請,在日本筑波大學做「小谷正雄紀念演講」 。

他成為這年獲得「小谷正雄 」獎(以日本學名字命名,1960年,小谷正雄創辦日本生物物理學會,1978年當選CODATA會長)的三人之一。

另一方面,國內基因研究走上正軌,我國的生物信息學也有了發展起色。

1996年,清北兩校率先開設生物信息學課程。由於是新學科,師生沒有正式的教材,可借鑒的資料更是捉襟見肘。

為了推動生信學科的普及,陳潤生從1988年任教國科大時就注重教學講義的梳理。八年時間裡,陳潤生的一系列理論推演手稿、查閱的外國技術文本、以及和國內外同行的工作,成為當時最完整詳細的教學講義。

1997年,有兩位重磅級學者加入:一是清華生物信息學所長李衍達院士,二是中科院理論物理所所長郝柏林院士。

陳潤生評價:他們是真正發展了「生信」的人。

此後,清華生命科學學院的孫之榮也參與其中,並成為組織國內生物信息的學術會議的頭號人物。

如今的孫之榮75歲,仍奔走在學科建設中(這段故事將單獨成篇,添加作者吳彤微信icedaguniang提前分享交流)

李衍達、郝柏林、孫之榮

1997年11月,時任中國遺傳學會青年委員會主任的楊煥明,在湖南張家界組織了一次研討會。

這是我國學術界第一次召開與基因組學相關的研討會,楊煥明、汪建、于軍等人提出了中國人類基因組計劃(HGP)的戰略構想,這成為他們共同事業的起點。

1998年,時任中科院遺傳所所長陳受宜和副所長朱立煌,邀請于軍和楊煥明等來遺傳所組建一個所級人類基因組中心。

于軍、劉斯奇隨即這一年回國。

1998年8月12日,在中國科學院遺傳研究所,汪楊於劉四人參與組建的人類基因組中心(現中國科學院北京基因組研究所)在北京成立,楊煥明任主任、汪建任執行主任,于軍、劉斯奇任副主任。

陳受宜、朱立煌

陳潤生參加了這次中心成立大會。

時隔24年,他對當時的場景仍然歷歷在目:「我記得會議是在遺傳所主樓前的院子里開的,側面有一棟小樓,專門騰空為基因組中心使用。房間里只有桌椅,有的桌椅也不全,沒有儀器設備,可以說是一窮二白。」

所有的努力都是為實現中國的基因組研究以及和國際接軌,但必須保證每一分錢都要花在刀刃上。

此時的吳旻雖退居二線,但他的一句話被所有人熟知:「絕不允許有任何人從事盈利或帶商業色彩的科研,要保住基礎科學這塊陣地。」

因此,在大規模的人類基因組測序之前,為了進行各項準備和鍛煉隊伍,1998年,中科院微生物所譚華榮團隊、遺傳發育所楊煥明團隊,以及生物物理所陳潤生的團隊,商定先進行一個微生物全基因組的序列測定。

這就是「破譯騰衝耐熱菌基因組的研究」,被視為人類基因組研究前的「練兵」。

在決定以雲南騰衝熱泉里篩選出的泉生熱胞菌B4為研究對象之前,三支團隊在中關村微生物所辦公樓的二層會議室召開了了關鍵會議。

當時微生物所準備了四、五個候選微生物,大的約有六百萬鹼基,小的約三百萬鹼基。大家分析了各種因素,如能否有新發現、是否幫助解釋生命演化、是否具有知識產權、以及最重要的一點——所需的經費最低。

但智者千慮必有一失,因為沒有考慮這個細菌基因組的AT鹼基含量很高(達到62.4%)GC含量很低(僅為37.6%),最後總的測序量一點也不比一個GC含量高的六百萬鹼基的基因組少。

這就大大增加了楊煥明團隊的測序量,以及拼接、組裝的難度。

另外,在這項工作一開始,還找不到現成的軟件工具。所有的拼接、組裝和基因標識的算法和程序,都是陳潤生和團隊從頭搭建,邊做邊改。

陳潤生的學生宣振宇、李蔚和楊劍成為此次項目的主要參加者,也為他們日後參與國際HGP的工作打下基礎。

1998年9月和10月,國家基因組北方研究中心(主任強伯勤院士,學術委員會名譽主任吳旻院士),以及南方研究中心(主任陳竺院士)相繼成立。

三個研究中心的建立,正式開啟了CHGP的大規模測序,也讓中國躋身國際HGP的進程終於有了眉目。

1999年夏天,楊煥明來到吳旻的實驗室,他決定參加在英國劍橋舉行的國際基因組會議,並將希望在會上爭取國際基因組中1%份額的測序工作。

這是國際HGP協作組最後一次確定各國任務的會議。

楊煥明他們知道,這也許就是最後一次加入的機會了。如果不拚死一博,歷史性機遇有可能就會這樣錯過。

這個想法得到了吳旻的支持,加之Maynard V.Olson等專家的幫助,1999年9月1日,中國科學家應邀出席第五次人類基因組大規模測序戰略研討會。

楊煥明為代表,帶着做了13遍的人類基因組序列的70萬個鹼基對測序結果隻身赴會,表明中國有能力承擔1%的測序任務,並在2000年春末完成。

1999年9月5日,國際人類基因組測序協作組正式宣布,中國成為人類基因組計劃成員,承擔人類3號染色體短臂端粒一側約30厘摩爾(相當於約3000萬個鹼基對)區域的測序和分析任務(也稱「中國卷」),這占人類基因組測序工作的1%。

這一天,中國終於成為繼美、英、日、德、法后第六個參與HGP的國家。

1999年11月10日,1%計劃被列入我國的國家項目,並確定由華大基因牽頭,國家基因組南方中心、北方中心共同參與。

「97%的非編碼序列不是junk」

就在協作組官宣的4天之後,北京華大基因研究中心正式成立,搬址於北京順義區空港開發區B區6號樓。

在這棟廠房裡,每個人都有一個格子的工位(約2米x2米),環境是開放的,不論是誰工位都一樣。

當時的生信團隊大約20人,負責人是王俊(曾任華大基因 CEO,后創辦碳雲智能科技),陳潤生的博士生李蔚臨時成為王俊的助手。

他們的首要工作是集成與發展算法,為大規模基因組的拼接、組裝和基因標識服務。

為了能夠如期完成測序任務,測序儀晝夜不停,人也分成了兩批,白班夜班地倒。沒有實驗台,也沒有值班室,上夜班的同事一個人負責好幾台機器。

算好每台機器的下機時間,定好鬧鐘,拿上幾個實驗室的小圓凳拼起來,躺在上面蓋上衣服睡一會,鬧鐘響了就起來操作,一通折騰后睡意全無。

在這支年輕人居多的團隊里,陳潤生也是其中一員。這時候的陳潤生身兼數職,本職還是中科院生物物理研究所的研究員,同時參與到HGP項目中,成了華大基因團隊的一員。

此外,自從1999年起,他還被時任中科院計算所所長的李國傑聘為兼職博導,幫忙建立一個計算生物學團隊。

雖然分身乏術,但陳潤生考慮到HGP的緊迫性,大部分時間還是給了它,「5天里有4天都在空港。」

那時候的華大基因,缺場地、缺資金、缺設備、缺人員。困難重重,壓力巨大,唯獨不缺的是決心。

他們在測序儀頂上擺放着三根玉米棒,下面貼着用白紙打印的一行紅字:窮棒子精神永放光芒!

實驗室一角

2000年5月,我國科學家終於完成了「中國卷」基因組序列草圖的測定工作,是六國里參與時間最晚,完成時間最早的國家。

2000年6月26日,時任美國總統的克林頓宣布,「人類有史以來製作的最重要、最驚人的圖譜——人類基因組草圖完成。」

與此同時,空港工業區B區6號樓里也舉行着一個小型的慶祝儀式。沒有鮮花,沒有喝彩的人群,甚至沒有留下一張合影。這些參與了中國卷的年輕人們,推算着新聞發佈會的時間,吃了點水果就散了。

在此之後,陳潤生開啟了下一場研究。

從90年代初到新世紀初,參加基因組分析工作越多,陳潤生越堅信,非編碼序列具有生物學功能,自己研究進展不大的原因是實驗數據太少。

那個年代,國際上從事非編碼研究的還不多,要了解非編碼的功能等於無米之炊。陳潤生有了一個想法,1999年末看到國內人類基因組測序實驗的蓬勃開展,看到華大基因從無到有實現大規模測序的過程。

這讓他萌生了建立濕實驗室,從而獲取非編碼研究數據的想法。

但是搞理論的做分子水平的生物學實驗談何容易,人才、經費、設備都是問題。

經費最好解決,自德國留學回來后,陳潤生就被吸納到科技部「863蛋白質工程」中,還有後來的CHGP項目,分給他的經費大部分沒花掉,十餘年內攢了60萬元。

有了這筆經費,陳潤生的工作就更容易啟動。

他從生物物理所請來了實驗做的比較好的鄧巍,以非編碼序列高達70%的多細胞模式動物線蟲作為切入點,並對轉錄本的長度範圍限定在50-500個鹼基的序列進行研究。

實際上,這種實驗方法在當時並沒有先例可循。陳潤生團隊從頭開始設計實驗流程、摸索實驗條件和參數。為了節省使用經費,陳潤生利用在中科院計算所任職的機會,借用那裡的大型計算機進行大規模測序分析。

這一待就是四年,2004年,時任中科院生物物理所所長的饒子和不止一次打趣陳潤生,「你快歸隊,你快回來,你幹嘛老在外面漂。」

饒子和

正是這些「漂泊」的經歷,陳潤生分別在計算所和生物物理所建立了兩支團隊(目前共三十餘人),終於在非編碼領域走出了一條路。

實驗方面,鄧巍把實驗相關的各種探索記錄形成了四百多個文件;理論方面,陳潤生團隊建立了一套自己的非編碼基因預測方法。

獲益於這種廣泛的交叉研究,他們以線蟲為對象發現了161個新的非編碼基因,由此確定了兩個非編碼基因家族、發現了三個特異的非編碼基因啟動子。

更重要的結果是,他們證實,非編碼基因與編碼基因一樣,各自有一套獨立的轉錄調控系統。

屆時,陳潤生團隊所有發現的非編碼基因都被收錄於GenBank(最廣為人知的核酸和蛋白質序列數據庫),並於2006年1月6日將論文發表在影響因子11+的《Genome Research》。

三天後,美國科協(AAAS)所屬的科學評述雜誌《EurekAlert》 也發表了長文介紹了這一研究成果,不僅肯定了上述發現,還指出實驗技術的效率比國際上提高了10倍。

接着,憑藉線蟲研究中建立的整套非編碼基因的識別方法,陳潤生團隊獨立承擔了人類3號染色體完成圖中非編碼基因的識別工作,發現了各類型非編碼基因近900個。

這些成果都包括在2006年發表於《Nature》的三號染色體完成圖的論文中。

每一個成果都來之不易,願意從事非編碼研究的人還是太少。

自2000年起,陳潤生團隊就開始搜集國際上被實驗證實的NcRNA基因及非編碼轉錄本,發展了相應的軟件及檢索工具,建成了NcRNA數據庫——NONCODE。

這是當前國際上最全的NcRNA數據庫,已成為很多研究的基本數據源,該工作的學術貢獻是提出了非編碼基因的分類系統。

文章剛一發表,2005年1月21日《Science》就介紹了該工作。此後,陳潤生團隊又構建了非編碼RNA和蛋白等相互作用數據庫——NPInter,這些均為國際非編碼基因研究提供了數據基礎。

由於在實驗和理論上的一些成果,陳潤生團隊的非編碼研究在國際和國內有了一些影響,以後的研究也變得更容易開展。

現如今,陳潤生的研究仍然是非編碼,但更側重於「經世致用」,比如核酸疫苗與核酸葯。而他牽頭研發的長鏈非編碼核酸藥物,則瞄準腫瘤、烈性病毒與傳染病、衰老三個方向。

陳潤生在多次報告和論文中明確指出:人的遺傳密碼代表着人體的全部信息,現在只能用3%,對疾病診斷治療能準確嗎?實際上,遺傳密碼的破譯給我們帶來了數不清的新靶點。如果能夠破譯剩下的97%的非編碼,這是根本上的原始創新。

在與雷峰網的交談中,陳潤生中途接了一個電話。他說到,「下午北京開發區要聊建核酸藥物和疫苗基地的事,基礎研究到一定階段一定是轉化,我們現在就是忙着轉化的事情。」

隨着國家「四個面向」,陳潤生過去做了30年的非編碼研究,慢慢因為學科的重要性開始服務社會,服務經濟發展。

回憶起從1993年決定轉向非編碼領域,陳潤生感慨起步之難:國家基金委的基金申請不到,評審斷言工作沒意義、沒根據;長期獲得資助的「863蛋白質工程」項目也不讓參加。

「直到90年代後期,我們在非編碼領域拿到了973項目,近幾年作為首席與同行們拿到了基金委的『國家重大研究計劃』項目,說明非編碼這條路走對了。」

生信長河中的群英圖

90年代,中國的生物信息學發展幾乎與國際同步,根基是中國有一支理論生物物理的學術隊伍。

陳潤生在中國開設生物信息學課程、在HGP上的大放異彩,都與中國在理論研究上、與前輩們的薪火相傳息息相關。

1959年9月,陳潤生考入中國科學技術大學(下稱「中科大」)生物物理系,成為當年考入中科大的1600名學生之一。

這群來自中國天南海北的學生,不僅是全國各省的佼佼者,還有個共同的名字,「中科大第一屆全國統考生」。

因為就在前一年,中科大剛剛成立,卻錯過招生時間,學生只好從其他高校「借調」而來。因此,陳潤生這屆學生格外受重視,據說錄取線也比清北高一點。

中科大首任校長是郭沫若,提議創辦一所科技型大學,並確定學校名稱、成立大學籌備委員會、起草校歌歌詞,種種決策皆他所為。

在成立之初,中科大就承載了我國政治界和科學界的共同構想。嚴濟慈、華羅庚、錢學森、貝時璋、錢臨照、趙忠堯、郭永懷、趙九章、王元、龔升等一批中科院學者出動,組成了中科大的教學陣容。

當選為中央研究院第一屆院士,被選聘為中國科學院學部委員(院士)的貝時璋,就是此後推動中國生物物理髮展的核心人物。

貝時璋先生

1958年,學校成立伊始,貝時璋做了兩件大事:創建中國科技大學生物物理系、創辦中國科學院生物物理研究所(以下簡稱「生物物理所」)。

當時生物物理學還是一門飽受爭議的學科,有些知名學者甚至斷言:「只有生理學,沒有生物物理學!」

貝時璋頂着反對聲音創辦了生物物理這門交叉學科,並單獨劃分了一支理論生物學研究小組。組長是鄭竺英,成員有:郁賢章,王湘生,陳傳涓,汪雲九。

貝時璋對該組成員的業務方向都有具體指導,如,他讓郁賢章多注意生物大分子的結構和功能,讓汪雲久側重生物系統中的控制和信息。

理論組同志合影(第一排左起:夏發生、杜莆、顧凡及。第二排左起:孫紋琦、朱潔萍、鄒嘉玉、鄭竺英、石淑珍。第三排左起:王湘生、汪雲九、萬夫遠、張鑒銘), 攝於1961 年

同時,為了培養出真正的學科交叉人才,貝時璋也毫不含糊。

他安排生物物理系學生們,物理課和物理系一起上,數學課和數學系一起上,化學課和化學系一起上,考試也和其他系一同排名,絕不打半點折扣。

獨特的教學方式,讓陳潤生一直受着很多老師的栽培。陳潤生講到,「我們通常是今天跟錢先生、彭先生討論宇宙學、粒子物理、格林函數,明天跟貝先生、沈淑敏討論生物學。」

大學五年的所有考試中,陳潤生無論按照什麼系排名都穩居前三名。1964年5月,貝時璋推薦表現優異的學生到中國科學院生物物理研究所,陳潤生便是其中一員。

得益於過去所培養的數理基本功,陳潤生在做理論生物物理時也更容易上手。

然而時局使然,很多學術研究組不復存在。

至1978年3月,中共中央召開了全國科學大會,鄧小平指出四個現代化的關鍵是科學技術的現代化,並着重闡述了科學技術是生產力這個馬克思主義觀點,科學研究終於恢復。

陳潤生的理論研究並沒有因此擱淺,做了大量的大分子結構模擬。1978年底,為了進一步了解結構模擬的理論基礎,陳潤生被送去吉林大學的理論化學進修班學習一年。

而教授這門課的不是別人,正是被視為中國現代理論化學的開拓者和奠基人的唐敖慶。

這位和陳潤生同是江浙老鄉的教授,在50年代被調任東北高校,也在那裡開啟了他的後半輩子。而同樣因為調任原因安家東北的徐鷹(排版時插入鏈接)的父親徐如人,就是唐敖慶的學生。

陳潤生對唐敖慶記憶尤深,其實是被他的學術研究所震撼。

「唐先生眼睛不好,他戴那眼鏡是近視3000度,幾乎是貼在黑板上板書。他上課從來都是帶着一盒粉筆,一個粉筆擦,其他什麼都沒有,從上午八點到十二點連續推公式,寫完一塊黑板再擦掉繼續。這本事你想,基本功(有多厚)。」

唐敖慶先生

受唐敖慶啟發,陳潤生此後在理論研究上對自己要求更加嚴格。一次他應邀在華中科技大學講授量子化學,全程推導公式,從頭到尾一字不改。

在陳潤生看來,這是錘鍊自己的一種方式,「你如果不真正理解,不能把理論的發展記得一清二楚,根本不可能講這個課,也講不出來,就卡在那兒下不去了。」

與此同時,1978年後,貝時璋採取了很多措施推動理論生物學研究室的重新組建與發展。

首先,貝時璋分別邀請彭桓武、錢學森等其他領域的著名科學家,給所內研究人員講解學科發展與學科交叉,並實質性地建立了生物物理學與各專家所屬學科的聯繫。

接着是組建理論生物學研究室。

大約1978年至1979年之間,貝時璋邀請上海生物化學研究所(下稱「上海生化所」)的徐京華研究員,作為上海生化所與北京生物物理所聯合共建的——理論生物學研究室(下稱「聯合室」)的主任。

屆時,陳潤生、丁達夫、王寶翰,都是其中主要成員。

1980年聯合室成立后,在彭桓武的支持下,徐京華帶領其成員頻繁地參加剛建立不久的理論物理所的學術活動,同時也在理論物理所組織了多次理論生物學的相關討論,如:混沌、熵、耗散結構與生物體的結構、生物大分子的手性和自組織;DNA 分子中遺傳信息的表示與特徵等。

可以說,七八十年代之交的理論生物學研究,是在貝時璋、彭桓武的組織與指導下,在兩研究所的一批研究人員多次討論中,逐漸形成並邁上了正軌。

然而,國內真正探索DNA序列的物理數學特徵,要從1982年開始。

最早把主要精力放到DNA序列上的是內蒙古大學羅遼復團隊。

1982年,羅遼復帶領團隊從理論物理轉向理論生物學研究,整個八十年代,這支團隊發表了很多關於DNA序列和遺傳密碼方面的研究成果,如:突變率的S_4對稱破缺和終止密碼子;核酸起始序列、終止序列和插入序列的統計分析;核酸序列的鹼基分佈、同源性和Markov性;核酸分子的信息參數和分子進化;遺傳密碼的退簡併規則等,甚至還討論了為什麼遺傳密碼由四個鹼基組成。

很重要的是,羅遼復團隊研究和發展了DNA序列分析的理論方法,如:分維方法;特別是信息論的方法,比如提出了最大信息原理、基因序列的平均互信息方法等。

八十年代中期以後,從事DNA理論研究的還有天津大學的張春霆。

1984年5月,張春霆調入天津大學理學院物理系工作,此後他由物理學轉而研究計算生物學和生物信息學,並在1987年發表了首篇理論生物物理論文。

張春霆在理論生物學研究領域有兩方面的主要貢獻:

一是八十年代末提出,用雙 Sine—Gordon 偏微分方程組來模擬 DNA 分子在轉錄和複製過程中鹼基運動的動力學機制;

二是九十年代初,提出了 DNA 序列的 Z 曲線理論,開拓了一條用幾何學方法分析 DNA 序列的新途徑。目前,Z 曲線理論在基因組學和生物信息學中已獲得了廣泛的應用。

第三支隊伍就是陳潤生團隊。

實際上陳潤生做DNA理論研究也是在上世紀八十年代。

1982年,在一個理論生物學研討會上,羅遼復受邀分享關於DNA序列分析的報告,陳潤生就和他討論了核酸序列的分析問題。

1987年底,陳潤生為期兩年的德國訪學結束,此時國際上已經有了破譯人類遺傳密碼(即「DNA」)的趨勢,陳潤生做出一個重要判斷:遺傳密碼將是未來很重要的一個方向。

受「863」項目資助,陳潤生很快轉向基因組序列研究,並在90年代初將這部分工作延續到CHGP項目中。

總的來說,八十年代到九十年代初,我國在DNA序列分析的理論方面已有建樹,特別典型的是:羅遼復團隊提出了DNA序列分析的信息學理論、張春霆團隊提出了DNA序列分析的幾何學理論、陳潤生團隊提出了DNA序列分析的密碼學理論。

而如果以更長遠的視角來看,從五十年代以來,貝時璋、彭桓武、徐京華、江壽平、丁達夫、王寶翰……這些前輩,無一不為九十年代中國參與到人類基因組事業中打下了重要基礎。

耄耋之齡,不退不爭

「沮喪我沒有,人能成事,一個是判斷,一個是堅持。」

談起幾十年來的抉擇,陳潤生聲音清晰有力,「我的大多數抉擇沒有跟着別人走,被很多人懷疑和反對,這就需要自己的堅持。堅持在於你自己的判斷,這兩個是互補的:判斷得不夠堅決,很多人吃虧在這。他足夠聰明,也想到了。但是不堅持,由於各種情況放棄,就成不了。」

陳潤生現在仍習慣365天到辦公室打卡。有一年大年初一,陳潤生照常到了中科院生物物理所,在這天碰到了唯一的另一人,王志珍。

陳潤生回憶那天的場景說到,「遠遠看着有個人護送着一個人,走近一看竟是王志珍。我說你也來了,她說你也來了。」

王志珍擺擺手讓同事不要跟着。她和陳潤生是同班同學,兩人當年在中科大里都是最頂尖的學生,五年裡誰都沒出過前三名。

此後王志珍在蛋白質摺疊,摺疊酶和分子伴侶胰島素A、B鏈相互作用及重組等研究中做出重要貢獻,與陳潤生先後成為院士。

那天,兩人聊到老師、聊到學生,最後陳潤生聊到自己,笑呵呵地告別老同學。

他說,「還有好多事等着我去做。」

雷峰網


想在手機閱讀更多教學錦囊資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems