幾個月前中國的學術界傳來一個好消息,河北科技大學副教授韓春雨發明了一種新的基因編輯的方法,比現在主流的 CRISPR Cas 基因編輯技術要好很多。
這可稱得上是爆炸性新聞。如果人類徹底掌握了基因編輯技術,並且用於臨床,那麼包括癌症在內的很多疾病都能夠得到根治。因此,如果韓春雨的成果是真的,即便不能很快得諾貝爾獎,至少獲得突破獎還是有把握的。
樹大就要招風,各國科學家蜂擁而上,試圖重複韓春雨的實驗。但是到目前為止,也不知道是韓春雨論文寫得不清楚,還是驗證者實驗條件沒搞對,總之尚未有人能夠重複韓春雨的結果,於是就有人質疑韓教授造假了。
造假沒造假,這個自有學術界的人會搞清楚。我想透過這個事件談一談學術的規矩,尤其是科學界的規矩。
科學反對永遠正確
很多人把科學和正確劃等號,其實科學最重要的是方法,而不是結論,科學恰恰反對永遠正確。
科學研究是一個非常悲催的職業:當你提出一種新方法,或者得到一個前人所不知的結論時,你其實就是在向全世界學術界在聲明:「現在你們可以來證實或者證偽我的結論,可以否定我,指出我的不足之處。」
如果一個科學家不是抱著這種心態搞研究,而是靠聲音的大小和粉絲的多少來維護自己的正確性,那麼他就不是真正意義上的科學家,最多算是一個壓制同行的學霸。
證實一個科學結論最簡單的方法,就是讓同行來重複自己的實驗,如果別人在同樣條件下能夠得到同樣的結果,那麼這個結論算是初步被證實了。如果一個科學家做出一個實驗結果,誰都不能重複,甚至就連他自己第二次可以也得不到同樣的結果,那麼,學術界只能認定這個發明或發現是無效的,哪怕結論真的是正確的。
事實上,重複一個實驗有時不是一件非常容易的事情,因為當今科學研究的實驗條件非常複雜,有好多參數,甚至實驗者自己也未必把這些參數全記錄下來的,因此下一次實驗時忽視了哪個參數,可能結果就重複不出來了。
這種事情經常發生,這倒不是實驗者故意造假。但是,如果出現這種情況,對不起,大家只能不認可你的結論,這就是學術的規矩。
作為科學家,有責任方便同行證實自己的科研成果,而最基本的要求是在論文中寫清楚實驗是怎麼做的。如果無法在篇幅有限的論文中寫清楚實驗條件的細節,那麼這個科學家有義務為同行答疑,在底下告訴那些試圖重複他實驗結果的科學家很多實驗的細節。很多研究小組,甚至把他們做實驗的源程序免費提供給同行。
如果哪一個科學家說,我就是不告訴你實驗是怎麼做的,而我這個結果就是正確,你做不出來是你水平不夠,那麼整個學術圈子只好說,「對不起,我們不帶你玩了。」
有些實驗,因為成本非常高,全世界也沒有第二套實驗設備。
比如,發現希格斯波色子的歐洲核子研究中心(CERN)加速器,這種實驗需要自己重複進行,而且採用不同方法交叉驗證,以免觀測到的結果來自於噪音。事實上,CERN 是驗證了很長時間才公布結果的。
再比如,今年驗證引力波的 LIGO,是在相距 3000 公里處建設了兩套相同的系統,以確定接收到的是來自宇宙的引力波信號,而不是噪音。
對於這樣的實驗,所有的細節也是要公開的,以便其他科學家查驗和質疑。
有人可能會說,如果這樣,不就沒有了秘密可言了嗎?能否以保護商業機密、國家利益為理由,不提供實驗的細節呢。
對不起,這不是學術界的規矩。科學家們常常不得不在名和利中間選擇,不可能全佔了。
前面我們提到的基因編輯技術,要用到一種更基本的技術——內切酶,這項技術的主要發明人是約翰∙霍普金斯醫學院的那森斯、史密斯和伯克利的亞伯。
如果他們二人不發表論文,去申請專利,他們會進入世界富豪排行榜,因為今天很多生物工程的技術,包括轉基因作物,包括人工合成激素和製造抗癌藥,都離不開內切酶。
你一旦選擇了發表論文爭取得諾貝爾獎,就可能和經濟利益說再見了。
這也是今天很多公司不發表很多論文,或者先申請專利,過了一段時間再發表論文的原因。(當然,過了一段時間常常成果就過時,無法發表了。)
學術論文必須是八股文
國內一些學者寫論文,上來就講自己研究的重要性,上升到非常高的高度,生怕立意不夠高被拒稿。這就不符合學術規範。
今天的學術研究,99% 是 N+1 的工作。不管你怎麼吹它的重要性,還是 N+1。這也就是說你發現前人工作可以有改進之處,你把這個問題解決了,這本身足夠有意義。
既然是 N+1 的工作,任何人寫論文時第一件事情就是要提一下 N 的工作,也就是同行們以前做過的工作,當然,也要指出前人哪些工作沒有完成,這既說明你研究的必要性,也是對前人和同行的認可,這部分文字是不能省略的。
為了證明 N+1 比原來的 N 要好,你還要重複前面 N 個人的工作。導師指導博士生做研究,通常是從重複前人的實驗開始的,然後才開始自己的改進。將來寫成論文時,實驗結果的第一部分就是重複前人最成功的實驗(稱為「基準」)。然後,才是自己各種實驗結果的介紹,以及和前人的比較。
可比性對科學研究非常重要。
為了大家有一個可以公平比較的平台,各個學科領域都有很多共享的數據、材料和工具,供同行們使用。大家做研究都要用這些共同的東西來驗證、比較,這樣才是橘子和橘子的比較,不是拿蘋果和橘子相比。
在我所研究的自然語言處理領域,有一位科學家叫馬庫斯,他自己其實沒有太多的學術成就,但是他倡導和建立了一整套供全世界研究人員使用的資料庫(LDC),因此大家都尊敬他。
2015 年,Google 拿出 1 億美元,給了斯坦福和杜克兩所大學的醫學院,用 5 年時間採樣 5000 人的全部生理和醫療數據,作為全世界大數據醫療領域研究的共同基礎,這個項目被稱為 Baseline(基準)。這樣當一個研究小組發表實驗結果,其它研究單位很容易驗證實驗結果是否可以重複。
如果一個科學家通過實驗證實了他站在巨人的肩上往前走了一步,恭喜你,同行們很可能會認可你的發明發現。但是,既然科學是一個過程,那麼它就要繼續走下去,既然科學必須能夠被證偽,那麼就會留給後人來否定自己的空間。因此好的論文最後都會從學術的角度,講一下自己未完成的工作,這些工作或許是自己正在進行的,或許是留給同行的。到此,一篇論文才算完整。
所以,一篇規範的論文必須包括幾個部分:介紹同行的工作,介紹自己的工作,比較自己和同行的工作,還有哪些未完成的工作。
從這個寫作過程可以看出,它似乎就是一篇中規中矩的八股文,是的,學術界對規矩是非常看重的。
學術圈子很重要
除了看重研究成果的可重複性和可比性,看重寫論文的格式之外,學術界還有一條規矩,就是大家都要維護自己的學術圈子。
雖然歷史上總是有一些卓爾不群的科學家,比如證明了龐加萊猜想的佩雷爾曼,他們傲視同行,但是因為他們水平實在太高,整個學術界只好在他們面前認慫。但是,大部分時候並非如此,一個科學家的成功離不開學術圈子。既然科學家的工作是做 N+1 的事情,那麼學術圈子就代表 N 。
既然科學結論常常是有條件的,只是相對正確的,既然科學家很難做出一個後人難以超越的大發現,那麼科學家的榮譽常常不是自於自己的結論多麼正確,而來自同行的認可。
另一方面,在很多領域,一個發明發現,不是那麼容易就被客觀驗證的,它是否被認可,在很大程度上取決於整個學術圈子對它的態度。比如對於膽固醇作用的認識,科學家們至今沒有一個定論。那麼一個觀點是否被認可,論文能否被發表,在很大程度上取決於主流學術界的態度。
一個科學家進入學術圈子,很重要的是和圈子裡的人互動,這個互動不僅僅是個人之間的直接交流,而且表現在寫論文時相互引用。哪怕是在論文中駁斥別人的觀點,都比忽視前人的工作要好得多。
回到韓春雨的發明上來,這件事從一開始就受到國外很多學者的質疑,很重要的原因是他長期游離於圈子之外,大家不知道從哪裡冒出來這樣一個人,給了大家一個完全不同的結論。我們可以試想一下,如果是一位同行熟知的物理學家給出同樣的結論,大家的反應或許沒有那麼劇烈。
對於破壞學術圈規矩的人,圈子對他的懲罰也是很厲害的。歷史上一樁著名的公案就是關於鏈黴素發明權之爭,這個故事的簡單版本是這樣的:
導師瓦克斯曼發明了鏈黴素,但是沒法提煉出副作用小的藥品,學生沙茨找到了合適的副作用小的菌種,但是瓦格斯曼獨佔了研究成果的利益(專利收入),沙茨後來將導師告上了法庭,並且拿到了自己應得的利益,但是從此他便無法在美國學術圈子裡混了,因為他破壞了學術界當時的規矩。
後來瓦克斯曼獨享了諾貝爾獎,世界也就將沙茨忘掉了。直到後來英國科學家威恩萊特在寫抗生素歷史一書時,找到了當時很多實驗記錄,才讓世界了解了沙茨的工作。這時瓦克斯曼已經去世多年,沙茨也已經退休了。
單純看事實,瓦克斯曼的做法無疑有問題,但是沙茨破壞了當時學術圈的規矩,免不了要受到了來自學術圈的懲罰。
規矩是否合理是一回事,但是一旦成為學術界的規矩,每一個圈子裡的人就不得不遵守。這些規矩並不是要和誰為難,而是為了讓整個學術圈子能夠形成一種合力,圍繞一個課題共同的研究探討。維護這些規矩,才會有 N,也才會有 N+1。
結束語
自近代以來,科學能夠不斷地進步,人們對世界的認識能夠不斷地提高,在很大程度上是因為科學家們堅持科學的方法,而不是死守科學的結論。而長期以來形成的不成文的學術規矩則是為了確保科學家們能夠堅持科學的方法。
羅輯思維 2016-08-04/吳軍
科學的規矩其實和「英美法系」的規矩有點像——
1. 每一個法官都是在以前法官的判例基礎上繼續「造法」。
2. 法官不是在「立法」,而是發現那些早已存在的「公正」原則。正如法律界名言所說的,「一切法律都是自然法」。
3. 律師、法官、檢察官,共同構成一個「法律共同體」。這是一個共享價值觀、方法論的邊界模糊的人際圈子。他們是法律公正的堅實基礎。
科學是發現真理的。
法律是維護公正的。
二者都不可能一步到位,都只能在不斷修正中無限逼近。
好的科學和好的法律,規矩大體類似。