友快網

導航選單

僅僅因為方法Too Simple就被拒稿,合理嗎?

作者:小戲、

小軼

如果你看到自己實驗行之有效的論文被退稿,而收到的退稿理由僅僅是“方法太簡單”,你會怎麼想?

這兩天在推特上,佐治亞理工的 Riedl 教授吐槽了自己收到的 AAAI phase 1 退稿理由居然是因為“這方法似乎太簡單”,引起了廣泛的討論。

Riedl 教授列出了自己收到的兩點退稿理由:一是方法太過簡單,二是不滿於他只採用了人工評分,而沒有使用 BLEU score(儘管他們做的任務是故事生成……)。

面對這兩個退稿理由, Riedl 教授只能表示“I can‘t even。”

這段被拒稿的經歷似乎使得大家相當共情,評論裡有分享相似經歷的:

也有歸謬出一個諷刺的因果關係的——因為我可以理解你的論文,所以我拒絕了你的投稿。

有對人性展開思考的——人們只會喜歡他們所不能理解的東西。

也有使用了樸素的辯證法得出:投稿的最高境界就是讓一個評審覺得太簡單讓另一個評審覺得太難。

有對簡單下定義的,強調簡單的強大力量:

或者搬出了愛因斯坦:“凡事要儘可能簡單,但不能過於簡單”。

還有直接對 BLEU 開炮的,認為這是計算機科學最具破壞力的發明之一。

甚至乎,還有寫成了一個故事。換成暴漫形式的話,大概是這樣:

看了這麼多,倒是這個評論一針見血:THIS。 Simplicity is a feature, not a bug。

事實上對“一篇論文是否應該由於方法簡單而被拒稿”這一問題做出價值判斷是相當容易的。更加有趣的是 Riedl 教授的兩點引申:一點是他提到的“如無必要,勿增實體”奧卡姆剃刀原理,另一點則是他指出的學術界對“簡單方法”的偏見。

奧卡姆剃刀的誤用

在推文中, Riedl 教授使用了奧卡姆剃刀原理為自己辯護,即“因為‘如無必要,勿增實體’,那麼如果我的解決方法簡單有效,為什麼還要求我使用一個複雜模型呢?”。然而,奧卡姆剃刀原理作為一個經驗性的法則,它並不是“保真”的。換言之,奧卡姆剃刀原理它並不一定在所有情況下都正確。事實上,我們會發現用於論證這個法則的常常是一些安排妥當的例子,譬如在管理學的課堂上經常講述這樣一個故事:

這種故事與其說是歸納法的經驗材料,不如說是“帶點教育意義”的心靈雞湯。而在評論區內,也有這樣一則評論,對 Riedl 教授的辯護提出了質疑。

科學研究與工程實踐對於“好方法”的要求有所不同。Riedl 教授所謂的“簡單有效即可”或許足以滿足工程實踐的要求,卻未必在科研界存在深遠意義,並值得發表。顯然,科學所要求的普遍性與有效性天然使得它有一種更為複雜的一套評價體系,遠遠不止“有效即可”這麼簡單。

但也正如下方另一位網友所指出的那樣:科學與工程是交織在一起的。我們無法想象科學與工程之間那條涇渭分明的分界線——一個不斷從理論出發,演繹與解釋;而另一個則不斷從實驗出發,歸納與總結。因而這種二分式的質疑也不足以完全瓦解簡單性法則的合理性。

讓我們回到奧卡姆剃刀原理本身。從某種意義上講,對類似奧卡姆剃刀這樣的簡單性法則的探討實際上就是波普爾關於科學證偽主義的論證起點。

以羅素為代表的邏輯實證主義哲學家將所有命題還原為原子命題,而主張原子命題的真假可以由經驗證實——比如“所有天鵝都是白色的”可以被分解為:

而這裡“這是一隻天鵝”與“這是白色的”二者是可以被經驗直接證實的。由此,在邏輯實證主義眼中,如果一個命題的所有原子命題都被經驗證實,那麼從邏輯律上講這一命題就是一個真命題。如果我看到的所有的天鵝都是白的,那麼所有的天鵝都是白天鵝這一命題就為真。

這種觀點可以說為長期以來的科學實證主義提供了理論基礎。它表明:評價一個理論的好壞源自於它是否可以很好的解釋經驗現象。譬如海王星的發現證明了牛頓的萬有引力定律;引數過多的模型容易過擬合,因而我們傾向選擇更簡單的模型,也部分說明了奧卡姆剃刀原理。

然而波普爾卻從由所有原子命題為真到原命題為真這個嚴重依賴歸納法的飛躍入手,指出任何歸納命題都不能得出普遍有效的全稱陳述。即哪怕我看到的所有天鵝都是白的也無法否認出現一隻黑天鵝的可能性。

這樣一種質疑使得歸納法喪失了之前長久以來先驗的普遍有效性,也由此從“理論的被經驗證實”便無法再天然的匯出理論的科學性。比如可以精準預測太陽東昇西落的地平說並無法支撐自己為一個科學的理論。因而波普爾略顯簡單粗暴的使用可證偽性這個概念為科學與非科學畫界,即是說一個理論可以被稱為科學理論,必要給予被經驗驗證的可能,而類似“上帝既存在又不存在”便是典型的非科學理論。

因而,在波普爾的觀點下,“如無必要,勿增實體”這句話實際上是非科學的,因為作為前提的“必要”並無法被清晰定義出“何為必要”。這種不清晰得界定意味著,哪怕我炫技式的縫合各種新鮮方法於一體,我也可以從某種程度上證明這個究極縫合怪確有存在的必要。

而從這個角度來看,簡單性法則實際上就變成了一種“科學試錯法”。與其說它可以為“因為我的模型簡單所以我的模型就很好”提供理論支援,不如說它只是在指導我們“在我們透過實驗探索我們所提出的假說時,應該儘可能選擇假設更少的那個”。由此,當審稿人的話語變為“如果你沒有嘗試過更復雜的模型進行對比,你為何可以說你的簡單模型已經很好了呢?”時,奧卡姆剃刀原理便無法為 Riedl 教授提供更多的辯護。

對“簡單”的偏見

波普爾對歸納法的批判的意義還不止於此。從某種程度上講波普爾解構了近代以來科學研究的絕對真理屬性。即波普爾提出,如果演繹法是答案隱藏在大前提下的同義反復,而歸納法又喪失了普遍有效性的基礎,那麼人類的一切知識如何與所謂真理掛鉤呢?在這種質疑下,科學研究就不再是建立在真理基礎上絕對理性的演繹。其形成之初便是有諸如信念、靈感等的非理性因素參與其中的。

這就又直接牽扯到第二個問題,即學術界對“簡單方法”的偏見上。在此次討論中,人們不無意有所指的暗示著這樣一個事實:當下學術界似乎並不將複雜視為解決問題可選方法之中的一種,而是將其視為一種提高入行門檻的手段。

在社會科學中,正規化這個概念幾乎已經成為了一個預設的共識。從詞源上講, “Paradigm” 的原義是指詞形變化表。而哲學家托馬斯·庫恩在《科學革命的結構》一書中對其進行改造,用以描述一個科學共同體所共有的、相互間彼此理解與預設的信念、理論、思維方式、實驗技巧等等。

這並不是一個清晰的定義。庫恩從未對這一他所提出的極其著名的概念下過精確地定義,而往往是在不同的語境下賦予其不同的指謂。從狹義上講,它可以用來指某種固定的實驗方法、操作模式;從廣義上理解,它甚至可以用來指某一領域的科學家們對世界整體的信念。

▲托馬斯·庫恩

試問一下,當我們遇到一個文字分類的任務時,為什麼我們會第一時間想到用諸如 TextCNN、BERT 等等的工具?為什麼我們在操作時會先考慮如何進行分詞、如何進行特徵表徵?在正規化理論下,這顯然是因為我們共處於自然語言處理這樣一個科學共同體內,我們共享著一整套信念、理論與術語。當我們說起 Transformer 時大家都可以理解是一個有用的模型而非指的是一個變壓器或變形金剛。

僅僅因為方法Too Simple就被拒稿,合理嗎?

然而,正規化的弊端在於:當科學共同體的搭建源於共同的信念,而非所謂“理性的必然”時,對“簡單性”的偏見就從一個個體的非理性行為上升到了整體的結構性的問題。

現在有多少人還相信 AI 這門學科的最高理想?或是說相信 AI 這門學科目前的正規化可以實現或達到 1956 年在達特茅斯會議上那批人工智慧的先行者們展望的真正的通用人工智慧?事實上當這種信念被越來越多地否認或遮蔽時,論文的發表似乎便只有方法論的意義。縱然 2 完全可以用 1+1 來代替,但使用 10000-9998 似乎可以更為精緻的水出一篇論文。在問題本身沒有被革新的情況下,方法論的更高更快更強才有更加顯著的意義。

僅僅因為方法Too Simple就被拒稿,合理嗎?

或許我們可以看到,現在 AI 這門學科或多或少地在規避著一些問題。當面對來自 AI 哲學家的批評時,如“如果神經網路本質上是一種統計學模型,那麼現在的 AI 究竟是一門有關人工智慧的學科還是一種變相的應用統計學?”,“如果神經網路在行為上具有有限的靈活性與可塑性,那麼它何以被用來建模超越性的智慧?”,“當原始輸入資料發生突變時,神經網路模型是否依然是可靠的?”等等問題,AI 從業者都在刻意保持一種緘默。

也許恰如 CV 領域的戴維斯教授描述的那樣:“通常的情形是,技術的發展是由小團體中的科研人員的個人特殊興趣所激發,而其方法也往往只是為特定問題量身定做的。與此情景相應的,卻是如下事實:各種演算法、程式、技術都受限於不同研究者各自的創造性。”

換言之,現在 AI 界似乎缺少一套系統的理念與方法整合不同領域不同任務不同資料集上的不同成果,同時也缺少或是刻意遮蔽了一個統一的期望解決的最高問題,而將目光下放到在特定資料集上不同方法論間的競爭。不同資料集上不斷重新整理的準確率或許僅與不成正比膨脹的引數量有相關關係,也因而一種“簡單的”,哪怕是“有效的”的方法因為其本身的體量與外形上的先天劣勢而受到來自所謂審稿人的惡意拒絕。

寫在最後

關注科學倫理的物理學家約翰·齊曼將現在這樣一個科學的時代定義為“後學院時代”。在這個時代下,一個科學共同體並不是一個傳統上一心追尋真理的理論假設,而是受到多方利益集團干涉,與社會、政治不斷產生產品交換的新的社會制度。也由此科學界與科研人員不再是一個理想條件下絕對理性的概念預設,而被還原為一個社會中的活生生的個體,在沒有理性預設的保護下,科學倫理便有了登場的必要。

僅僅因為方法Too Simple就被拒稿,合理嗎?

然而科學倫理從不是被強加在人身上的外在之物,而是一個健康發展的學科的內在要求。因而儘管科研的問題不能用對某些“大問題”的追求而被簡單的一言以蔽之,但缺少對學科內基本問題的認識與追求,很難真正形成一種自發自覺的科研倫理,當科學研究完全被解構為一種謀生的手段之一,科學倫理也便不再具有其先天的約束力與管轄權。

總之,如果只是回答“僅因方法 Too Simple,就該被拒稿嗎?”這一問題是相當簡單的,但這個答案是否可以引我們思考,當我們說出“不應該”時,心中所期待的應該應是如何?或許是更為有意義的話題吧。

上一篇:一個多肉小葉片,3個月後養爆盆,咋養的
下一篇:做乾煸豆角,豆角不要直接下鍋,多做一步,豆角幹香滋潤味道好