最佳學習甜蜜點：15%的新東西

為什麼15.87%這個數字對你很重要？

萬維鋼：最高學習效率15.87%

生活中總有那麼一種人：他們學習效率極高，即使面對陌生知識，也能快速切入、高效掌握。

他們是怎麼做到的？這和一個數字有關係——15.87%。

今天咱們說一個特別熟悉的規律的新發現。這個發現是如此得重要，以至於我認為你應該永遠記住它。

從三個熟悉的知識說起

1. 學習區

心理學家把我們可能面對的學習內容分成了三個區：舒適區、學習區和恐慌區。

舒適區的內容對你來說太容易，恐慌區的內容太難，刻意練習要求你始終在二者中間一個特別小的學習區里學習——這裡的難度對你恰到好處。

這個理論不可能是錯的。但是因為現在「跳出舒適區」已經成了一句口號，有些人就產生了逆反心理，說我好不容易找到一個舒適區發揮特長，為什麼要跳出來呢？

關鍵在於這裡說的是「學習」！也許你在舒適區賺錢最多，但那是另一回事——要想提高技藝，你就只能在學習區。

2. 心流

這個概念最早是米哈里·契克森米哈賴在《心流：最優體驗心理學》這本書里提出來的。

契克森米哈賴說，要想在工作中達到心流狀態，這項工作的挑戰和你的技能必須形成平衡。他還專門用一張圖說明這個道理——

如果工作的挑戰大大低於你的技能，你會覺得這個工作很無聊。如果工作的挑戰大大超出你的技能，你會感到焦慮。

而如果難度和技能正好匹配，你一上來並不知道該怎麼做，但是調動自己最高水平的技能、再稍微突破一點，你正好能解決這個問題，那就是心流的體驗。這是一個奇妙的感覺，你沉浸在工作之中忘記了時間的流動，甚至可能忘記自身的存在。

3. 「喜歡 = 熟悉 + 意外」

一個文藝作品要想最大限度地吸引觀眾，必須既提供觀眾熟悉的東西，又製造意外。

好，現在你發現沒有，這三個知識說的其實是一回事。學習區、心流、喜歡，說的是已知和未知、簡單和困難、熟悉和意外的搭配——從資訊理論的角度來說，它們說的都是「舊信息」和「新信息」的配比。

那我現在問你一個問題，這個配比應該是多少呢？

以前我們並沒有量化這些理論，我們只是泛泛地說要加入一定的難度和意外。而我今天要講的這個研究，恰恰告訴我們一個神奇的答案，說這個問題是有最優數值解的：這個數值是15.87%。

亞利桑那大學和布朗大學的研究者剛剛貼出一篇論文的預印本，叫《最優學習的85%規則》[1]。這篇論文還沒有正式發表，《科學美國人》上的一個博客已經率先報道 [2]，Twitter上也有好幾個人討論。

我仔細研讀了這篇論文，感覺非常新穎而且非常重要，它將來會獲得大量的引用。但是我認為一些討論誤解了這篇論文的意思。我先說說這篇論文到底說了什麼。

我們知道現在人工智慧本質上是機器學習。我們弄一個神經網路，用大量的數據去訓練這個網路，讓網路學會自己做判斷。網路內部有大量參數隨著訓練不斷變化，就相當於人腦在學習中提高技藝。

每一次訓練，都是先讓網路對數據做個自己的判斷，然後數據再給它一個反饋。如果網路判斷正確，它就會加深鞏固現有的參數；如果判斷錯了，它就調整參數。這跟人腦的學習也很像：只有當你判斷錯誤的時候，才說明這個知識對你是新知識，你才能學習提高。

研究者可以決定用什麼難度的數據去「喂」這個網路。如果數據難度太低，網路每次都能猜對，那顯然無法提高判斷水平；如果數據難度太高，網路總是猜錯，那它的參數就會東一下西一下變來變去，就會無所適從。這項研究問的問題是，每次訓練中網路判斷的錯誤率是多少，才是最優的呢？

研究者首先用了一個比較簡單的數學模型做理論推導，又用了一個AI神經網路學習演算法和一個模擬生物大腦的神經網路模型做模擬實驗，結果得出一個精確解：15.87%。

也就是說，當你訓練一個東西的時候，你給它的內容中應該有大約85%是它熟悉的，有15%是它感到意外的。

研究者把這個結論稱為「85%規則」，我們乾脆就把15.87%叫做「最佳意外率」。這個數值就是學習的「甜蜜點」。

讓你學得最快而且最爽

找到最佳意外率有兩個好處：

1. 它讓你的學習速度最快

我們來看看模擬實驗的結果。下面這是一張等值曲線圖，說的是判斷出錯率和AI訓練效率的關係——

圖中橫坐標代表每次訓練的出錯率——也就是意外率，縱坐標代表訓練的次數，圖中顏色代表訓練出來的網路的準確度，顏色越熱（黃色）表示準確率越高。

我們看到，0.1587的訓練出錯率那個區域，隨著訓練次數的增長，它的準確度增加速度是最快的。比如說出錯率是0.4，訓練一千次能達到的準確率，大約相當於出錯率是0.1587，訓練350次的水平！

下面這張圖中的三條曲線代表三個不同的訓練出錯率，橫坐標是訓練的總次數，縱坐標是準確度。我們看到，出錯率在0.16的那條曲線，準確度增加的速度是最快的，可以說大大高於另外兩條曲線。

研究者理論推導的結果是，15.87%的意外率能讓訓練時間相對於其他數值以指數下降。

2. 它還能讓你在學習中感覺最爽

這項研究使用的例子主要是機器學習，但是研究者也考察了在其他領域中的訓練，包括對人的教學實驗和對動物的訓練，大家摸索出來的結果基本上都是要有15%的新內容。這些研究表明，在這個點上，人們對學習的投入度是最高的。

15.87%不但是學習中的最佳訓練出錯率，也是心流率，也是文藝作品最佳意外率。論文中還提到，電子遊戲的設計者也得用這個比率。如果在這個遊戲關卡中玩家都一點都不會犯錯，輕鬆過關，那遊戲就太簡單了，玩家會感到無聊。如果讓玩家頻頻犯錯，那設置太難了，也玩不下去。15%左右的犯錯率，是最好玩的遊戲。

量化你的學習曲線

我為什麼說《科學美國人》那篇博客文章的理解是錯誤呢？那個作者從這個研究悟出的道理是最好每次考試都考85分。如果你考100分，那這個考試對你來說太簡單了，你應該挑戰更高難度的內容。如果你的分數太低，那你應該降低難度。

但是你不想當一個考85分的學生，85分不能把你送進好大學。其實我們理解了這個研究之後就會明白，15.87%這個比率並不是學習之後再考試的出錯率，而是在學習之前，你要學的這個內容的最佳意外率。這是先測驗，後學習的訓練方法中測驗出來的出錯率。

能讓你判斷錯誤的東西才是你需要學習的東西。不是說我們對一個什麼知識掌握85%就行了，我們關注的恰恰是那15%的事先不會的東西。

所以最科學的安排不是說期末考試應該得85分，而是在每次學習之前，安排學習內容的時候，確保有15%的新東西。

比如說學英語。最理想的一篇課文，應該是其中85%的內容是你熟悉的，15%的內容——包括單詞和語法——對你來說是新的。

學數學，每一個新知識都是建立在舊知識的基礎之上。最好這一講中85%的操作是你本來就會的，15%是新技巧。讀書，最理想的情況是書中85%的內容讓你有親切感，另外15%是改造你的世界觀。

我們從這項研究中至少可以有三個收穫。

1. 熟悉很重要。

在學習中遇到熟悉的東西，可以鞏固我們的知識，讓我們再次確認以前學的是對的。這並不僅僅是心理上的安慰！人工智慧神經網路不需要心理安慰，它是冷酷無情的，但是它也需要熟悉的內容。

所以「學習區」不是一個感情上的問題，而是大腦認知的問題。新信息重要，舊信息也很重要。

2. 15.87%這個數值是通用的嗎？

研究者的理論推導用的是一個特殊的數學模型，但是他們的數值模擬，包括考察其他領域中的訓練，結果差不多也都是這個數值。如果我們相信人腦本質上就是一個神經網路，那麼這個研究就具有普遍的意義。我私下認為這個數值在任何一個領域中都不會太離譜。

3. 有一個值得專門強調的精神，就是你應該時刻追求效率最大化。

知道一個道理有用，和知道這個道理有多麼有用，有本質區別。

每個人都知道要想學習好，你應該謙虛謹慎、博採眾長、尊師重道、眼光放長遠、有很大的格局。可是要謙虛到什麼程度才好？格局最大要多大？這些都沒有量化，不好操作。

但是15.87%這個最優意外率是可以操作的。15%和5%的進步速度有非常明顯的差異。我們設想有兩個愛學習的人 ——

A同學對什麼都感興趣，博覽群書還選修了很多課程。他有時候覺得所學的內容很輕鬆，有時候感到吃力，但他總是那麼用功。A同學熱愛學習，他覺得自己學得很不錯。

但是世界上還可能存在一個B同學。B同學有個教練，給他精心安排每次學習的內容，確保每次15%的意外率。B同學的學習效率達到了最大化。

我們知道那是一個特別理想的狀態，沒有人能確保這樣的高效率。但是根據這一講的理論，假以時日，B同學的學習成就將會遠遠超過A同學。你想想這是多麼可怕的一個事實。

參考文獻：

[1] Robert C. Wilson et al., The Eighty Five Percent Rule for Optimal Learning, doi: https://doi.org/10.1101/255182

[2] Cody Kommers, How Wrong Should You Be? blogs.scientificamerican.com, January 14, 2019.

羅輯思維 2019-03-06／萬維鋼

峰哥

峰言峰語

峰哥發表在痞客邦留言(2) 人氣(304)

峰言峰語

只有一種英雄主義，那就是看清生活真相後，依然熱愛生活。