基廷斯指數

《指導生活的演算法》這本書說,生活中的很多事情,其實是一個數學問題。你與其渾渾噩噩地接受命運的安排,不如按照數學思維,主動地做出選擇。

今天,我們就來聽其中的一講。

我們在生活中講道理經常會引用一些諺語和雞湯,可是這些東西如果放在一起看,常有互相矛盾的地方。比如邏輯學家金岳霖,很早就注意到「朋友值千金」和「金錢如糞土」這兩句話不可能都是對的,否則就等於說「朋友如糞土」。

想要避免價值觀紊亂,我們需要一點數學意識。

看似互相矛盾的兩個人生指南,其實可能都有道理,你要做的是要在其中進行取捨。你不能光講理念,你得講「度」 —— 這個「度」,得用數學方法量化計算。 

1.雞湯與數學
我再列舉幾個雞湯和諺語,咱們看看怎麼取捨。

1. 有人採訪了臨終的老人,問他們這一輩子最後悔的事情是什麼。結果是他們後悔的大都是「沒做的事」 —— 有個好教授的課沒選,有個好姑娘沒向她表白,有個好機會沒下決心辭職 —— 而很少對「做過的事」後悔。

2. 一個女青年突然辭掉穩定的工作,她的辭職信上就寫了一句話,「世界那麼大,我想去看看」。

3. 西方人說「鄰居家的草坪更綠」,中國人說「老婆都是別人的好」。

4. 一隻小猴子下山,看到玉米地里的玉米好就掰了一根玉米;又看到一顆桃樹,就扔了玉米摘桃子;又看到西瓜,就扔了桃子拿西瓜;又看到一隻兔子,就扔了西瓜追兔子 —— 結果沒有追到,最後兩手空空。

前兩條說的是人生在世應該積極探索新事物,後兩條則諷刺了這種行為,認為還是要珍惜已有的東西。那麼哪條說得對呢?我們到底應該在什麼情況下探索新事物,什麼情況下專注於已有的東西呢?

這其實是一個數學問題,而且是一個非常非常難、困擾了數學家很長時間的問題。

今天還是說上周說過的Algorithms to Live By: The Computer Science of Human Decisions (指導生活的演算法:人類決策中的計算機科學),這本書,作者是Brian Christian 和Tom Griffiths。


上面提到的這個問題,在數學中就叫「 探索與收穫的取捨問題(Explore/Exploit Tradeoff) 」。從本質上來講,這個問題是說,你到底應該花費精力去探索新的信息,還是專注於從已有的信息中獲得收穫?

比如你家附近有個餐館,你已經去過15次,其中9次的體驗非常好,有6次的體驗不怎麼好。你打算明天晚上出去吃飯,那麼你是否應該嘗試一個新的餐館呢?

這個問題的應用非常廣。在這個單位已經工作了好幾年,有時候感覺挺好,有時候感覺挺差,我應該跳槽去一家新單位嗎?有個老作者的書我讀過五本了,三本寫得挺好,兩本比較差;另一個新作者,我讀過他兩本書,一本比較好,一本比較差 —— 那麼我下一本書買誰的呢?

手裡這個,我們已經知根知底;新的那個,充滿未知的風險和誘惑。什麼情況下應該換,什麼情況下不應該換,這個問題一直到1970年代才被真正解決。 

 

2.基廷斯指數
數學家的第一個洞見,是你必須考慮時間因素。

假設我們前面說的是北京的一個餐館。數學家要問的是你還打算在北京住多久。如果還要住很久,那你就應該去積極探索新事物,冒點險是值得的,一旦發現一個好餐館,將來可以繼續去。可是如果你後天就要離開北京,那麼在離開北京前的這個晚上,你需要的是最穩妥的體驗,所以就應該去你常去的那個老餐館。

如果你還很年輕,你就應該積極尋找最適合自己的工作。如果你再過兩個月就退休了,你還跳什麼槽?

有些雞湯說我們要把每天都當做生命的最後一天來過,我認為這純屬胡扯。如果今天是我生命的最後一天,我還上什麼班?時間是個非常重要的因素。

解決問題的數學家叫基廷斯。他說,當你計劃出去吃一頓飯的時候,明天那頓應該比今天這頓要貶值一點 —— 因為你明天可能會離開這裡,吃不上那頓飯。具體貶值多少,取決於你預期還能停留多長時間。基於這一點,他提出了一個非常複雜的解決方案,最後結果是給每個選項計算了一個指數,現在被稱為「基廷斯指數(Gittins Index)」。

下面這張表,就是在假設第二頓飯比第一頓飯貶值1%的情況下,各種局面的基廷斯指數。 


比如你正在跟女朋友討論晚上去哪裡吃飯。你說還去那家常去的老餐館吧,女朋友說不行,我要去新餐館。這時候你怎麼辦呢?你就應該當場掏出這張表來,查閱兩家餐館的基廷斯指數。

老餐館,你們去過15次,其中9次感覺很好,6次感覺不好,那麼就是9個wins,6個losses,根據表格,基廷斯指數是0.6997。而新餐館你們並沒有去過,所以wins和losses都為0,基廷斯指數是0.8699。新餐館的基廷斯指數更高,所以女朋友是對的,你們應該去新餐館。

基廷斯指數給一次都沒去過的新餐館一個非常高的估值,這就是因為它可能給你帶來驚喜,要積極探索。但這個探索不是無條件的 —— 根據表格,如果你們去過老餐館9次每次都很好,那麼老餐館的基廷斯指數就是0.9655,那就沒必要去這個新餐館。

事實上,哪怕女朋友說的這個新餐館,你們已經去過兩次,一次體驗好一次不好,那麼新餐館的基廷斯指數仍然高達0.7844,你們還是應該去。這是因為小樣本的統計很可能不準,也許一次不好只是偶然,你應該給它更多機會。而對比之下,老餐館已經去過多次,測量結果已經穩定在一個一般的水平了。

可是如果你們即將離開這個城市,那麼時間貶值率就要調高,下面這張表是假定每次比前一次貶值10%的計算結果: 


這時候全新探索的基廷斯指數已經降低到了0.7029。

用基廷斯指數解決探索/收穫問題,其實有一個隱含的假設,那就是你的轉換是沒有成本的。今天在這間餐館吃飯,明天去新餐館,可以隨便去。可是對於換工作之類的問題,其實存在一個適應新單位的轉換成本,那就要考慮得更複雜一點了。

但不論如何,這個根據停留時間長短來決定探索和收穫的取捨的思路是非常清楚的。這本書提出,哪怕不計算不查表,我們也能從中獲得三個重要的人生智慧。 

 

3.三個智慧
我們希望每一天都活在當下,可是從現實的數學角度,你預期停留的時間越長,探索新事物的價值就越高,基廷斯指數也越高。

如果我們把期限設定為人的一生,這就意味著年輕人應該多探索,到了後期就要專注於收穫。

這對理性的人來說,要想過好這一生,意味著三件事。

第一,年輕時代要大膽探索!

絕大多數小孩不知道什麼基廷斯指數,但是他們非常明白探索的重要性。他們會把家裡所有電器的所有按鈕都按一遍,特別喜歡新玩具,走到哪兒都在關注新東西。

問題是,強調探索,就意味著沒有那麼多收穫,就像那隻掰玉米的小猴子。所以家庭因素就非常重要了。一個年輕人要想不斷試錯,他需要父母提供強有力的支持!不用你掙錢養家,上大學去!選個自己喜歡的專業,不用考慮就業市場!這個工作不喜歡,換!就算出了錯,父母也能包容。

這樣的人在年輕時代可以不斷地探索未知,積累各種經驗教訓,他才能迅速理解這個世界,他的後期才能做出更好的選擇。

 

第二,隨著年齡增長,要慢慢學會利用已有的信息,專注於收獲。

一般的規律,就是人的年齡越大,社交的圈子越窄。老了以後經常交往的就寥寥幾人,經常做的事情也就那麼幾件,去的地方也非常有限,吃飯專門只去一個餐館,就好像已經失去探索的動力了。之前,人們都認為這是老人的悲哀。

可是斯坦福大學有個心理學家認為,這其實是老人的理性選擇。他們已經完成了探索!他們知道自己最適合做的事情是什麼,和哪些人在一起最舒服,哪個餐館最符合自身口味,他們已經沒有冒險探索的必要,只要享受人生就行了。

這就引出一個非常讓人感慨的實驗。實驗者問受試者,如果接下來你可以跟一個人深入交流30分鐘,那麼在以下這三個人中,你選哪一個呢?

1. 直系的家庭成員

2. 你剛剛讀完的那本書的作者

3. 在某一方面跟你有共同興趣的一個陌生人

結果是老年人選第一個,而年輕人選後兩個。如此說來,老人念舊啊。可是接下來實驗者把問題變了一下 ——

他們問年輕人,如果你明天就要出遠門,很長時間都不會回來,你會選擇誰呢?結果年輕人選了直系家庭成員。

他們問老人,如果現在有個新技術突破,你的壽命可以立即延長20年,你會選擇跟誰呢?結果老人們選了後面兩個選項。

老人不是念舊,他們只是在合理地規劃人生。

人老了以後,就更希望能夠專注於自己先前已經建立的關係。這也是為什麼當一個年輕人到一個完全陌生的城市去上大學,周圍都是陌生人,依然能夠興高采烈。但如果你讓老人住進養老院,同樣身邊都是陌生人,他們就不會開心。

悲哀嗎?一點都不悲哀。

 

第三,慢慢變老的過程中,我們的生活其實是越來越好。

實際上,探索新事物的好處並沒有我們想像得那麼巨大,你會不斷地遭受失敗,哪有那麼多浪漫驚喜。老人不探索,並不是因為他們不敢探索了,而是因為他們不用探索了 —— 他們已經完成探索了。

研究表明,隨著年齡增長,我們的精神狀態和生活狀態都在越來越好。如果你已經知道自己喜歡什麼,你就會很樂意被自己喜歡的事物所包圍。

當你看到一位老人,每天跟同一個人,去同一個餐館,坐在同一個座位,點同樣的飯菜,你可能以為他的生活很無聊 —— 殊不知這才是最浪漫的事,他是在享受自己用一輩子的時間所探索出來的成果!

 

羅輯思維 2019-02-19

全站熱搜

峰哥 發表在 痞客邦 留言(1) 人氣()