close

文/CxEric

1

激勵與對錯,是兩組截然不同的概念,但人經過漫長訓練後很容易混淆,誤將獎勵≈正確,而將懲罰≈錯誤。

這似乎是一種根植於進化過程的本能意識:

得到好處的,一定是對的,重複它;

得到壞處的,一定是錯的,避開它。

生物本能很大程度就是這樣運作的,就像芒格所說,大自然存在一種普遍的偉大算法——重複有效的行為。

但這顯然存在一些誤解,因為在邏輯上我們不難明白:獎勵/懲罰、正確/錯誤,其實是兩組概念,它們可以得到2X2=4種組合:

正確的獎勵、正確的懲罰;

錯誤的獎勵,錯誤的懲罰。

這意味着,

如果你得到了獎勵,你可能是對的,也可能是錯的;

如果你得到了懲罰,你可能是錯的,也可能是對的。

獎懲與對錯之間,沒有一對一的映射關係。

甚至有時候,它們彼此毫無關係。

這多少有點反直覺,但我們就是生活在這樣一個世界。

如果你要求這個世界在給予獎勵、懲罰時,必須在時機、方向、力道上都正確無誤,那你就對這個世界的運行邏輯提出了過分要求。

畢竟,連人類自己設計的規章制度,都時常錯漏百出,你又如何能要求大自然、命運之神運作的獎懲模式,能夠遵從人類的理解方式呢?

不要忘記這個世界有多混亂。

2

什麼叫錯誤的獎勵?

就是你做錯了事情,甚至什麼都沒做,卻得到了很大的獎勵。

它容易讓你高估自己的能力、方法、價值觀,讓你在某條錯誤的道路上拔足狂奔,拒絕回頭。

比如說,守株待兔。

什麼叫錯誤的懲罰?

就是你明明做對了事情,卻依然莫名地被胖揍一頓。

它容易讓你質疑自己的能力、方法和價值觀,驅使你放棄正確的做法,採納錯誤方案,直到不久再被揍一次。

這多少會有點讓人抓狂,畢竟我們都期待自己居住在一個有「邏輯」的世界。

就像在遊戲中,如果做對了,我預期會得到獎勵;

就像在學校里,如果答對了,我預期會得到分數。

但生活的另一面,是複雜、無序、隨機和多變量。

作弊是錯的,但有人以此得到更高的分數,還沒人告發他;

誠信經營是對的,但你可能會承擔更重的經營成本,客戶還怪你賣太貴。

你能怎麼說呢?

我當然不是鼓勵作弊、否決誠信,只是我們都需要明白在生活中:

獎懲無法代替對錯;

獎懲難以揭示對錯。

3

關於「錯誤的獎勵」,我最喜歡的例子是【守株待兔】,故事出自《韓非子》:

宋人有耕者。

田中有株,兔走觸株,折頸而死。

因釋其耒而守株,冀復得兔。

兔不可復得,而身為宋國笑。

這個世界上是否真有蠢兔子,會奇怪地一頭撞死在樹樁上,然後讓你白撿一次便宜?

我不敢說這個可能性是0.00%。

但如果被你遇到了,你最好不要誤以為:這一切源自你的努力。

白撿一隻兔子,是一種獎勵,但你得到這個便宜,仰賴的是隨機性、兔子的愚蠢和大自然的bug,而與你的體能、姿勢、心態、技巧無關——事實上,你沒有做任何可稱得上「正確」的事情。

如果你無法理解這一點,你會將撿兔子歸功於自己的能力、方法或人品,以此誇耀於鄉里,傳授方法於眾人,然後寫下網紅文章《我如何0成本捕獲一隻兔子》,直到某天餓死或被門徒噴死。

這就叫貪天之功——明明就是隨機性的功勞,你非要說是你能力過人。

那麼,宋人偶然間撿到兔子,是好事還是壞事呢?

零成本的便宜,當然是好事吧

——但如果宋人從此荒廢勞作,整天眼巴巴等兔子呢?

一個錯誤的獎勵引起錯誤的認知,

一個錯誤的認知引發錯誤的行為。

接着,

重複錯誤的行為又固化了某種錯誤的認知,

乃至傷痕累累,

不撞南牆終不悔。

這又好像是壞事了。

我想,宋人如果從未遇到過那隻兔子,他也許會過上更好的生活。

所以這個故事告訴我們,如果某一天,你碰到傻乎乎的兔子,懷着感恩的心,吃了就吃了,但不要混淆這背後的緣由,不要貪天之功以為己有。

如果你無法保持這種清醒,或許最好的安排是:你永遠不要碰到這種「好」事。

不然,你會成為守株待兔的人。

你會荒廢你的田地,耽誤你的時間,直到某天被人編成段子寫進書里。

4

某個意義上,A股不缺「守株待兔」的人。

我說守株待兔的時候,不是誇他們具備足夠的耐心,願意靜靜地等待結果到來。

我說的是:

因為某一次偶然的收穫,他們就認定自己的方法正確可持續,因而念念不忘地蹲在樹樁邊上,田也不耕了,活也不幹了。

我遇到過一些20年+的老股民,雖然整體虧掉了很多錢,但他們依然對A股戀戀不捨,魂牽夢縈,最主要的心理因素是他們深刻地記得:自己曾在牛市里賺過大錢。

「愛過」算什麼,

「賺過」——才讓人撕心裂肺,刻骨銘心。

於是多年過去,哪怕總體上虧得一塌糊塗,他們的眼睛依然閃爍着期待的光:

請再來一次牛市。

「狗無法忘記某次偶然作死獲得的巨大獎勵,以後會無數次作死,直到真把自己作死; 人類無法忘記某次犯錯而得到的巨大甜頭,直到花光所有運氣。

同樣地,人會生物性地捍衛以前刻下的某條獎勵反射迴路,哪怕這個反射迴路是隨機性導致的,是錯誤的。

人會守株待兔,一定是因為撿過兔子。

沒撿過兔子的人,不會沒事找個樹樁蹲一天。

同理,人會在賭場輸到破產,是因為以前贏過大錢。」

CxEric,公眾號:CxEric的讀書與投資筆記要足夠幸運,才能在錯誤的道路上迅速挨揍
宋人如果沒有遇到兔子,老老實實地耕作,日子或許會過得更好一些;
老股民如果沒遇到攝人心魂的牛市,踏踏實實工作/投資,或許他們的財務狀況會更好一些。

事實上,牛市就是一些人輸掉身家的原因。

「一見牛市誤終身」。

5

芒格在《人類誤判心理學》提到過兩個類似「守株待兔」的例子:
1、「有個人愚蠢地去賭場賭博,竟然贏了錢。這種虛無縹緲的關聯促使他反覆去哪個賭場,結果自然是輸得一塌糊塗。」

2、「也有些人把錢交給資質平庸的朋友去投資,碰巧賺了大錢。嘗到甜頭之後,他決定再次嘗試這種曾經取得成功的方法——結果很糟糕。」
芒格舉這兩個例子,是為了說明人類會受簡單聯想的影響,過往成功案例會給人留下深刻印象,因而在下一次行動時會做出錯誤判斷。

在心理上,他們受到了過往成功的激勵,犯了簡單聯想的錯誤;
在邏輯上,他們沒有理清過往成功的因素,低估了偶然因素、不可複製因素的權重。

比如說,假設:
你請了Eric吃飯,然後你中了一隻新股;
你再次請Eric吃飯,然後你又中了一隻新股。
也許你會默默地覺得,請Eric吃飯就是你中新股的原因,於是你連續一月每天都請他吃飯。

這就是簡單聯想、「錯誤激勵」引發的一種「錯誤認知」,
而你的錯誤認知又引發了一種錯誤的行為。
你連續請吃飯的行為會被稱為「守株待兔」,
而Eric連續吃一個月的行為會被統稱為湊不要臉。

面對這種心裡偏差,有沒對策呢?
有。

芒格說,避免因為過去的成功而做蠢事的正確對策是:

(1)謹慎審視以往的每次成功,找出成功的偶然因素,以免受這些因素誤導,進而誇大新計劃成功的機率;

(2)看看新的行動計劃中,將會遇到哪些在以往成功經驗中沒有出現的風險。

我對這兩個建議深以為然。

這讓我想起一個朋友,他作為一位價值投資者,在某隻牛股上賺到不少錢,因而他堅定相信,自己賺的都是企業的錢,而非市場的錢。

直到某一天,他認真測算了一下,該企業最近幾年的利潤增長、估值變化,以及自己的盈利幅度,然後他略震驚地發現:他的的盈利主要來自估值提升。

這就是一種誠實。

如果他真的體會到了這一點,他就不應該預期,自己未來幾年可以獲得同樣高的年化收益,因為過去那幾年的收益幅度,主要來自市場觀點的變化。

市場的想法,你最好不要猜。
不要貪天之功,不要貪市場之功。

6

要正確理解對錯/獎懲錯位的影響,就必須深刻地認識「激勵」的威力——事實上,這個心理因素如此常見,又是如此容易被低估。

芒格說,「我覺得自己成年以來,在理解激勵機制的威力方面,我比95%的同齡人要好,然而我總是低估那種威力。每年總會有些意想不到的事情,促使我對激勵機制的超級威力有更深的體會。」

「激勵」的威力之一,是它可以引導人的行動。
這很容易理解,人和動物都會重複做有好處的事情,避免做會挨揍的事情。
這個原理如此有效,以至於我們可以用來——預測人的行動。

如果欺騙客戶能得到巨大獎勵/很小懲罰,那麼人就很難不去欺騙客戶。
如果拖延工作可以獲得獎勵,我想大部分員工的動作會慢吞吞得堪比樹懶。

這裡說的激勵,不僅僅是物質上的激勵,還包括精神上的激勵,比如安全感、滿足感、社會聲譽、自我形象等。

通過觀察一個人身處的激勵環境,我們就能預測什麼樣的行為是大概率會發生的,什麼樣的行為是很難出現的。
畢竟,人類是情境的動物。

這裡舉一個例子。
假如你真心信奉長期主義,希望堅持做符合長期主義的事情,那你是否真的能做到?
依我看,這主要不取決於你的決心,而主要取決於你的激勵環境。

當你身處的環境,大力獎勵短期領先,嚴厲懲罰短期落後,那不管你願不願意,你都必須優先追求短期主義。
——你可以在口號上、言語上說自己無視短期,但你的年終獎、崗位升遷、同儕同事壓力最終會打醒你。

因而,我有一個略毒舌的看法:
長期主義都在PPT里,
短期主義都在KPI里。

是的,這個世界沒有那麼多長期主義者,
因為沒有那麼多支撐長期主義的激勵機制。

你的激勵機制,決定了你的行動難度;
你的激勵周期,決定了你的思維周期。

所以,如果你真的想做點什麼事情,不妨先觀察下自己身處的激勵環境。

某個朋友說,他很想做長期投資,但她老婆每周都要查一次賬戶,如果遇到股價大跌,就會先跟他吵一架。

嗯,這也是一種激勵機制。

7

錯誤的獎勵會引發錯誤的認知,錯誤的認知會導致錯誤的行為。
如果你重複一種錯誤的行為,它本身又會固化背後的認知。

這就是「激勵」的另一個威力:激勵,除了會引導你的行為,還會不知不覺間塑造你的認知,芒格稱之為「激勵機制引起的偏見。」

芒格在《人類誤判心理學》中說,
「激勵機制的超級威力所造成的一個重要後果就是我所說的「激勵機制引起的偏見」。

有的人因為受過教育而變得道德高尚,然而在激勵機制的驅動之下,他可能會有意或無意地做出一些不道德的行為,以便得到他想要的東西,而且他還會為自己的糟糕行為尋找藉口,就像施樂工作那些為了得到最高提成而不惜損害顧客利益的銷售員。」
如果某個行為能讓你得到好處,那你就會為這個行為尋找合理的藉口。甚至久而久之,你會真心相信這個「藉口」,「導致人們在做壞事的時候覺得自己是正當的。」

你可以理解為俗語說的「屁股決定腦袋」。

芒格舉了一個極端例子。

有個外科醫生,他年復一年地將大量的健康膽囊,送到該市最好醫院的病理實驗室,如此亂來多年後才被革職。

芒格問負責開除他的醫生:「難道這名外科醫生以為:「這麼做能顯示我的醫術很高明」,或「藉由切掉健康的膽囊來謀害幾個病人,能讓我有好日子過」?」

對方回答說,「不是這樣子的,查理。」

「他認為膽囊是所有疾病的禍根,如果你真的愛護病人,就應該儘快把這個器官切除掉。」

8

這個世界上有沒有無緣無故的愛,有沒有無緣無故的恨?
我不知道。
但我知道,
這個世界上有無緣無故的獎勵,也有無緣無故的懲罰。

如上文所說,這個世界的獎懲與對錯之間,是存在錯位的,
有時候你因為正確而得到獎勵,有時候你因為錯誤而得到獎勵;
有時候你因為錯誤而遭受懲罰,有時候你因為正確而遭受懲罰。

更過分也更讓人難以接受的是,這個世界上有種理由叫無緣無故。

飽經世故的人都會知道,某個人遭逢大難,但未必就是他做錯了什麼;某個人撞上大運,但真說不上他做對了什麼。

如果一萬隻猩猩玩石頭剪刀布,最後也會有一隻猩猩連勝N把,但你很難說這隻猩猩是天賦異稟,有獨特的石頭剪刀布技巧。

或許我們終其一生都在體悟,這個世界是一個概率分布的世界。

朋友滌綸說,在生命里概率的意思是:你就是碰上了,沒有為什麼。
也許是好事,也許是壞事,反正你就是碰上了。
沒有為什麼。

結尾

行文至此,我努力試圖向你說明,對錯與獎懲是很不一樣的概念。
但你或許還是會追問一句:它們到底有什麼區別?

我能夠提供的一個參考角度是:
對錯關乎理性、原則和認知,而獎懲主要關乎利益。

那麼是誰的利益?
很自然地,你就會帶出一個概念:【我】。

人很多時候會看不清楚事情,不是事情有多複雜,而是內心被某種濾鏡扭曲、渲染了視野,而一個常見的強大濾鏡就是——【我】。

股價漲價,只有穿過人眼,才會變成貪婪、恐懼;

對錯得失,在透過自我濾網後,經常只剩下得失。

當我們問一件事是對是錯時,我們關心的是事情本身的特質;

當我們問一件事有利有害時,我們關心的是對【我】的影響如何。

當那個【我】過於強大,人就會不自覺地,或啟動自我保護,或啟動攻擊模式,非常努力地干一件事情:趨利避害,乃至慌不擇路。

因而,當我們認真地詢問:這件事是對是錯?這個做法是好是壞?這種方式是高質素的,還是低質素的?

這會引發一個微妙的心理引導:我們不再那麼關心自我,開始就事物本身展開了思考。

芒格說,理性就是按照事物本身的樣子去理解它。

這讓我想起一件小事。


當我第一次看到段永平說,要做正確的事情,不要做錯誤的事情時,我深感困惑:
這不是廢話嗎?誰會做錯誤的事情?

後來我才想明白,他是對的。
因為對錯與獎懲,是截然不同的概念。

現實中,大家真正熱衷做的並不是正確的事情,而是「有利」的事情。
就像在股市里,大家並不想買有價值的股票,大家只想買「會漲」的股票。

這麼一點微妙的差異,就會導致我們走上不同的道路。

我後來明白,
當段永平說要做正確的事情,他的意思其實是:
你的思維重點應該是對錯,而非利弊。

如果我們混淆了這裡的區別,就會奔赴利益、獎勵,而逐漸忘了自己原本要走的是什麼道路。

最後,在過去一年裡,我很喜歡《禪與摩托車維修的藝術》這本書,雖然看不太懂,但依然大受震撼。

它的扉頁上寫着這麼一段話,不妨以此作為結尾。

And what is good, Phaedrus,

And what is not good—

Need we ask anyone to tell us these things?

什麼是好的,斐德魯斯,

什麼是不好的——

我們需要問誰來告訴我們這些事情嗎?


是呀,

What is good,

And what is not good—
Need we ask anyone to tell us these things?


— END —
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()