文/CxEric
1
激勵與對錯,是兩組截然不同的概念,但人經過漫長訓練後很容易混淆,誤將獎勵≈正確,而將懲罰≈錯誤。
這似乎是一種根植於進化過程的本能意識:
得到好處的,一定是對的,重複它;
得到壞處的,一定是錯的,避開它。
生物本能很大程度就是這樣運作的,就像芒格所說,大自然存在一種普遍的偉大算法——重複有效的行為。
但這顯然存在一些誤解,因為在邏輯上我們不難明白:獎勵/懲罰、正確/錯誤,其實是兩組概念,它們可以得到2X2=4種組合:
正確的獎勵、正確的懲罰;
錯誤的獎勵,錯誤的懲罰。
這意味着,
如果你得到了獎勵,你可能是對的,也可能是錯的;
如果你得到了懲罰,你可能是錯的,也可能是對的。
獎懲與對錯之間,沒有一對一的映射關係。
甚至有時候,它們彼此毫無關係。
這多少有點反直覺,但我們就是生活在這樣一個世界。
如果你要求這個世界在給予獎勵、懲罰時,必須在時機、方向、力道上都正確無誤,那你就對這個世界的運行邏輯提出了過分要求。
畢竟,連人類自己設計的規章制度,都時常錯漏百出,你又如何能要求大自然、命運之神運作的獎懲模式,能夠遵從人類的理解方式呢?
不要忘記這個世界有多混亂。
2
什麼叫錯誤的獎勵?
就是你做錯了事情,甚至什麼都沒做,卻得到了很大的獎勵。
它容易讓你高估自己的能力、方法、價值觀,讓你在某條錯誤的道路上拔足狂奔,拒絕回頭。
比如說,守株待兔。
什麼叫錯誤的懲罰?
就是你明明做對了事情,卻依然莫名地被胖揍一頓。
它容易讓你質疑自己的能力、方法和價值觀,驅使你放棄正確的做法,採納錯誤方案,直到不久再被揍一次。
這多少會有點讓人抓狂,畢竟我們都期待自己居住在一個有「邏輯」的世界。
就像在遊戲中,如果做對了,我預期會得到獎勵;
就像在學校里,如果答對了,我預期會得到分數。
但生活的另一面,是複雜、無序、隨機和多變量。
作弊是錯的,但有人以此得到更高的分數,還沒人告發他;
誠信經營是對的,但你可能會承擔更重的經營成本,客戶還怪你賣太貴。
你能怎麼說呢?
我當然不是鼓勵作弊、否決誠信,只是我們都需要明白在生活中:
獎懲無法代替對錯;
獎懲難以揭示對錯。
3
關於「錯誤的獎勵」,我最喜歡的例子是【守株待兔】,故事出自《韓非子》:
宋人有耕者。
田中有株,兔走觸株,折頸而死。
因釋其耒而守株,冀復得兔。
兔不可復得,而身為宋國笑。
這個世界上是否真有蠢兔子,會奇怪地一頭撞死在樹樁上,然後讓你白撿一次便宜?
我不敢說這個可能性是0.00%。
但如果被你遇到了,你最好不要誤以為:這一切源自你的努力。
白撿一隻兔子,是一種獎勵,但你得到這個便宜,仰賴的是隨機性、兔子的愚蠢和大自然的bug,而與你的體能、姿勢、心態、技巧無關——事實上,你沒有做任何可稱得上「正確」的事情。
如果你無法理解這一點,你會將撿兔子歸功於自己的能力、方法或人品,以此誇耀於鄉里,傳授方法於眾人,然後寫下網紅文章《我如何0成本捕獲一隻兔子》,直到某天餓死或被門徒噴死。
這就叫貪天之功——明明就是隨機性的功勞,你非要說是你能力過人。
那麼,宋人偶然間撿到兔子,是好事還是壞事呢?
零成本的便宜,當然是好事吧
——但如果宋人從此荒廢勞作,整天眼巴巴等兔子呢?
一個錯誤的獎勵引起錯誤的認知,
一個錯誤的認知引發錯誤的行為。
接着,
重複錯誤的行為又固化了某種錯誤的認知,
乃至傷痕累累,
不撞南牆終不悔。
這又好像是壞事了。
我想,宋人如果從未遇到過那隻兔子,他也許會過上更好的生活。
所以這個故事告訴我們,如果某一天,你碰到傻乎乎的兔子,懷着感恩的心,吃了就吃了,但不要混淆這背後的緣由,不要貪天之功以為己有。
如果你無法保持這種清醒,或許最好的安排是:你永遠不要碰到這種「好」事。
不然,你會成為守株待兔的人。
你會荒廢你的田地,耽誤你的時間,直到某天被人編成段子寫進書里。
4
某個意義上,A股不缺「守株待兔」的人。
我說守株待兔的時候,不是誇他們具備足夠的耐心,願意靜靜地等待結果到來。
我說的是:
因為某一次偶然的收穫,他們就認定自己的方法正確可持續,因而念念不忘地蹲在樹樁邊上,田也不耕了,活也不幹了。
我遇到過一些20年+的老股民,雖然整體虧掉了很多錢,但他們依然對A股戀戀不捨,魂牽夢縈,最主要的心理因素是他們深刻地記得:自己曾在牛市里賺過大錢。
「愛過」算什麼,
「賺過」——才讓人撕心裂肺,刻骨銘心。
於是多年過去,哪怕總體上虧得一塌糊塗,他們的眼睛依然閃爍着期待的光:
請再來一次牛市。
「狗無法忘記某次偶然作死獲得的巨大獎勵,以後會無數次作死,直到真把自己作死; 人類無法忘記某次犯錯而得到的巨大甜頭,直到花光所有運氣。
同樣地,人會生物性地捍衛以前刻下的某條獎勵反射迴路,哪怕這個反射迴路是隨機性導致的,是錯誤的。
人會守株待兔,一定是因為撿過兔子。
沒撿過兔子的人,不會沒事找個樹樁蹲一天。
同理,人會在賭場輸到破產,是因為以前贏過大錢。」



人很多時候會看不清楚事情,不是事情有多複雜,而是內心被某種濾鏡扭曲、渲染了視野,而一個常見的強大濾鏡就是——【我】。
股價漲價,只有穿過人眼,才會變成貪婪、恐懼;
對錯得失,在透過自我濾網後,經常只剩下得失。
當我們問一件事是對是錯時,我們關心的是事情本身的特質;
當我們問一件事有利有害時,我們關心的是對【我】的影響如何。
當那個【我】過於強大,人就會不自覺地,或啟動自我保護,或啟動攻擊模式,非常努力地干一件事情:趨利避害,乃至慌不擇路。
因而,當我們認真地詢問:這件事是對是錯?這個做法是好是壞?這種方式是高質素的,還是低質素的?
這會引發一個微妙的心理引導:我們不再那麼關心自我,開始就事物本身展開了思考。
芒格說,理性就是按照事物本身的樣子去理解它。
這讓我想起一件小事。
它的扉頁上寫着這麼一段話,不妨以此作為結尾。
And what is good, Phaedrus,
And what is not good—
Need we ask anyone to tell us these things?
什麼是好的,斐德魯斯,
什麼是不好的——
我們需要問誰來告訴我們這些事情嗎?
是呀,
What is good,

