close
要想如量化算法一般用心若鏡,你需要學習量化算法的工具體系。今天就借着一個日常生活中與每個人都息息相關的重要問題,來分享如何使用因子分析,與因子可視化的量化技巧來解決複雜問題。

全文1300字,閱讀時間4分鐘

01. 問題緣起

02. 研究方法

03. 理想狀態



01. 問題緣起


前文發出後,我問一位精粹群友,你希望品哥小作文接下來寫什麼。她回答說:解構自己。
我說,這個題目很好。解構自己,最應該先做的就是分解自己情緒和行為。只要你對自己誠實,就能列出自己頭腦中的所思所想,和感受其對應的情緒。
我馬上自己動手列了列,一些能想到的腦中之事,肯定不全,僅做個示例:
拖沓,擔憂,憤怒,回憶,預想,後悔,悵惘,埋怨,焦慮,恐懼,積怨,希冀,回味,糾結,拖延,猶豫。

02. 研究方法

單單文字一排看過去,似乎沒什麼規律,也不知道該如何入手分析。而如果我們此時運用量化工具箱中的特徵因子打分的方式,選取兩個特徵因子製作二維坐標軸,把上述概念,按X軸含時量,Y軸含二量(主客二元)做一個映射。得到如下圖示:
也就是將上述頭腦中對應發生事情,按其所想內容對應的時間定義「含時量」作為X軸;所想之內容中「我」與其他客體之間站位的明晰程度,定義「含二量」作為Y軸,即代表主客二元對立的可辨識性。
舉例說明,希冀肯定含時量正很多,因為關乎遙遠未來。同理,積怨含時量負的絕對值也大。
同時,積怨一定有明晰的積怨客體對象,比如對原生家庭中的母親。這時其含二量因子絕對值很大,而且因其情緒集中針對的是具體客體而非對我自己,故符號為負。希冀就沒有特別明確的對象客體,可能就是希冀一個星辰大海的偉大時代,所以含二量因子值就趨近於0。假如還要加個期許進來,取決於對自己還是對別人,會有上下兩個可能坐標位置。同樣,對不同具體事項的恐懼也會確定四象限中不同的坐標位置。我畫那個坐標位置時,想象中的具體恐懼是從天而降的一場治不好的大病。
糾結和猶豫,看上去好像都是對未來馬上要做的決策的一種情緒,兩種含時量差不多,稍微正一點。但是含二量很不一樣,糾結的客體可選項情況要具體很多,因各種SWOT情況分析,可能都已經列出來待決策選擇的正反論據。而猶豫可能就是一種朦朧的感覺。
我對每個情緒的具體坐標值定位可能和您自己認為的不一樣。這就好像不同量化管理人對同名因子同一邏輯,只因數據處理流程不同造成因子值有差異。但這不妨礙說清楚問題的本質和應用於實戰。

03. 理想狀態

而一旦畫出對應的坐標系映射,我雙眼放光,立刻盯上了坐標原點的那點綠。那裡,一定是我大腦日常待機最想待的狀態,這樣一定是最不費力的。

同時,所有的外在行為也只能等大腦狀態歸位到了原點,才可能指揮發出行動。即,如果你現在正處於其他坐標位置的情緒中,也必須順着兩個坐標軸摸回到原點,才能對外有所行動。

舉例說明:希冀本身是沒法具體行動的。你必須拆解到對空氣動力學和火箭發動機材料學的具體學習才能向前。對某人的極端憤怒也是,你必須轉換為拿起電話或手邊花瓶的即時動作。並且我們也都清楚這樣的動作,並非冷靜下來時回歸原點後會做的最優行動選擇。

對有些含時量為負的情緒,要做這種轉換為行動的歸位,還真不太容易。比如後悔,要轉換為行動並消化情緒,需要有更大的想象力和自我突破,不然就會一直陷在二象限死循環出不來。

沒有行動時,頭腦狀態逸出原點太遠,其實就是想太多做太少了。跑開越遠,真要到行動時,還必須歸位反向做的功也就越多。只因這樣的逸出狀態本質上是阻礙當下做出行動反應的。大家常說的顧慮太多就是這麼回事。你可以回顧下那些用心若鏡的量化程序,看看是不是能從他們選擇的狀態和行動邏輯得到更多啟示。

打造大腦在上述坐標原點位置的強大定力,與映照世事的算法模型體系,這就是量化投資底層邏輯和本質優勢給本問題的核心啟示。不僅有讓人信服的結論,還給出了可操作的具體路徑。

編輯按:

如果你喜歡本文和前文,敬請關注交易門品哥小作文專欄。本文打賞過十萬後,品哥將繼續寫作分享下一個關鍵問題:如何行動,和這背後的算法模型體系打造。

Technical Appendix:
本文使用因子可視化只是完成了量化策略研發中尋找想法的第一步。即通過重新按因子值排列數據,發現含時量和含二量兩個因子的絕對值小的狀態,看上去相比離原點更遠的其他態更好。有了這樣的想法後,就需要有如下的數據準備和實證步驟:
將含時量和含二量做取絕對值的數值變化,或者直接整合兩者為一個變量,比如取離開原點的歐氏距離,過於極端的原始數據還要截取極值,來生成易於實證考察的數據。
影響因素有了,還需要有個狀態變量。或拍腦袋估個體的主觀愉悅程度,或拿收入、消費這樣的客觀數據,作為這個狀態好壞的代理變量。不同於金融市場,我們這裡直接觀察不到時刻變動的價格。作為狀態好壞的代理變量選取本身也一定摻雜着研究者你自己的價值觀。而前文提到量化投資的價值觀就是「價格即價值」,這個好與壞的標準就明晰很多。
如果對單一個體,可以在人生的時間線上連續記錄上述數據,構成時間序列。這樣你就可以看自變量對狀態好壞的影響關係了。時間序列越長越有說服力。我周圍確實有人這樣在記錄這些值,他從自己的記錄中得到的信息和對自己的了解程度驚人。品哥沒這麼勤快,我就是經常問問我的理解和他的實證是否匹配。不匹配時,我一定是嚴肅考慮是否調整我的理解。畢竟作為實證派,我周圍也就這一份長達25年的數據。
如果有更多的人開始記錄,時間對齊後還可以構成多個主體之間可對比的數據,即多個可比的時間序列的整體,術語稱為Panel Data。不同主體的數值就可以橫向可比了。這種比較,在量化中術語叫橫截面比較。為了橫向對比,需要做一些額外的處理,來控制其他因素的影響。比如對收入,單單講收入高低對人生質量的影響還是不夠。於是很多人說要看掙錢的效率,這時就要去除上不同人每周的平均工作時間。如果每個人的平均工作時間不可考,除數分母可以是該職業的平均估計。比如賣方研究員90小時,買方研究員100小時,賣方銷售80小時,買方老闆10小時等等。這個處理就叫中性化處理。股票做橫截面因子值比較時,比如做按價值選股時,銀行股和高科技股的市盈率因子值就能差的很多,這時做行業中性的操作還很重要。
有了必要數據準備的時間序列或Panel Data,你要實證去研究個什麼問題是不是很容易。大腦哪裡需要陷在離坐標原點很遠的那些地方出不來?所以萬事不決問量化。自己動手,解決自己的問題。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()