近年來,國內外學術界對金融高頻交易數據、超高頻交易數據展開了廣泛的研究,為此類研究提出了新的思考。高頻交易請選擇量邦科技為您開發的量邦天語軟體,為量化投資者和專業機構提供股票期貨程式化交易平台。
數據誤區
此外,不少文獻認為金融高頻數據僅僅是加細了取樣間隔,增加了樣本容量,因而包含了比以往更多的信息。然而事實上並非取樣頻率越高就越精確,因為取樣頻率越高也越容易受到微結構噪聲(microstructurenoise)的影響。需要注意,對金融高頻數據的建模方法不同於低頻,比如ARCH模型族在金融高頻數據中基本無法使用;超高頻數據與高頻數據的研究方法也有質的區別,比如超高頻數據取樣間隔不等距且隨機,而多數統計計量方法都是針對固定等距情形而設計的。但是目前國內對金融(超)高頻數據的研究多集中在引入國外模型做套用實證分析,對研究方法的探討並不多。
統計方法
以波動率的研究為例,金融研究領域的很多模型都是為刻畫波動的時變性、聚集性、非對稱性和長記憶性等特徵提出的,然而這些模型大都無法直接套用於高頻數據,與低頻數據採用ARCH模型族討論波動不同的是,高頻數據主要採用已實現波動率(realizedvolatility)來對波動率進行測量,通過波動率來深入分析和研究交易的內在機制。這方面主要集中在對市場微觀結構理論的探討。與時間序列模型強調數據的統計性質所不同的是,微結構模型(marketmicrostructure)更多地關注市場行為,著意於交易的細節,如交易價格的形成過程、代理人的行為、交易成本、交易機制等。狹義地來講,微結構模型旨在考察市場參與者的潛在需求如何轉化為交易價格和交易量的過程。儘管這部分內容與金融高頻數據分析緊密相關,但從數據挖掘角度的深入研究並不多。這樣就有必要從統計學理論和方法的角度來審視金融高頻數據挖掘的內容和方法。
數據差異
所以,不同尺度下,可以有截然不同的結論,“橫看成嶺側成峰,遠近高低各不同”,從系統論的角度看,我們必須承認,不同層次(類別)有不同層次(類別)的規律(除了無特徵尺度的“自相似”,它在不同的尺度上表現出相似或統計相似的性質)。比如研究了微觀個體的行為,並不可以簡單加總去推斷群體的行為;研究了短期的行為,也不可以妄斷長期。應該注意,這裡本身並不涉及推斷問題,不能用這個層次的觀察來推斷另一個層次,推斷應該是在同一個層面(尺度的,包括外推和橫向比較。比如,由可獲得的樣本推斷未知總體,它僅僅是數量上的策略。
抽樣研究
退一步而言,根據統計抽樣理論,如果採用合適的抽樣方法,那么抽樣的效果並不弱於全面調查。所以,問題並不在於是否採用抽樣方法,而在於如何設計和實施抽樣。由於很多金融時序數據在總量觀察的尺度上多呈異方差(異質程度較高),所以通過提高抽樣頻率來挖掘其中所包含的豐富的波動信息是很自然的。另一方面,根據總體輔助信息設計合理的抽樣方法也是值得努力的方向。
事實上,從統計的視角來看,過於細緻的數據並不利於展現數據的總體特徵。因而才會引出分組的重要性,即分組對數據進行人為的、有目的的離散化梳理,這有助於問題的發現。模型也正是通過顯現本質忽略枝蔓而簡化了現實,使我們專注於要解決的問題。