2017年8月16日 星期三

Central Limit Theorem (C.L.T)

       在數理統計學中,最重要的幾件事情不外乎
  • 了解隨機變數(Random Variable)的機率分配與動差(Moment)
  • 為了了解母體(Population)的特性,但不太可能普查,而透過統計方法抽樣(Sampling)
  • 透過機率分配進行假設檢定(Hypothesis Test),以說明哪些統計實驗結果成立
  • 遇到未知的參數時,想辦法透過統計方式找到估計量(Estimator)
  • 想辦法建立迴歸模型(Regression Model)來探討影響變數特性的因子
其中,我們最先想知道的就是參數服從的機率分配或者是動差,因為這是統計學最基本的要素。如果我們不知道有限數量的樣本之機率分布,是無法執行假設檢定的,若無法執行假設檢定,則我們不知道做出來的實驗結果究竟能不能被統計學所接受。就算不談假設檢定,而只是想了解我們拿到的資料究竟服從哪種機率分配,若我們不知道母體服從的機率分配,則這些資料的機率分配也很難知道

        幸好至少還可能知道這個資訊如果我們從一個未知的母體分配中抓出一堆變數:X_1, X_2, ..., X_n,其中平均數為μ,變異數為σ^2,則這堆樣本的期望值就是μ,變異數為(σ^2)/n

         可是我們就是很想知道樣本到底服從哪種機率分配啊?這樣要做統計分析還是比較方便,因此需要做一件事情,就是將樣本數量增加,讓它變得足夠大,這樣就能找到樣本服從的「漸近分配」(Asymptotic Distribution)。那麼漸近分配是哪種機率分配呢?這就是「中央極限定理」(Central Limit Theorem)的精神所在了樣本平均數的漸近分配是平均數為μ,變異數為(σ^2)/n的常態分配

        中央極限定理在統計學上佔有一席之地原因是從實務角度來講,它告訴我們隨機樣本的總和,無論原先型態怎麼樣,只要數量大到某種程度是會服從常態分配的。知道機率分配以後要執行各種分析都會變得方便很多

        為了說明中央極限定理以下為丟擲公正硬幣次數增加,正面朝上的次數之機率分配


從圖中能夠發現,隨著硬幣數量增加,正面朝上次數之機率會愈來愈接近常態分配。圖片解釋了中央極限定理之精神

依分配收斂(Convergence in Distribution)與中央極限定理

       若要用更嚴謹的方式闡述中央極限定理,首先我們要知道一個樣本收斂的方式:依分配收斂(Convergence in Distribution)。對於一個隨機樣本的數列(Sequence of random variables),對應到的累積密度函數為F_n(x),定義「依分配收斂」為


嚴謹版本的中央極限定理(Lindeberg-Levy C.L.T)也是從「依分配收斂」定義的


樣本之漸近分配是常態分配是個相當好的性質。許多經濟學理論都沒有給出參數應該服從什麼機率分配,所以估計參數上會遇到一些技術上的麻煩,幸好前人已經幫我們想好做法,就是由芝加哥大學教授Lars Peter Hansen所推出的廣義動差法(Generalized Method of Moments, GMM),它的其中一個特性也是常態分配是漸近分配

其餘心得 (Math Camp的制度)

        最近我正在看倫敦政經學院(LSE)經濟系發給我們的Math Camp的教材,內容主要就是要幫助大家複習以前大學時學過的數學,因為讀研究所(或者是當博士生)時那些數學仍然會用上,但是一段時間沒有接觸後,對於數學的感覺往往會變得遲鈍,因此國外絕大多數的經濟博士或是財金博士,正式報到以前都會有這種Math Camp的制度幫大家複習數學,讓大家重新找回對數學的感覺

         當我看到這些講義時,也赫然發現到雖然對於大部分的內容都還算熟悉,可是有一部分的內容已經忘掉而需要複習,甚至也有少數內容是在台灣沒有教到的,因而需要透過Math Camp的教材補起來。尤其對於某些數理統計的東西,有些內容是當初沒能融會貫通的,暑假以來看了Math Camp的東西以後就把概念補起來了,其中一部分就是今天所寫的中央極限定理與漸近分配。希望明天以後到英國讀書能夠順利適應他們的環境
        今年由LSE經濟系開課,PhD Economics, PhD Finance與某些經濟與財金相關的碩士必修的Math Camp一共由4門課組成
  • Revision Mathematics (微積分+線性代數+高等微積分的大雜燴)
  • Probability and Statistics Inferences (數理統計學)
  • Math for Microeconomics (優化理論)
  • Math for Macroeconomics (有一部分的微分方程)
其實看過講義以後,我真心覺得Math Camp並不是讓完全沒有數學基礎的人,透過制度讓他們搖身一變成為大內高手。以Revision Mathematics為例,今年就有發下145頁的筆記(就很像是課本的形式整理起來的),內容還包括有習題,其中一部分是要我們前往LSE之前要先讀完的到了LSE以後,Revision Mathematics這門課只會花兩天的時間,用兩堂正課與兩堂討論課幫大家複習這145頁的內容。因此個人並不覺得是給沒有數學基礎的人來上的,而應該是假設大家都會絕大多數的內容以後,讓大家看看自己還缺了哪些概念

        我也有先去複習Probability and Statistics Inferences的講義(前輩提供的)還有Math for Micro的講義,也是發現到前者講義也多達108頁(含習題),後者寫得很簡潔,只有33頁。而Probability and Statistics Inferences只有用10天時間用正課與討論課時間去複習內容,Math for Micro只用6天。只可惜Math for Macro似乎是今年才新增的,因此目前沒有發教材讓我們先去複習。但總而言之,要去讀研究所之前,應該是要先好好奠基自己的必備實力,讓研究所學歷變成錦上添花的因素。而並非到研究所才想到哪些最必要的東西需要補起來



參考資料
[1] London School of Economics EC400: Introductory Course in Mathematics and Statistics Handout








沒有留言:

張貼留言

Inelastic Markets Hypothesis

         這篇文章來自於我上個禮拜參加 Western Finance Association (WFA) 研討會的心得 , 而今天要介紹的這篇論文是我在研討會前有細讀過的其中一篇 。原訂要在夏威夷舉辦的這場,跟去年一樣是採用線上研討會的模式。雖然少了一次可以趁著參加研討...