在數理統計學中,最重要的幾件事情不外乎
- 了解隨機變數(Random Variable)的機率分配與動差(Moment)
- 為了了解母體(Population)的特性,但不太可能普查,而透過統計方法抽樣(Sampling)
- 透過機率分配進行假設檢定(Hypothesis Test),以說明哪些統計實驗結果成立
- 遇到未知的參數時,想辦法透過統計方式找到估計量(Estimator)
- 想辦法建立迴歸模型(Regression Model)來探討影響變數特性的因子
幸好至少還可能知道這個資訊:如果我們從一個未知的母體分配中抓出一堆變數:X_1, X_2, ..., X_n,其中平均數為μ,變異數為σ^2,則這堆樣本的期望值就是μ,變異數為(σ^2)/n。
可是我們就是很想知道樣本到底服從哪種機率分配啊?這樣要做統計分析還是比較方便,因此需要做一件事情,就是將樣本數量增加,讓它變得足夠大,這樣就能找到樣本服從的「漸近分配」(Asymptotic Distribution)。那麼漸近分配是哪種機率分配呢?這就是「中央極限定理」(Central Limit Theorem)的精神所在了:樣本平均數的漸近分配是平均數為μ,變異數為(σ^2)/n的常態分配。
中央極限定理在統計學上佔有一席之地,原因是從實務角度來講,它告訴我們:隨機樣本的總和,無論原先型態怎麼樣,只要數量大到某種程度是會服從常態分配的。知道機率分配以後要執行各種分析都會變得方便很多。
為了說明中央極限定理,以下為丟擲公正硬幣次數增加,正面朝上的次數之機率分配。
從圖中能夠發現,隨著硬幣數量增加,正面朝上次數之機率會愈來愈接近常態分配。圖片解釋了中央極限定理之精神。
依分配收斂(Convergence in Distribution)與中央極限定理
若要用更嚴謹的方式闡述中央極限定理,首先我們要知道一個樣本收斂的方式:依分配收斂(Convergence in Distribution)。對於一個隨機樣本的數列(Sequence of random variables),對應到的累積密度函數為F_n(x),定義「依分配收斂」為
嚴謹版本的中央極限定理(Lindeberg-Levy C.L.T)也是從「依分配收斂」定義的
樣本之漸近分配是常態分配是個相當好的性質。許多經濟學理論都沒有給出參數應該服從什麼機率分配,所以估計參數上會遇到一些技術上的麻煩,幸好前人已經幫我們想好做法,就是由芝加哥大學教授Lars Peter Hansen所推出的廣義動差法(Generalized Method of Moments, GMM),它的其中一個特性也是常態分配是漸近分配。
其餘心得 (Math Camp的制度)
最近我正在看倫敦政經學院(LSE)經濟系發給我們的Math Camp的教材,內容主要就是要幫助大家複習以前大學時學過的數學,因為讀研究所(或者是當博士生)時那些數學仍然會用上,但是一段時間沒有接觸後,對於數學的感覺往往會變得遲鈍,因此國外絕大多數的經濟博士或是財金博士,正式報到以前都會有這種Math Camp的制度幫大家複習數學,讓大家重新找回對數學的感覺。
當我看到這些講義時,也赫然發現到雖然對於大部分的內容都還算熟悉,可是有一部分的內容已經忘掉而需要複習,甚至也有少數內容是在台灣沒有教到的,因而需要透過Math Camp的教材補起來。尤其對於某些數理統計的東西,有些內容是當初沒能融會貫通的,暑假以來看了Math Camp的東西以後就把概念補起來了,其中一部分就是今天所寫的中央極限定理與漸近分配。希望明天以後到英國讀書能夠順利適應他們的環境。
今年由LSE經濟系開課,PhD Economics, PhD Finance與某些經濟與財金相關的碩士必修的Math Camp一共由4門課組成
- Revision Mathematics (微積分+線性代數+高等微積分的大雜燴)
- Probability and Statistics Inferences (數理統計學)
- Math for Microeconomics (優化理論)
- Math for Macroeconomics (有一部分的微分方程)
其實看過講義以後,我真心覺得Math Camp並不是讓完全沒有數學基礎的人,透過制度讓他們搖身一變成為大內高手的。以Revision Mathematics為例,今年就有發下145頁的筆記(就很像是課本的形式整理起來的),內容還包括有習題,其中一部分是要我們前往LSE之前要先讀完的,到了LSE以後,Revision Mathematics這門課只會花兩天的時間,用兩堂正課與兩堂討論課幫大家複習這145頁的內容。因此個人並不覺得是給沒有數學基礎的人來上的,而應該是假設大家都會絕大多數的內容以後,讓大家看看自己還缺了哪些概念。
我也有先去複習Probability and Statistics Inferences的講義(前輩提供的)還有Math for Micro的講義,也是發現到前者講義也多達108頁(含習題),後者寫得很簡潔,只有33頁。而Probability and Statistics Inferences只有用10天時間用正課與討論課時間去複習內容,Math for Micro只用6天。只可惜Math for Macro似乎是今年才新增的,因此目前沒有發教材讓我們先去複習。但總而言之,要去讀研究所之前,應該是要先好好奠基自己的必備實力,讓研究所學歷變成錦上添花的因素。而並非到研究所才想到哪些最必要的東西需要補起來。
參考資料
[1] London School of Economics EC400: Introductory Course in Mathematics and Statistics Handout
參考資料
[1] London School of Economics EC400: Introductory Course in Mathematics and Statistics Handout
沒有留言:
張貼留言