PPS抽樣方法在我國出口貿易預測中的應用
佚名
論文導讀::通過對我國31個省市自治區的出口貿易額進行不等概率抽樣,抽取了13個對象作為研究樣本,預測了2008年我國出口貿易總額及抽樣方差,同時與簡單隨機抽樣的效果進行了對比,結果發現PPS抽樣方法在總體單元之間差異比較大的情況下,能夠取得很好的估計效果。 論文關鍵詞:PPS抽樣,簡單隨機抽樣,出口 一、引言 自2001年中國加入WTO以來,我國的對外貿易得到了飛速的發展,從2000年,我國的進出口總額4743億美元,到2008年則高達25632億美元,比2000年增長了5倍多,進出口貿易總額以年均16.3%的速度增長,大大超過了同期國民經濟的年均約11%的增長速度。其中,出口貿易作為拉動我國經濟增長的三駕馬車之一,對促進我國綜合國力的提高和保持整個國民經濟健康穩定發展的作用日趨顯著。正因為目前的中國經濟對國際市場的依賴程度越來越深,為保證宏觀經濟的持續穩定增長。出口貿易的增長問題正受到前所未有的關注。本文通過對我國31個省市自治區的貨物進出口總額進行不等概率抽樣(PPS抽樣),抽取了8個省市作為研究樣本,以此來預測2008年我國各地區出口貿易總額及抽樣方差,并與簡單隨機抽樣的預測結果進行比較,以期得到較為準確的預測結果,為宏觀決策層更準確地把握各項促進出口政策的實施力度提供依據。 二、PPS抽樣方法簡介 從抽樣發展的歷史來看論文服務,最初提出的是代表性樣本,這是一種主觀有意識的抽樣。但是,這種方法無法計算抽樣誤差,因此進一步發展到等概率隨機抽樣,以使總體中的每一個單元處于平等地位,有同樣的機會被抽中,從而可以科學地計算和控制抽樣誤差。當總體單元之間的差異不大時,簡單隨機抽樣是簡便的、有效地。但是當總體單元之間的差異非常大時,簡單隨機抽樣效果并不好,例如,要反映一個城市的經濟發展情況,大型企業對城市的影響是比較大的,因而在抽樣中是否抽中這些企業,對推斷總體的結果也有很大影響。而對一些名不見經傳的小企業是否抽中則無足輕重,因而在抽樣中如果把它們處在同等地位,顯然也是有缺陷的。因此就需要引入不等概率抽樣。 1、不等概率抽樣的基本含義 不等概率抽樣是指在抽取樣本前給總體的每一個單元賦予一定的被抽中概率。不等概率抽樣分為放回與不放回兩種情況。在有放回的不等概率抽樣中,最常用的是按總體單元的規模大小來確定抽選的概率。設總體中第個單元的規模度量為,總體的總規模度量為,則該單元的抽選概率應為。這種不等概率抽樣稱作按與規模大小成比例的概率抽樣,英文為probability proportional to size,簡稱PPS抽樣。但是,總體單元大小的度量往往不止一個,比如度量一個企業的大小,可以是資金大小,也可以是產值或銷售額的大小,還可以是人員的多少,因此通常用表示規模大小的抽選概率。由于每個單元均有被抽中的概率,,因此也稱作PPZ抽樣。 2、PPS抽樣的實施方法 PPS抽樣的實施方法有累積總和法、拉希里方法、規模累積等距抽選的方法和分裂法,本文這里選用規模累積等距抽選的方法。這種方法是在累積和的基礎上采取等距抽樣的方法。具體如下: 設總體單元數為,其規模度量分別為,論文服務,…,,進行累積,直至。若欲抽取樣本的容量為n,則先求得等距抽樣的間隔,然后在之間隨即等概率抽取一個數,假設為,則所在的單元代碼區間相應的單元即為被抽中的單元。以后每隔個度量值,即等數字所在的單元代碼區間的相應單元,即為被抽中的單元。 這種抽樣方法的特點是當所有單元的度量時,它是不重復的抽樣;當某個時,則第i個單元有可能被重復抽中;當時,則第個單元肯定會被重復抽中。這種方法抽取樣本比較容易,每個單元的被抽中概率與的大小成比例,因而在我國得到廣泛的應用。 3.Hansen-Hurvitz估計量 (1)總體總量的估計 1943年,漢森和赫維茨對PPS抽樣提出了估計總體總量的估計量為: 其中為入樣的第個單元的變量值,為第個單元根據其規模大小的入樣概率。通常情況下若以該單元包含的元素單位為度量時,,其中,是總體總量的一個無偏估計量。 (2)方差估計量為: 三、實證分析 1、數據收集與處理 各地區按經營單位所在地分貨物出口總額 單位:萬美元
地區
2007年
2008年
地區
2007年
2008年
全 國
121777576
143069307
河 南
837492
1071890
北 京
4892639
5749961
湖 北
817294
1170891
天 津
3807405
4210299
湖 南
651540
841288
河 北
1700041
2400412
廣 東
36931609
40566447
山 西
653249
925312
廣 西
510916
734744
內蒙古
294439
359185
海 南
136446
158720
遼 寧
3532409
4206950
重 慶
450721
572205
吉 林
385706
477163
四 川
860596
1313249
黑龍江
1225712
1680624
貴 州
146547
190078
上 海
14384611
16914514
云 南
476828
498441
江 蘇
20360978
23802941
西 藏
32636
70757
浙 江
12826397
15429623
陜 西
467525
538082
安 徽
881373
1136411
甘 肅
165866
160135
福 建
4993757
5699184
青 海
38591
41910
江 西
544459
772666
寧 夏
108567
125837
山 東
7511011
9319479
新 疆
1150217
1929910
表1中為2007年與2008年各地區按經營單位所在地分貨物出口總額的原始數據,根據2007年貨物出口總額采用PPS等距抽樣法抽取13個省市做樣本,以2007年貨物出口總額作為規模,并進行累計,得下表。
地區
2007年出口額
累積和
代碼范圍
地區
2007年出口額
累積和
代碼范圍
北 京
4892639
4892639
1~4892639
湖 北
817294
79648972
78831679~79648972
天 津
3807405
8700045
4892640~8700045
湖 南
651540
80300512
79648973~80300512
河 北
1700041
10400085
8700046~10400085
廣 東
36931609
117232121
80300513~117232121
山 西
653249
11053334
10400086~11053334
廣 西
510916
117743036
117232122~117743036
內蒙古
294439
11347774
11053335~11347774
海 南
136446
117879482
117743037~117879482
遼 寧
3532409
14880183
11347775~14880183
重 慶
450721
118330203
117879483~118330203
吉 林
385706
15265888
14880184~15265888
四 川
860596
119190799
118330204~119190799
黑龍江
1225712
16491601
15265889~16491601
貴 州
146547
119337345
119190800~119337345
上 海
14384611
30876211
16491602~30876211
云 南
476828
119814173
119337346~119814173
江 蘇
20360978
51237189
30876212~51237189
西 藏
32636
119846810
119814174~119846810
浙 江
12826397
64063587
51237190~64063587
陜 西
467525
120314334
119846811~120314334
安 徽
881373
64944960
64063588~64944960
甘 肅
165866
120480200
120314335~120480200
福 建
4993757
69938717
64944961~69938717
青 海
38591
120518791
120480201~120518791
江 西
544459
70483176
69938718~70483176
寧 夏
108567
120627359
120518792~120627359
山 東
7511011
77994187
70483177~77994187
新 疆
1150217
121777576
120627360~121777576
河 南
837492
78831678
77994188~78831678
將除以樣本量,得到抽樣間隔。在之間抽一隨機數R=2751684,處于北京的代碼范圍,因此北京作為抽中的樣本。按照規模累積等距抽樣法,依次抽到其他省市,分別是遼寧、上海、江蘇、浙江、福建、山東、廣東。其中廣東作為出口大省被重復抽中4次,則廣東省應入樣4次,應計量4次;上海、江蘇分別被抽中2次,則各入樣2次論文服務,應計量2次。即總共8個省市入選。 2、總體總量的估計 這8個省市被抽選的概率為,分別為北京0.0402、遼寧0.0290、上海0.1181、江蘇0.1672、浙江0.1053、福建0.0410、山東0.061678、廣東0.3033,用這8個樣本省市來估計2008年全國出口貿易總額,采用漢森—赫維茨估計量,由公式得: 故估計推斷,全國31個省市2008年出口貿易總額為140837723萬美元。 抽樣的方差: 置信度為95%的置信區間為: 即:所以置信區間為(137718364.1~143957081.9) 2008年,這31個省市的實際出口貿易總額為143069307萬美元,位于置信區間內。 3、與簡單隨機抽樣估計方法的比較分析 (1) 基于簡單隨機抽樣的估計 用隨機數抽取13個地區作為樣本,具體如下所示:
地區
2008年出口額
地區
2008年出口額
天津
4210299
山東
9319479
河北
2400412
湖北
1170891
內蒙古
359185
湖南
841288
上海
16914514
重慶
572205
江蘇
23802941
四川
1313249
福建
5699184
云南
498441
青海
41910
總體總量估計: 總體方差估計: 置信度為95%的置信區間為即 所以置信區間為(63437605.68~256787614.32) 將上面兩種方式估計的結果匯總到下表:
抽樣方式
總體總量的估計量
總體方差的估計值
95%的置信區間
簡單隨機抽樣
160112610
(63437605.68~256787614.32)
PPS抽樣
140837723
(137718364.1~143957081.9)
實際值
143069307
四、小結 通過對2007年我國31個省市自治區出口貿易額進行PPS抽樣,估計出2008年全國出口貿易總額為140837723,置信區間為(137718364.1~143957081.9),而2008年實際值為143069307,在置信區間內。通過與簡單隨機抽樣方法的比較可以看出,無論是總體總量的估計還是抽樣誤差,PPS抽樣的效果都優于簡單隨機抽樣。所以,對于總體單元之間差異非常大時,用PPS抽樣可以的到更好的估計效果。