
人們一直對平均數(shù)深信不疑,最經(jīng)典的就是簡單算數(shù)平均數(shù),以為這個公式算出的結(jié)果就是對的,真的嗎?給大家一個實際的例子,大家就會知道,“數(shù)據(jù)”這個東西絕對不是幾個學(xué)過編程的人,代入幾個公式就可以搞明白的。數(shù)據(jù)需要分析才能得出正確的結(jié)果。
以下是本人2010年發(fā)表在《中國經(jīng)營報》的小文。
新房價統(tǒng)計方法有數(shù)據(jù)陷阱
劉德寰
國家統(tǒng)計局最近公布了《住宅銷售價格統(tǒng)計調(diào)查方案(征求意見稿)》,這是一個歷史性的進步,說明統(tǒng)計局不再我行我素不考慮社會的觀點了。該調(diào)查方案有兩點進步:給出了房價計算的基本公式,透明度增加;在資料收集方法上進行了大的改進。但筆者詳細驗證后發(fā)現(xiàn),這些改進無法使房價計算更加科學(xué),還會導(dǎo)致嚴重失真的結(jié)果,甚至可能繼續(xù)出現(xiàn)類似“2009年70個大中城市房屋銷售價格上漲1.5%”等讓人匪夷所思的統(tǒng)計數(shù)據(jù)。
我們以“本月及上月平均價格計算公式”(見“住宅銷售價格統(tǒng)計調(diào)查方案公開征求意見”)為例,來考察統(tǒng)計局房價計算方式存在的問題。
在統(tǒng)計局現(xiàn)有房價計算方式中,“新建住宅銷售價格指數(shù)”的計算步驟為:第一,計算某一新建住宅樓盤90平方米及以下、90平方米~144平方米、144平方米以上三個基本分類的環(huán)比指數(shù);第二,采用雙加權(quán)計算全市三個基本分類的環(huán)比指數(shù),即分別利用本月銷售面積和金額作為權(quán)數(shù)計算價格指數(shù),然后將兩個價格指數(shù)再簡單平均;第三,計算保障性住房環(huán)比價格指數(shù),計算方法與商品住宅基本分類計算方法一致。
這一房價計算方式有兩個嚴重問題:一是所謂樓盤的三個基本分類,其分類方式不合理,我們知道,同樣是90平方米的房子,城市中心與城市邊緣的價格差異非常大,這樣簡單的三個分類,方法武斷而且沒有分析意義;二是“利用本月銷售面積和金額作為權(quán)數(shù)計算價格指數(shù)”,這一定會陷入到數(shù)據(jù)陷阱之中。我們舉一個數(shù)據(jù)的例子來說明這個問題:
該城市最近三個月的銷售與價格情況
第一月 |
銷售總平米 |
成交均價 |
銷售額 |
甲區(qū) |
50000 |
30000 |
1500000000 |
乙區(qū) |
30000 |
25000 |
750000000 |
丙區(qū) |
40000 |
18000 |
720000000 |
丁區(qū) |
20000 |
17000 |
340000000 |
合計 |
140000 |
|
3310000000 |
第二月 |
銷售總平米 |
成交均價 |
銷售額 |
甲區(qū) |
20000 |
33000 |
660000000 |
乙區(qū) |
30000 |
27500 |
825000000 |
丙區(qū) |
50000 |
19800 |
990000000 |
丁區(qū) |
40000 |
18700 |
748000000 |
合計 |
140000 |
|
3223000000 |
第三月 |
銷售總平米 |
成交均價 |
銷售額 |
甲區(qū) |
5000 |
36300 |
181500000 |
乙區(qū) |
10000 |
30250 |
302500000 |
丙區(qū) |
40000 |
21780 |
871200000 |
丁區(qū) |
50000 |
20570 |
1028500000 |
合計 |
105000 |
|
2383700000 |
假設(shè)一個城市中,按照90平方米以下新房屋基本平均銷售價來看,甲、乙、丙、丁四個區(qū)域價格不同,距離城市中心依次越來越遠,最近三個月所有區(qū)域成交均價每個月都上漲了10%,但是四個區(qū)域的新房銷售結(jié)構(gòu)在這三個月中是不同的(以北京為例,三環(huán)以內(nèi)新房供應(yīng)越來越少,四環(huán)以內(nèi)也在減少,五環(huán)之內(nèi)有所增加,六環(huán)之內(nèi)大量增加)。
沒有學(xué)過統(tǒng)計的人都能夠看出,這個城市最近三個月房價最終上漲了21%,但是統(tǒng)計局的計算公式是以整個城市新房總成交價除以城市銷售總面積,算出所謂的“成交均價”,因為前面提到的低價房銷售面積上升、高價房銷售面積下降的原因,就會發(fā)現(xiàn)這樣算出的三個月的成交均價分別為:23642.857元、23021.429元、22701.9元,房價分別下跌了2.63%和1.39%,合計下跌4 %。“21%”與“-4%”,多么可怕的差異!
如果還是這個銷售結(jié)構(gòu),每個區(qū)域每月成交均價都上漲15%,三個月房價實際上漲了32%以上,但是按照統(tǒng)計局的計算公式,房價分別上漲了1.8%和3%,合計上漲5%左右。
還是在這個銷售結(jié)構(gòu)中,每個區(qū)域每月成交均價都上漲20%,三個月房價實際上漲了44%,但是按照統(tǒng)計局的計算公式,房價分別上漲了6.22%和7.58%,合計上漲15%左右。
這說明統(tǒng)計局的計算方式存在嚴重失誤。因為它以銷售結(jié)構(gòu)決定房價上升與下降,而不是以房價漲跌本身來決定,這是在數(shù)據(jù)分析中最常見的一種數(shù)據(jù)陷阱。如果未來我們國家關(guān)于房價計算的方式存在這么大的失誤,會嚴重影響決策部門對真實樓市情況的了解,誤導(dǎo)公眾。
上述問題不僅僅是統(tǒng)計部門犯的錯誤,也是建設(shè)部門和一些所謂的房價監(jiān)控部門犯的錯誤。中國房價計算方式需要大的改進。