人口普查數(shù)據(jù)有疑問???
時間:2021-08-19 16:06:06
手機(jī)看文章
掃描二維碼
隨時隨地手機(jī)看文章
[導(dǎo)讀]前幾天,人口普查數(shù)據(jù)終于出來了,千呼萬喚之下。我觀察了一下,數(shù)據(jù)出來了之后,我所在的幾乎每個微信群都在聊人口普查的數(shù)據(jù)。在知乎上這個問題也霸占了一天的熱榜第一名,到現(xiàn)在還在第一名??梢?,大家對于國家大事有多關(guān)心,這是好事。我作為數(shù)據(jù)分析自然也是對這個事情很關(guān)注,昨天我也刷了很久的...
前幾天,人口普查數(shù)據(jù)終于出來了,千呼萬喚之下。
我觀察了一下,數(shù)據(jù)出來了之后,我所在的幾乎每個微信群都在聊人口普查的數(shù)據(jù)。
在知乎上這個問題也霸占了一天的熱榜第一名,到現(xiàn)在還在第一名。
可見,大家對于國家大事有多關(guān)心,這是好事。
我作為數(shù)據(jù)分析自然也是對這個事情很關(guān)注,昨天我也刷了很久的別人寫的分析帖子。
其實(shí)大家都寫的差不多,人口老齡化問題、城鎮(zhèn)化問題、城市衰落問題、教育問題。
這些估計(jì)大家也都看爛了,我也不想說了。
但是在這些帖子里面,有一個帖子,格外的火。是由某個公眾號號主發(fā)出來的,在短時間內(nèi)就達(dá)到了10萬加。
這個號主也是挺「專業(yè)」的,他把歷年所有人口普查的數(shù)據(jù)拿了出來,從1990年到2020年,算了一下總?cè)丝诤驮隽?,發(fā)現(xiàn)了一個不得了的事情。
大家通過上面這個數(shù)據(jù)能看到從1990到2019年人口的增量處于一直下降的狀態(tài)。
從2016年國家開放二胎之后,人口增量略有增加。
但是2020年人口增量突然來到了1173萬,
如果往前面的五年看,最多的人口增量也才809萬,在整體下降的趨勢下,怎么可能突然跑出來這么一個數(shù)據(jù)。
結(jié)合之前人口普查的數(shù)據(jù)一直拖了很久才發(fā)出來,這個號主認(rèn)為,這個人口普查的數(shù)據(jù)是有很大的問題的!統(tǒng)計(jì)局肯定在搞鬼!這么明顯的數(shù)據(jù)錯誤!
于是很多人相信他,幫他轉(zhuǎn)發(fā),包括我身邊有一些高學(xué)歷的朋友,甚至開始我都被帶偏了。
由此可見,在煽動情緒上,這位真的是大牛。
但是,這個數(shù)據(jù)果真有問題嗎?其實(shí)不然。
我們看這個表格需要知道一個前提,國家人口普查的數(shù)據(jù)是這樣統(tǒng)計(jì)的:
每逢0年,100%人口普查(比如2010、2020年)
每逢5年,百分之一抽樣普查(比如2015、2005年)
其他年份,千分之一抽樣普查
那么這個抽樣普查是怎么進(jìn)行的呢?統(tǒng)計(jì)局曾經(jīng)發(fā)過2015年百分之一抽樣調(diào)查的抽樣方法:
1%人口抽樣調(diào)查以全國為總體,以各地級市為子總體(其中各地級市的樣本量來自于各地級市常住人口的平方根占所屬省的比例乘省的樣本量),全國分省、地級市采取分層、二階段、概率比例、整群抽樣方法,第一階段抽取村級單位,第二階段抽取調(diào)查小區(qū)。
也就是除了0年之外,其他年份的最終人口普查數(shù)據(jù),都是根據(jù)模型推斷出來的。
我們知道,但凡是模型都會有誤差,但是只要誤差控制在合理范圍內(nèi)都是能接受的。
統(tǒng)計(jì)局同樣也知道有這樣的誤差,所以在《2015年全國1%人口抽樣調(diào)查工作細(xì)則》中也特別提醒道:
樣本設(shè)計(jì)要求全國出生率、死亡率、城鎮(zhèn)化率的相對誤差分別控制在0.6%、0.8%、0.9%左右。
這里對人口增量的誤差范圍,沒有特殊說明,我們就假設(shè)他應(yīng)該符合最嚴(yán)格的誤差要求,就是0.6%.
那么讓我們繼續(xù)回到上面的表格,人口增量2020年是1173萬,前面的幾年是500萬左右。
以2020年普查的數(shù)據(jù)為準(zhǔn),前幾年的抽樣調(diào)查的平均數(shù)據(jù)誤差在700萬,而700萬相對于總?cè)丝?4億,誤差是0.5%,仍然在誤差范圍內(nèi)。
其實(shí)100%人口普查的方式和百分之一乃至千分之一的統(tǒng)計(jì)口徑、統(tǒng)計(jì)方法本身就是有差異的,如果直接拿來對比必然是存在問題的。
所以再回到上面那篇文章,那位博主的觀點(diǎn),是存在很大問題的。
數(shù)據(jù)能夠讓我們看清這個世界。
但是如果落到一些別有用心的人手里,也可能讓我們被帶偏了。
我觀察了一下,數(shù)據(jù)出來了之后,我所在的幾乎每個微信群都在聊人口普查的數(shù)據(jù)。
在知乎上這個問題也霸占了一天的熱榜第一名,到現(xiàn)在還在第一名。
可見,大家對于國家大事有多關(guān)心,這是好事。
我作為數(shù)據(jù)分析自然也是對這個事情很關(guān)注,昨天我也刷了很久的別人寫的分析帖子。
其實(shí)大家都寫的差不多,人口老齡化問題、城鎮(zhèn)化問題、城市衰落問題、教育問題。
這些估計(jì)大家也都看爛了,我也不想說了。
但是在這些帖子里面,有一個帖子,格外的火。是由某個公眾號號主發(fā)出來的,在短時間內(nèi)就達(dá)到了10萬加。
這個號主也是挺「專業(yè)」的,他把歷年所有人口普查的數(shù)據(jù)拿了出來,從1990年到2020年,算了一下總?cè)丝诤驮隽?,發(fā)現(xiàn)了一個不得了的事情。
大家通過上面這個數(shù)據(jù)能看到從1990到2019年人口的增量處于一直下降的狀態(tài)。
從2016年國家開放二胎之后,人口增量略有增加。
但是2020年人口增量突然來到了1173萬,
如果往前面的五年看,最多的人口增量也才809萬,在整體下降的趨勢下,怎么可能突然跑出來這么一個數(shù)據(jù)。
結(jié)合之前人口普查的數(shù)據(jù)一直拖了很久才發(fā)出來,這個號主認(rèn)為,這個人口普查的數(shù)據(jù)是有很大的問題的!統(tǒng)計(jì)局肯定在搞鬼!這么明顯的數(shù)據(jù)錯誤!
于是很多人相信他,幫他轉(zhuǎn)發(fā),包括我身邊有一些高學(xué)歷的朋友,甚至開始我都被帶偏了。
由此可見,在煽動情緒上,這位真的是大牛。
但是,這個數(shù)據(jù)果真有問題嗎?其實(shí)不然。
我們看這個表格需要知道一個前提,國家人口普查的數(shù)據(jù)是這樣統(tǒng)計(jì)的:
每逢0年,100%人口普查(比如2010、2020年)
每逢5年,百分之一抽樣普查(比如2015、2005年)
其他年份,千分之一抽樣普查
那么這個抽樣普查是怎么進(jìn)行的呢?統(tǒng)計(jì)局曾經(jīng)發(fā)過2015年百分之一抽樣調(diào)查的抽樣方法:
1%人口抽樣調(diào)查以全國為總體,以各地級市為子總體(其中各地級市的樣本量來自于各地級市常住人口的平方根占所屬省的比例乘省的樣本量),全國分省、地級市采取分層、二階段、概率比例、整群抽樣方法,第一階段抽取村級單位,第二階段抽取調(diào)查小區(qū)。
也就是除了0年之外,其他年份的最終人口普查數(shù)據(jù),都是根據(jù)模型推斷出來的。
我們知道,但凡是模型都會有誤差,但是只要誤差控制在合理范圍內(nèi)都是能接受的。
統(tǒng)計(jì)局同樣也知道有這樣的誤差,所以在《2015年全國1%人口抽樣調(diào)查工作細(xì)則》中也特別提醒道:
樣本設(shè)計(jì)要求全國出生率、死亡率、城鎮(zhèn)化率的相對誤差分別控制在0.6%、0.8%、0.9%左右。
這里對人口增量的誤差范圍,沒有特殊說明,我們就假設(shè)他應(yīng)該符合最嚴(yán)格的誤差要求,就是0.6%.
那么讓我們繼續(xù)回到上面的表格,人口增量2020年是1173萬,前面的幾年是500萬左右。
以2020年普查的數(shù)據(jù)為準(zhǔn),前幾年的抽樣調(diào)查的平均數(shù)據(jù)誤差在700萬,而700萬相對于總?cè)丝?4億,誤差是0.5%,仍然在誤差范圍內(nèi)。
其實(shí)100%人口普查的方式和百分之一乃至千分之一的統(tǒng)計(jì)口徑、統(tǒng)計(jì)方法本身就是有差異的,如果直接拿來對比必然是存在問題的。
所以再回到上面那篇文章,那位博主的觀點(diǎn),是存在很大問題的。
數(shù)據(jù)能夠讓我們看清這個世界。
但是如果落到一些別有用心的人手里,也可能讓我們被帶偏了。