人口學研究方法:規(guī)范與發(fā)展
認識人口與計劃生育統(tǒng)計的特點 避免統(tǒng)計方法和數(shù)據(jù)的誤用
由于工作關系和職業(yè)習慣,筆者對各種各樣有關人口和計劃生育的工作報告、分析文章中的統(tǒng)計方法和統(tǒng)計數(shù)據(jù)比較關注,經(jīng)??梢园l(fā)現(xiàn)統(tǒng)計方法和統(tǒng)計數(shù)據(jù)被誤用的情況。本文通過一些實例,分析由于不了解人口和計劃生育的特點而造成統(tǒng)計方法和數(shù)據(jù)誤用的情況。
1 個案與群體
〔實例1〕某調(diào)查報告稱,某村2001年出生嬰兒10人,其中男嬰6人,女嬰4人,出生性別比高達150,嚴重失調(diào)。
〔實例2〕某鄉(xiāng)給某村下達人口計劃,其中一項指標是計劃生育率,要求當年的計劃生育率不低于95%,而該村一般每年出生不足20人。
〔實例3]某地計生委根據(jù)群眾舉報,查出某縣一個超生5胎的情況,據(jù)此稱該縣超生問題嚴重。
〔實例4〕某縣總?cè)丝诓蛔?0萬人,近年來在孕婦中推廣服用“福施福”。上級要求檢查服用“福施福”后,人口缺陷發(fā)生率是否逐年下降。還有不少地方把孕產(chǎn)婦死亡率是否逐年下降當作生殖健康服務工作的考核內(nèi)容。
這幾個例子所出現(xiàn)的問題都是以個案或少量發(fā)生的情況,說明一個地方宏觀的情況。人口和計劃生育統(tǒng)計所分析的對象(人口)或事例具有群體性,這個群體是由每個個體的人或事件集合而成。每個個體是否發(fā)現(xiàn)這種現(xiàn)象是偶然的,作為表現(xiàn)群體規(guī)律的統(tǒng)計數(shù)據(jù),只有當群體具有相當?shù)囊?guī)模后才有意義。群體的規(guī)模太小,盡管對每個個體的統(tǒng)計是準確的,指標的計算也是正確的,但計算結(jié)果并不能客觀地反映群體的規(guī)律。
如實例1,一個村的出生人數(shù)僅為10人,計算的出生性別比要么是100(“絕對平衡”),要么就是男女比例嚴重失調(diào)。實例2中計劃生育率受出生總數(shù)的影響,要么計生率正好100%,只要有一個計劃外出生,計劃生育率就低于95%。例4涉及的出生缺陷發(fā)生率或孕產(chǎn)婦死亡率一般統(tǒng)計時均以10萬作為分母,對于一個縣,每年出生幾千人或1萬多人,即使按照出生缺陷、孕產(chǎn)婦死亡發(fā)生的平均水平,每年也只有幾例,偶然性很大,在統(tǒng)計數(shù)據(jù)上很難表現(xiàn)為逐年下降。至于例 3,以一個特例說明全縣的情況,更是欠妥。各種人口和計劃生育統(tǒng)計教材上并未說明各項統(tǒng)計指標適用的人群至少要達到多少,但一般說來這些統(tǒng)計指標絕大部分不能用于分析規(guī)模在幾百人到一千多人的村級情況,許多指標在縣、鄉(xiāng)級使用也不太合適。多年來各級是通過報表收集人口和計劃生育統(tǒng)計數(shù)據(jù)。報表由上級制發(fā),基層單位按統(tǒng)一的口徑填報每個項目,然后逐級匯總、上報。這樣以來,上、下級的報表式樣相同,只是數(shù)量大小有差別,于是,上級單位計算哪些指標,下級單位 “照葫蘆畫瓢”計算相同指標。特別是實行人口與計劃生育目標管理責任制后,各項工作任務和責任要逐級分解、落實,相應地,工作指標也被層層分解,上一級控制的指標(如出生率、計劃生育率)也被一直套用到基層單位。在這種情況下,群體性的要求很容易被忽視。
2 自然屬性與社會屬性
〔實例5〕1995年8月,在全國上半年人口形勢分析會上,某省計生委分析本省當年上半年二孩出生數(shù)量比上一年同期減少的原因時稱,由于自當年起全省廣泛推行“三結(jié)合”,許多群眾為了發(fā)家致富,主動退出二孩指標,于是二孩出生明顯減少。筆者的同事立即對此理由提出了置疑:既然是主動退出二孩指標導致二孩出生減少,那么原來應在1995年上半年生育二孩的婦女至少在1994年上半年就應退出二孩指標,而那時候,該省并未開展計劃生育“三結(jié)合”;至于 1995年上半年開展“三結(jié)合”后退出的二孩指標,其二孩出生減少的效果應在1996年以后才能表現(xiàn)出來。群眾退出二孩指標與二孩出生數(shù)量的減少在時間上出現(xiàn)了“矛盾”。
〔實例6〕許多文章分析婦女受教育程度越高,生育的孩子越少。
這兩個例子說明分析人口出生數(shù)量的變化應考慮人口的自然屬性和社會屬性。人口首先是生物意義上的人口,具有自然屬性,同時,人口生活、存在于一定的社會環(huán)境中,具有社會屬性。人口現(xiàn)象的發(fā)生既受自然屬性的影響,也受社會屬性的影響。從根本上說,社會屬性對人口現(xiàn)象的影響和制約是有條件的、間接的。而自然屬性的影響和制約是無條件的、直接的。社會屬性的影響和制約常常要通過自然屬性來實現(xiàn)。在分析人口現(xiàn)象的時候,首先要解釋人口的自然屬性,然后再解釋社會屬性。就實例5而言,從婦女退出二孩指標到二孩出生減少,至少間隔10個月,即婦女的懷孕期,無論推行“三結(jié)合”力度多大,婦女10個月的懷孕期不能縮短。退指標的發(fā)生與出生數(shù)的減少在時間上不“同步”,至少要“滯后”一年。也就是說,1995年上半年因開展“三結(jié)合”婦女退出二孩生育指標不會影響這個時期的二孩出生數(shù)量。關于實例6,一個人的受教育程度屬于社會屬性,婦女受教育水平提高,的確會影響其生育行為。然而,影響生育的自然因素,直接因素是避孕節(jié)育行為,具體地說,影響生育的生物因素包括推遲結(jié)婚(不發(fā)生性行為)、采取避孕措施和流產(chǎn)(終止妊娠)。婦女文化程度影響到上述生物因素發(fā)生變化(如文化程度高,能夠更好地掌握避孕知識,可以提高避孕的有效性,減少懷孕的可能),并通過上述因素影響生育孩子的數(shù)量。直接講文化程度與孩子數(shù)量的關系,未免有些牽強。
3 定量與定性
〔實例7〕各地每年都要分析當年的人口形勢,將當年的數(shù)據(jù)與上一年的數(shù)據(jù)進行對比。許多分析報告在列舉了對比數(shù)據(jù)后得出結(jié)論:“今年的工作比上一年有明顯的進步,取得了巨大的成績,上了一個新臺階”。但如果我們仔細察看各項指標的數(shù)量,發(fā)現(xiàn)變化并不大,如計劃生育率由88.5%上升到89%,出生率由15.4‰下降為14.9‰(這其中由于人口年齡結(jié)構(gòu)的變化也能導致出生率下降),多孩出生由165人減少為149人,多孩率由2.2%下降為2%等等。根據(jù)這些數(shù)據(jù)的變化,得出的定性結(jié)論應當是:“工作穩(wěn)步發(fā)展,人口增長保持平穩(wěn)的態(tài)勢”。人口和計劃生育的統(tǒng)計分析主要是指對數(shù)據(jù)的分析,并由“定量”的描述引申到定性的判斷。如果忽視定性的分析,那么,所謂定量分析不過是數(shù)量變化的文字描述而已。把握好定性分析的關鍵在于,定性分析應以定量分析為基礎,即“定量”在前,“定性”在后。那種先“定性”,再計算數(shù)量變化的做法,違背了“定量”與“定性”的基本規(guī)律。這樣進行的定量分析,只是給定性的結(jié)論加一些數(shù)量的點綴。
4 模糊和精確
〔實例8〕某地區(qū)的一份材料稱,根據(jù)20年來每年總和生育率的變化,推算本地區(qū)20年來少生了1831275人。
〔實例9〕某縣計生委利用農(nóng)村趕集日人口比較集中的機會,出動服務車,設置咨詢臺,向群眾宣傳計劃生育知識,提供咨詢服務??h計生委的匯報材料稱,“一個月來在集日上接受宣傳、咨詢的群眾累計達到127328人次”。
乍一看,實例8和實例9中的人數(shù)和人次數(shù)的統(tǒng)計和計算十分認真仔細,數(shù)字如此精確,令人欽佩。但轉(zhuǎn)念一想,不免生疑:實例8中利用總和生育率計算少生人口,需要以年齡別生育率與分年齡婦女人數(shù)相乘計算出生人數(shù),一般來看,每個年齡組的計算結(jié)果都不會是整數(shù),只好四舍五入。每一年若干個年齡組累計下來,個位數(shù)已經(jīng)含糊不清了。再把20年的少生人數(shù)累計起來,怎么可能精確到個位數(shù)呢?況且20年間,該地區(qū)的人口并非處于“封閉狀態(tài)”,各年齡組人數(shù)因為人口遷移而變化,也會影響到計算少生的數(shù)量。至于實例9,在一個開放的、人們頻繁走動的集市上,如何判定哪個人接受了宣傳,哪個人接受了咨詢,并沒有一個客觀的標準;即使有標準,實際操作中也很難把握,因此,根本沒有可能逐人統(tǒng)計。實例8、實例9中看似精確的數(shù)據(jù)令人感到滑稽,倒不如模糊一些,說“20年大約少生了18萬人”,“一個月在集市上接受了計劃生育宣傳、咨詢服務的人次達10余萬”,或許有幾分可信。從某種意義上講,人口和計劃生育所涉及的是宏觀層面的事情,與此相應的統(tǒng)計數(shù)據(jù)所反映的是大致的狀態(tài)或趨勢,沒有必要也沒有可能做到精確。許多同志在應用統(tǒng)計方法時,往往注意的是方法本身的定義和計算過程,而對計算中數(shù)據(jù)的來源不了解。人口和計劃生育統(tǒng)計屬于社會經(jīng)濟統(tǒng)計范疇,很多數(shù)據(jù)是通過抽樣調(diào)查獲得,允許有一定的誤差;即使是全面的調(diào)查(如人口普查、全局報表),在實施過程中,也會遇到這樣、那樣的干擾或影響,存在著調(diào)查誤差,這是無法完全避免的。從某種意義上講,數(shù)據(jù)存在一定的誤差,這是人口和計劃生育統(tǒng)計的特點之一。
5 原因與結(jié)果
〔實例10〕最典型的例子莫過于“人口出生率每降低1個千分點,人均GDP提高多少個百分點”的說法。這種說法的依據(jù)是利用相關分析法對全國各省的人口出生率和人均GDP的數(shù)量變化進行計算,得出二者之間的函數(shù)關系式和相關系數(shù)。把人口出生率作為自變量,看自變量的單位變化影響因變量(人均GDP)變化的數(shù)量大小。
在這個例子中相關分析法本身以及有關的數(shù)據(jù)都是正確的,然而,用這樣一個函數(shù)式來解釋人口增長與經(jīng)濟增長的相互關系是有問題的。其一,就統(tǒng)計方法來說,相關分析只反映變量之間的相關關系,而不說明因果關系;其二,人口增長與經(jīng)濟增長固然相互影響,但從本質(zhì)上來說,是經(jīng)濟發(fā)展影響人們的思想,進而影響人們的生育行為,最終導致生育率下降,人口增長率降低,即經(jīng)濟增長是“因”,而人口增長是“果”。顛倒了因果關系,不僅邏輯上講不通,數(shù)量上的“相關性”也失去了意義。
筆者在多年的工作中體會到,由于人口和計劃生育所具有的特點,人口和計劃生育統(tǒng)計分析方法的應用和統(tǒng)計數(shù)據(jù)的解釋有別于其它部門和領域?qū)τ诮y(tǒng)計的一般要求。正確地應用統(tǒng)計分析有助于我們認識人口和計劃生育的特點和規(guī)律,只有科學地認識和把握人口和計劃生育的特點和規(guī)律,才能避免在統(tǒng)計分析中陷入誤區(qū)。
社會科學實證研究中的統(tǒng)計分析方法應用
鄭真真?。ū本┐髮W人口研究所 副教授)
統(tǒng)計學的應用隨著微型計算機的普及越來越廣泛,在社會科學實證研究中幾乎是無處不在。有了一定規(guī)模的數(shù)據(jù)和一個統(tǒng)計分析軟件,就可以很方便地進行各種估算和分析。然而由于統(tǒng)計分析方法本身并不像加減乘除那樣簡單,而一些統(tǒng)計分析軟件已經(jīng)發(fā)展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作并得到結(jié)果,可能出現(xiàn)對統(tǒng)計分析方法誤用或濫用的現(xiàn)象。本文僅對一些統(tǒng)計分析中比較常見的問題進行討論,以引起各方面的重視。
1 描述性統(tǒng)計
描述性統(tǒng)計是社會科學實證研究中最常用的方法。準確、全面、正確的描述是所有實證分析的基礎,如果對某個事件或某種現(xiàn)象的描述不清楚或存在偏差,那么其后的所有分析都將是值得懷疑的。一項研究能夠?qū)⑺芯康默F(xiàn)象或?qū)ο竺枋銮宄?,就是一個極大的貢獻;而描述的偏差可能會引起公眾或?qū)W術界對某些社會現(xiàn)象的誤解,甚至誤導政府決策。但是因為描述性統(tǒng)計所用方法簡單易得,往往沒有得到足夠的重視。
均值的局限 普遍用于描述樣本集中趨勢的測量之一是均值。它對于近似正態(tài)的對稱分布樣本來說是比較好的測量,對于不對稱分布則不然,尤其會受到極端值的影響。兩個分布完全不同的樣本可能會有相同的均值,因此均值在某種程度上抹殺了樣本內(nèi)部的差異,而往往這種內(nèi)部差異正是需要我們進行深入研究的、或應當引起人們注意的。為了彌補均值的這個缺陷,一般在報告均值的同時也報告方差,或用直方圖/散點圖的形式描述分布,以提請讀者注意群體內(nèi)部的差異。
不同群體的可比性 在描述性統(tǒng)計中,往往涉及到對不同時期或不同人群的總體描述,以反映社會變化或地區(qū)差異。在社會科學中、尤其是人口研究中,不少事件的發(fā)生都是與年齡密切相關的,如我國婦女大部分在35歲以前完成了生育,從而導致35歲以上育齡婦女中極高的避孕現(xiàn)用率。在這種情況下,兩個樣本之間存在避孕現(xiàn)用率的差異可能只是年齡結(jié)構(gòu)的差異,而不是年齡別避孕現(xiàn)用率的差異。又如在報告流動人口犯罪問題時,給人的印象往往是流動人口犯罪率高于常住人口,但忽視了流動人口的年齡和性別構(gòu)成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對兩個不同群體的比較往往會導致錯誤的結(jié)論。
絕對數(shù)的使用 由于中國人口數(shù)量巨大,調(diào)查研究也比較容易得到大容量的樣本,所以對任何小概率事件用絕對數(shù)報告都會出現(xiàn)驚人的巨大數(shù)字,單純對絕對數(shù)的強調(diào)往往會產(chǎn)生戲劇性的效果。比較合理的方式一般是在報告某事件絕對數(shù)的同時,給出該事件的發(fā)生率或占研究人群的比例。
小樣本的代表性 在一次抽樣的小樣本中求得的率或比例會非常不穩(wěn)定,與另一次抽樣的結(jié)果可能會有較大差距。因此當研究僅限于從小樣本獲得的資料時,應當在報告比例的同時也報告樣本量。
2 雙變量統(tǒng)計分析
在社會科學研究中,首先分析的往往是兩個變量之間的關系,如用相關或列聯(lián)表等方法。一般在確定兩個變量之間確實有某種關系,如在經(jīng)過統(tǒng)計檢驗后證實兩變量有顯著相關關系,進行更進一步的分析才有意義。因此,雙變量統(tǒng)計分析在實證分析中占有重要地位。但是,由于在應用中對有些問題的忽視,雙變量統(tǒng)計分析也很容易出現(xiàn)偏差或錯誤。
卡方檢驗的局限 在利用列聯(lián)表對兩個定序/定類變量進行相關分析時,需要進行統(tǒng)計檢驗來判斷兩個變量的相關是否有統(tǒng)計上的顯著意義。不少研究結(jié)果都用卡方檢驗的顯著性報告相關狀況。但值得注意的是,卡方統(tǒng)計量的計算本身是有局限性的,樣本越大,卡方值就會相應增大,因此大樣本的卡方檢驗很容易得到顯著結(jié)果。所以一般在報告卡方檢驗結(jié)果以說明兩變量是否顯著相關時,還應當同時報告相關強度,即相應的相關系數(shù),如 Gamma,Lambda等。
統(tǒng)計意義上的顯著與差別的實際意義 在檢驗兩個定距變量的均值差別是否具有統(tǒng)計上的顯著性時,也存在相似的問題。由于樣本量越大,樣本均值分布的方差就越小,因此常用的t檢驗結(jié)果就越可能顯著,任何細微的差別都可能有統(tǒng)計上的顯著性。但有時具有統(tǒng)計意義顯著性的差異,在實際生活中可能意義并不大,如同在兩個草堆之間找出一根草的差距,對判斷兩個草堆的大小沒有實際意義。因此,對任何檢驗結(jié)果都應當有符合實際的解釋和說明。
虛假相關問題 雙變量分析中的虛假相關問題,幾乎在所有關于社會科學研究方法的教科書中都會涉及到,在統(tǒng)計分析方法的教學中也被視為經(jīng)典問題。但是多少年來,人們?nèi)匀辉诓粩嗟刂貜椭@個“經(jīng)典的錯誤”,即認為可見的或統(tǒng)計檢驗結(jié)果顯著的相關就是真正的相關;更為大膽的做法是把這種相關關系推向因果關系。我們知道,對于有的變量來說,即使是經(jīng)過檢驗判定兩者具有統(tǒng)計上顯著的相關關系,也不一定存在實際意義上的關系,因為可能有未考慮到的變量或不可測量的變量在同時對兩個研究變量起作用,有時甚至可能完全是偶然的巧合。例如,火災的大小是以火災損失來衡量的,而參加滅火的消防員人數(shù)是與火災大小有關的,火災越大,出動的消防員就越多,但凡是具有常識的人都不會根據(jù)出動消防員人數(shù)和火災損失兩個變量之間的高度相關,斷定出動消防員越多火災損失就越大,因為火災的規(guī)模是決定因素(但很難直接衡量)。在有關人口科學研究中也有報告虛假相關的現(xiàn)象,如人口增長率的降低導致了經(jīng)濟增長的提法就是一例。因此,在分析相關關系時,應當根據(jù)理論、知識、經(jīng)驗、甚至常識來判斷這種分析是否有意義、是否存在其他變量的作用(稱為外在變量),避免得出有悖于常理的分析結(jié)果。有些虛假相關是可以通過統(tǒng)計分析方法判別的,如在控制了另外一些變量后觀察兩個變量的偏相關,或在雙變量分析的基礎上,進一步用多變量分析深入研究。
3 多變量分析
回歸分析是多變量分析中應用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應用。在眾多應用中,比較明顯的問題是使用方法是否得當和對結(jié)果的報告和解釋是否規(guī)范、合理(見2002年第2期《人口研究》劉金塘文)。此外還有一些應當引起注意的問題。
分析框架的重要性 在社會科學研究中,各變量之間往往存在錯綜復雜的關系,如果在進行回歸分析之前沒有一個清晰合理的分析框架,那么回歸的結(jié)果有可能會引起質(zhì)疑。一般應在報告回歸分析結(jié)果之前,介紹該分析的框架,如各變量的定義、各自變量與因變量的假設關系及其理由等,對建立的回歸模型做出合理性論證。有一些變量可能是作為控制變量納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對假設因果關系的模型,應當至少能夠說明:(1)該因果關系在理論上是正確的、在實踐中是合理的;(2)從事件發(fā)生的時間上來說,應當是原因發(fā)生在先、結(jié)果發(fā)生在后。如有些回歸分析中,未加說明即把所有與因變量顯著相關的變量都囊括在自變量中,甚至有些自變量與因變量有明顯的互為因果關系,顯得分析邏輯混亂;還有的論文在簡單介紹研究背景和數(shù)據(jù)來源之后,急于建立因果關系并推出回歸分析結(jié)果,然后再根據(jù)各變量在回歸模型中的顯著性一一說明,這相當于事后解釋;這些做法都是錯誤的。
在具備“奔4”微機和較易操作的軟件的今天,轉(zhuǎn)瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準備工作,包括文獻檢索和理論框架構(gòu)建,才能確保統(tǒng)計分析的科學性。
分析方法應用的條件 每種多變量方法都有各自的前提條件或假設,如果這些條件不具備或者假設不成立,該方法的應用就成問題。如Pearson相關是考察線性相關關系,多元方差分析只能辨別線性相關因變量的多元差異,線性回歸分析假設自變量與因變量之間為線性關系,因子分析方法也是建立在各變量具有一定的線性相關基礎之上的;另外,在邏輯斯蒂回歸中,每個分類都應保證有足夠的頻數(shù),如果頻數(shù)太少就會影響參數(shù)估計的穩(wěn)定性;等等。盡管一般不在報告分析結(jié)果時說明各種假設是否成立或條件是否滿足,但是在進行分析時應當自覺地進行考察。如果不能滿足條件或假設不能成立,就對數(shù)據(jù)進行轉(zhuǎn)換或調(diào)整后再分析,或者改變分析方法。
多變量分析結(jié)果的展示和解釋 多變量分析的結(jié)果一般是通過列表來展示的?,F(xiàn)在一種并不少見的做法是直接把統(tǒng)計軟件的輸出直接復制到論文中,我們往往會在文章中看到包括回歸參數(shù)估計、參數(shù)標準差、檢驗統(tǒng)計值、檢驗顯著性、偏相關系數(shù)等等n行m列的大表,使人有目不暇接的感覺。實際上參數(shù)標準差和檢驗統(tǒng)計值是提供給分析者的信息,沒有必要列在結(jié)果中;如果不是有特別需要的話,偏相關系數(shù)也不是關注重點;最主要的應當是回歸參數(shù)估計及其顯著性。
在列出分析結(jié)果之后,應當對結(jié)果的實際意義進行解釋和討論,而不是復述分析結(jié)果的數(shù)學意義。此外,在多元統(tǒng)計分析中一個常見的問題是分析者對變量作用不具有預期統(tǒng)計顯著性的失望,因此繞開不顯著的變量,甚至對數(shù)據(jù)或模型進行各種調(diào)整以獲得顯著結(jié)果。其實,統(tǒng)計分析結(jié)果不顯著往往也是有實際意義的。例如在分析我國高齡老人的地區(qū)分布時發(fā)現(xiàn),高齡老人比例與當?shù)蒯t(yī)療衛(wèi)生指標沒有顯著關系,這說明我國醫(yī)療系統(tǒng)還沒有具備延長老人壽命的功能;另一方面也說明這些高齡老人的存活不是主要靠醫(yī)藥維持的。所以,在解釋分析結(jié)果時,只要是在分析框架中涉及并參與分析的變量,無論作用顯著與否,都應當給予充分的討論;對于那些由于知識或信息的限制難以下結(jié)論的結(jié)果,可以作為問題提出,以便進行更有針對性的進一步研究。
此外,任何方法都有其局限性,分析結(jié)果也不會十分完美。因此在討論結(jié)果的同時,也應當就此向讀者說明。例如當一個多元線性回歸分析的確定系數(shù)較低時,需要指出該模型有限的解釋能力,探討可能存在但沒有納入分析的更重要的影響因素。
不必求最新、只求最合適 有些研究生在撰寫學位論文時,常常因為自己沒有應用最新的統(tǒng)計分析方法而感到忐忑不安;在評論某項研究的創(chuàng)新性時,有時也出現(xiàn)把學術創(chuàng)新和應用新方法混為一談的現(xiàn)象,例如認為應用描述性統(tǒng)計方法的研究水平低于應用解釋性或預測性方法的研究。新方法是層出不窮的。但是,出現(xiàn)了新方法并不意味著傳統(tǒng)方法就不再適用,而是各有千秋。統(tǒng)計分析方法是工具,哪件合適就用哪件,能用錘子解決的問題不必開沖床。有時越是復雜的方法,假設條件也會相應較多,應用的局限性更大。因此,盲目追求方法的新穎并不是高水平研究的保證,真正需要注意的是使用最合適的方法。而對所用方法的真正了解,是正確運用統(tǒng)計分析方法的前提。
總和生育率的內(nèi)在缺陷及其改進
郭志剛?。ū本┐髮W社會學系、北京大學中國社會與發(fā)展研究中心 教授)
1 總和生育率的應用目的及評價原則
年齡別生育率及其概括性指標總和生育率(TFR)是生育研究中最常用的指標體系。但是現(xiàn)在它們面臨很多實際問題。本文不討論出生漏報導致統(tǒng)計失實的問題,因為其性質(zhì)并不在于統(tǒng)計方法,而是一個社會問題。本文只局限于這一指標體系內(nèi)在的有效性問題的方法論討論。一個指標是否有效應該以研究目的為標準來判斷,因此這一討論將結(jié)合當前實際工作的需要來進行。
統(tǒng)計指標有兩種功能:一種是對調(diào)查對象本身特征的直接描述,另一種則用于推斷估計。很多情況下,統(tǒng)計指標同時承擔著這兩種功能,比如樣本統(tǒng)計量反映了樣本對象的特征,同時又服務于推斷估計總體參數(shù)。既然是一種估計,自然會有推斷偏差或誤差。評價不同估計的優(yōu)劣是看誰的偏差或誤差更小。
那么通常我們應用TFR到底要反映什么?一是為了在控制育齡婦女結(jié)構(gòu)的條件下概括時期生育水平,二是作為終身生育水平的估計。(注:在這一方面,總和生育率與人口的粗再生產(chǎn)率和凈再生產(chǎn)率的性質(zhì)類似,后兩個指標中只不過又控制了下一代的性別和死亡因素的影響而已。)兩種性質(zhì)都反映在各年齡組生育率的合計上。通常,不同基數(shù)的相對數(shù)指標不可以直接相加(注:如男性平均年齡加女性平均年齡沒有意義。)。為什么年齡別生育率可加,是因為設置了假設隊列的概念。 TFR主要不是平均的概念(注:早期將其翻譯為平均生育率的確是錯誤的。至于年齡別生育率對婦女其他差別所做的均質(zhì)假設,其實存在于所有匯總指標之中,而不論其分組有多細,但是都不會因此而稱為“平均××率”。),而是總和的概念(即假設隊列經(jīng)過所有年齡后生育總和)。因此,TFR一身兼兩任,其內(nèi)容為時期生育率總和,其形式為隊列終身生育水平。從前一種意義上使用時描述了該時期生育水平,從后一種意義上使用時則是假設隊列終身生育水平的估計(注:但這種估計從原理上不同于一般統(tǒng)計量從樣本推斷總體的情況,但有關評價原則卻是類似的。)。其值實際上涉及了35個實際隊列,并且只有在生育水平及年齡模式長期不變的苛刻條件下,它才真正與實際隊列終身生育水平相吻合(但是隊列仍是泛指的)。盡管這一假設隊列與真實隊列并不能很好對應,但起碼可以及時提供一種隊列終身生育的估計來滿足實際需要。
2 缺陷一:總和生育率對終身生育水平的背離
表現(xiàn)A:最早對TFR的批評是由于其劇烈的時期波動。一逢時期突發(fā)事件(如中國1958~1961),實際生育量發(fā)生了變化,TFR就會大幅度下降。應該說,批評并不是指向其描述時期生育水平的功能,而是指向其作為終身生育估計的功能。因為,這時TFR的下降只是由于時期特殊原因影響,并不意味著終身生育水平真的下降。實際上,時期效應一過,TFR馬上便會出現(xiàn)反彈(即常說的生育補償),然而反彈的水平也并不能標志終身生育水平真的那樣高??傊?,TFR短期內(nèi)劇烈波動時,將其作為終身生育率估計來理解很成問題。其中最引人注目的是,反彈年份的分孩次TFR(i)會超過1,特別是一孩TFR(1)會大大超過1(注:1982年全國1‰人口生育率抽樣調(diào)查數(shù)據(jù)顯示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作為隊列估計,即是說每人生育一個半一孩,顯得很荒.唐。)。人口統(tǒng)計學對此采取的對策是,避免采用這些年份的TFR來作為終身生育水平的估計,或者采用若干年份的TFR的平均值來作為終身生育水平的估計,希望將欠年與盈年的誤差相抵消。
表現(xiàn)B:然而,有時即使社會中似乎并沒有什么特殊事件,TFR也會背離終身生育水平。但是,往往只是在TFR提高時才會受到一定關注(注:如1983年左右中國人口學界對TFR的討論。)。理論分析可以證明,這種背離既可以是正的,也可以是負的。特別是在負偏離的情況下,往往可能持續(xù)較長的時間。并且,這種負背離實際上正是當前所面臨的實際情況,因此特別需要重視。
這種背離產(chǎn)生的原因是婚育年齡的變化,或者說是隊列的年齡別生育模式的改變。而負偏離則對應著婚育年齡的推遲。與時期突發(fā)事件對婚育年齡的推遲的暴發(fā)性影響不同,生育模式的自身轉(zhuǎn)變具有較長時期的持續(xù)性、變化上的漸進性、現(xiàn)象的隱蔽性等特征,并且它并不一定伴隨生育補償現(xiàn)象。甚至有時人們根本沒有意識到這種偏離的存在。
人口統(tǒng)計學早就揭示出,晚婚晚育可以延緩人口增長,但這是從長期人口發(fā)展的角度來證明的。而晚婚晚育對年份TFR有什么影響,則很少有人涉及。從理論上說,取得同樣的終身生育總量,可以有不同的進程表。即假定各隊列的終身生育數(shù)量不變,從某一時期開始各隊列的生育年齡開始推延,這一過程可以持續(xù)較長一段時期,直至最終穩(wěn)定在一個新的生育模式上。我對此做過一些模擬計算,在這種情況下,生育模式轉(zhuǎn)變時期中每年的TFR一定會低于事先所設的隊列終身生育量,而這段時期兩端及以外各年份的TFR則可以等于事先所設的終身生育水平。這表明,即使將整個轉(zhuǎn)變過程或更長時期中各年的TFR都加在一起平均,得到的還是—個偏低的終身生育估計。
更普遍的情況是生育模式的變化與終身生育量的變化同時發(fā)生,這時TFR下降同時受這兩個因素變化的影響,由生育模式變化導致TFR對終身生育水平的偏離便較難分析。
實際問題:實際工作需要不允許我們等很多年再提供真實隊列終身生育統(tǒng)計,而現(xiàn)在只有TFR一種估計方法,并且我們知道TFR還會經(jīng)常偏離隊列終身生育水平,因此急需尋找一種更好的估計來取代它。否則盡管當前TFR的值雖然很低,即使不論統(tǒng)計失真問題,我們也不知道這是否僅僅反映TFR發(fā)生了負偏離,那么我們憑什么肯定生育率已經(jīng)下降到更替水平了。我們又怎么能知道,當生育年齡推遲告一段落時,TFR向終身生育水平回歸時會回升多少。要知道更替水平的真正概念是實際上某隊列與其終身生育后代數(shù)量的比(注:從這個意義上,凈人口再生產(chǎn)率等于1僅是一種時期估計的標準,并且也服從上述偏離,并不是真正的更替水平。)。
有關改進:Bongaarts和Feeney(1998)提出了去進度效應總和生育率(TFR')。該方法旨在提供一種根據(jù)時期數(shù)據(jù)對終身生育水平的較好估計(注:Bongaarts和Feeney(1998)警告說,這一方法不適用于那種特殊時期效應(即重大災害等)的年份。)。郭志剛(2001)對此進行了介紹,并用中國多年生育數(shù)據(jù)對該方法進行了檢測和評價,結(jié)果是TFR'作為終身生育水平的估計的確大大優(yōu)于TFR(注:郭震威 (2000)認為TFR'不倫不類,既不是時期生育指標,又不是終身生育指標,是個尷尬的指標。我認為,它只是應實際需要而產(chǎn)生的另一種根據(jù)時期生育信息對終身生育水平的新估計而已,其實這沒有什么可尷尬的。統(tǒng)計中凡是不能直接測量的時候,都得采用估計來代替。真正有意義的問題是,它是否比傳統(tǒng)TFR更接近于終身生育水平。)。
該方法基本原理可以這樣來理解:現(xiàn)實中生育模式轉(zhuǎn)變時,除了導致該年生育數(shù)量有所變化以外,還會有其他共生現(xiàn)象,如分孩次的平均生育年齡(MACi)也會變化(注:Bongaarts和Feeney(1998)強調(diào)要用分孩次的平均生育年齡,而不能用總的平均生育年齡,因為后者會抹煞實際變化。)。MACi實際上是生育模式轉(zhuǎn)變的測量值,可以在理論上建立其變化量與時期生育變化量之間的函數(shù)關系。TFR'便是在常規(guī)分孩次TFR(i)的基礎上利用MACi的變化信息來調(diào)整,得到去進度效應的分孩次TFR'(i),然后再匯總為TFR'。經(jīng)過調(diào)整,TFR'可以在相當程度上修正TFR距終身生育水平的偏離,因此TFR'更接近于隊列終身生育水平(這里隊列仍是泛指的)。也就是說,我們可以用TFR'來替代TFR原來所承擔的終身生育估計的功能,而TFR還可以繼續(xù)承擔描述時期生育水平的功能,TFR'與TFR之差可以作為生育推延對當前生育水平影響的估計(注:我曾當面請教Bongarts,問TFR'方法是否可應用于預測模擬,他毫不猶豫地回答說不能。)。
我認為,盡管TFR'指標還有繼續(xù)改進的余地(注:比如某一年的MACi的計算還要前一年和后一年的數(shù)據(jù),因而多少喪失了一點及時性。然而,我自己曾嘗試過另外的計算,比如只用前一年和當年兩年的信息,調(diào)整的結(jié)果也并不差。),但顯然Bongarrts和Feeney為解決這一估計問題指出了極富于科學價值的方法論途徑。并且,這一新指標不僅可以用于監(jiān)測隊列終身生育水平,也可以用于分析以往的生育數(shù)據(jù)(郭志剛,2000),幫助我們更好地理解我國的生育轉(zhuǎn)變史和計劃生育史。
3 缺陷二:總和生育率不能控制育齡婦女的孩次結(jié)構(gòu)
對某些重要因素進行統(tǒng)計控制可以為不同年份或不同地區(qū)的比較提供更大的可比性。盡管TFR控制了育齡婦女的年齡結(jié)構(gòu),但是它并沒有控制育齡婦女的孩次結(jié)構(gòu)。然而,當前許多人口模擬研究都不能再忽略育齡婦女的孩次結(jié)構(gòu)問題,否則會有損其研究結(jié)果的有效性(注:比如,與調(diào)整生育政策相聯(lián)系的人口模擬如果忽略現(xiàn)有一孩的婦女人數(shù),便無法計算由于多年積累在一孩的這批婦女在政策調(diào)整時將產(chǎn)生的特殊生育效應。另外,有關生育政策后果方面的研究(如四二一家庭結(jié)構(gòu))也有類似問題。)。
問題的表現(xiàn):實際上生育過程是嚴格的遞進事件,也就是說,只有未生育者才能生育一孩,只有生育過一孩且尚未生育二孩者才能生育二孩。而常規(guī)生育率則是以年齡別所有婦女總數(shù)作為基數(shù),因而沒有容納育齡婦女的曾生孩次信息,也就不能控制曾生孩次這種結(jié)構(gòu)影響。因此,比較孩次結(jié)構(gòu)差別較大的年份或地區(qū)之間的年齡別生育率(或TFR),便不能區(qū)分其差異到底是出于生育水平不同還是出于孩次結(jié)構(gòu)不同。當其用于人口預測模擬時,如果假定兩地區(qū)育齡婦女年齡結(jié)構(gòu)相同,同樣的系列生育率的假設會導致孩次結(jié)構(gòu)十分不同的地區(qū)(代表著不同生育政策類型)將會有相同的出生人數(shù),顯然這嚴重地偏離實際情況。因此,面對當前的許多研究需要,基于年齡別生育率的TFR方法無論是用于比較分析上還是用于預測模擬,都會影響其結(jié)果的有效性(注:至于分孩次的年齡別生育率,只是對分子(即出生)劃分了孩次類別,但是并沒有對育齡婦女本身劃分孩次結(jié)構(gòu)。其基數(shù)沒有控制孩次結(jié)構(gòu),因而從本質(zhì)上說也沒有控制孩次結(jié)構(gòu)。)。
替代方法的產(chǎn)生:實際上,計劃生育采取了分類指導原則后,便產(chǎn)生了多種生育政策類型,其顯著特征便是孩次控制上的不同。在不同地區(qū)實施不同政策時,育齡婦女的孩次結(jié)構(gòu)便取得了越來越重要的意義。從這一角度出發(fā),導致Feeney(1985)和馬瀛通等(1986)分別以不同思路創(chuàng)建了孩次遞進生育指標體系。
他們的共同點在于采用孩次遞進比作為生育測量的基礎來構(gòu)建指標體系。如前所述,每年的出生可以劃分孩次。如果再將某一群體生育指標的基數(shù)由對應口徑的年中婦女總數(shù)換成年初對應(即前一)孩次婦女時,便稱為孩次遞進比(注:實際上可理解為一種概率,如本年年初某年齡組(或孩次間隔組)只有一孩的婦女中在本年生育二孩的比例。)。然后,還可以將孩次遞進比換算成遞進總和生育率。
Feeney的模型突出地考慮了孩次遞進間隔因素,不考慮年齡結(jié)構(gòu),因而常被稱為間隔遞進模型。而馬瀛通等的模型則突出地考慮了年齡遞進因素,因此常被稱為年齡遞進模型。
這兩種方法不僅可用于在控制婦女孩次結(jié)構(gòu)條件下的比較分析,也可以用于預測模擬(注:應該指出,其實中國人民大學人口研究所的老一輩人口學家早在 1970年代所自行創(chuàng)建的標準(或可變)生育率預測法中也已經(jīng)包含了控制孩次結(jié)構(gòu)影響的思想(劉錚、鄔滄萍、查瑞傳,1981)。)。遞進方法不僅可以在預測中控制孩次結(jié)構(gòu),而且應用于模擬預測時實際上比常規(guī)生育率方法更方便(注:這里的方便指,它只需要每年期初婦女的孩次別人口數(shù)便可以直接乘以遞進比便得到對應的生育量,而不需要再計算其中婦女人數(shù)。)。由于遞進比的概率性質(zhì),還能根本避免孩次別總和生育率出現(xiàn)的那種超過1的現(xiàn)象(注:盡管如此,Bongaats和Feeney(1998)認為這一類應用生命表方法的生育指標仍然沒有真正控制生育進程變化的影響。)。
主持人評論
本期論壇邀請的三位專家都有多年從事人口統(tǒng)計和數(shù)據(jù)分析的經(jīng)驗,對人口學研究方法有很深的造詣。王謙副司長通過從多年工作中積累的大量實例,分析了在人口和計劃生育工作中經(jīng)常發(fā)生的統(tǒng)計方法和統(tǒng)計數(shù)據(jù)被誤用的情況;鄭真真副教授則對統(tǒng)計分析中比較常見的問題進行丁獨到的分析和總結(jié);郭志剛教授對總和生育率指標進行了深入全面的剖析,分析了其內(nèi)在缺陷和改進方法。
王謙副司長通過10個典型實例說明在人口和計劃生育實際工作中,統(tǒng)計方法和統(tǒng)計數(shù)據(jù)在五個方面經(jīng)常被誤用。這五個方面的問題有些屬于統(tǒng)計分析中容易犯的錯誤,帶有普遍性,如,錯誤地解釋變量之間的因果關系,在統(tǒng)計分析中忽視定性分析與定量分析的關系,結(jié)論不是由統(tǒng)計分析中得出,使得定量分析只是定性結(jié)果的一種點綴。有些問題則由于人口與計劃生育領域的特點而顯得更為嚴重,如他指出的,大部分人口和計劃生育統(tǒng)計指標在村一級或縣、鄉(xiāng)不適用是因為總體規(guī)模不夠。統(tǒng)計所研究的是總體的數(shù)量關系而不是個別的數(shù)量關系,所以統(tǒng)計指標在一定的總體規(guī)模下才有意義,這是統(tǒng)計學中的基本概念,但是在實際中卻經(jīng)常被誤用。我們經(jīng)常看到的錯誤都是統(tǒng)計學上的一些“基本概念錯誤”,而不是“高深錯誤”。統(tǒng)計學上的概念和方法可能很簡單,也容易理解,但是要在實際工作中正確地、恰如其分地運用并不容易,需要結(jié)合研究對象的特點。
鄭真真副教授從另一個角度對描述性統(tǒng)計、雙變量統(tǒng)計和多變量統(tǒng)計分析中經(jīng)常被忽視的問題進行了討論和分析。她不僅指出了問題的所在,而且告訴大家應該如何做,她所討論的內(nèi)容是大部分統(tǒng)計教科書上所沒有的,具有很大的實用性,對于正確地應用統(tǒng)計分析方法具有很大的指導意義,具體的問題這里就沒有必要再評述了。她的分析源于多年教學和科研工作的總結(jié)和升華,很多觀點具有獨到性,如對描述性統(tǒng)計的重視,多變量分析結(jié)果的展示和解釋,不必求最新、只求最合適的方法。
王謙和鄭真真從不同角度對統(tǒng)計分析和統(tǒng)計數(shù)據(jù)應用中出現(xiàn)的問題進行了分析,郭志剛教授則對人口統(tǒng)計中的一個重要指標-總和生育率進行了深入分析。他指出指標是否有效應該以研究目的為標準來判斷,他從總和生育率對終身生育水平的背離和不能控制育齡婦女的孩次結(jié)構(gòu)這兩大缺陷出發(fā),對問題的表現(xiàn)形式、實際工作中的需求以及改進方法進行了分析和介紹,其中滲透了他自己近年來對這一問題的研究結(jié)果和體會。我看完他的文章覺得獲益匪淺,如90年代以來中國的人口調(diào)查所得到的總和生育率指標都非常低,這里面有統(tǒng)計漏報的問題,也有總和生育率指標自身的缺陷所帶來的問題,在婚育年齡推遲時,總和生育率會低估終身生育水平。在以往的人口學研究中,對方法論的討論和重視是不夠的。研究方法的創(chuàng)新源于實踐的需求,面對21世紀更加錯綜復雜的人口問題,我們需要研究方法的不斷創(chuàng)新與發(fā)展,這是目前我國人口科學發(fā)展面臨的一個巨大挑戰(zhàn)。
三位專家的分析和討論有很大的實用性,值得從事人口和計劃生育的實際工作者和學者認真學習,但是畢竟他們不可能把所有的問題都歸納概括全面,這也不是本期論壇的初衷。我們希望通過本期論壇起到拋磚引玉的作用,引起同行對這一問題的重視。中國規(guī)范的人口學研究畢竟只有20多年的歷史,有問題是可以理解的,統(tǒng)計分析方法的誤用和研究的不規(guī)范在其他學科領域也同樣存在,甚至有可能更嚴重,但是我們不能漠視這種狀況繼續(xù)下去,問題的解決需要全體同仁的重視和努力。我覺得目前至少可以加強以下幾個方面的工作:
(1)提倡學術爭鳴,鼓勵同行之間開展批評,這將有利于學科的發(fā)展與規(guī)范;
(2)編審人員把好質(zhì)量關,使在雜志上發(fā)表的文章符合學術規(guī)范,雜志上文章的示范作用往往比教科書要大得多;
(3)加強統(tǒng)計分析方法的教學工作。強調(diào)方法的適用性和在實際應用中應該注意的問題。
【參考文獻】
1 劉錚,鄔滄萍,查瑞傳.人口統(tǒng)計學.中國人民大學出版社,1981
2 馬瀛通,王彥祖,楊叔章.遞進人口發(fā)展模型的提出與總和遞進指標體系的確立.人口與經(jīng)濟,1986;1,2
3 姚新武.中國生育數(shù)據(jù)集.中國人口出版社,1995
4 郭震威.對“去進度效應總和生育率(TFR')方法”的一點看法.人口研究,2000;1
5 郭志剛.從近年來的時期生育行為看終身生育水平.人口研究,2001;1
6 郭志剛.時期生育水平指標的回顧與分析.人口與經(jīng)濟,2000;1
7 Feeney.1985.Parityprogressionprojection.InternationalUnionfortheScientific
StudyofPopulation,InternationalPopulationConference,Florence1985,vol.4
8 BongaartsandFeeney.1998.Onthequanturnandtempooffertility.Populationand
DevelopmentReview24(2):271~291/中譯文:人口研究,2000;1