李嵬,孫德平,方小兵
提 要 人口模式和變化與語(yǔ)言發(fā)展、語(yǔ)言變化、語(yǔ)言維護(hù)、語(yǔ)言替換和語(yǔ)言規(guī)劃之間的復(fù)雜關(guān)系催生了一個(gè)跨學(xué)科領(lǐng)域——人口語(yǔ)言學(xué)。本文評(píng)述這一學(xué)科領(lǐng)域的主要理論與方法,主要目的是在正在發(fā)生重大人口變化的中國(guó)推動(dòng)這一新的應(yīng)用語(yǔ)言學(xué)研究。
關(guān)鍵詞 人口學(xué);語(yǔ)言;理論;方法;中國(guó)
中圖分類號(hào) H002 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-1014(2019)06-0019-14
DOI 10.19689/j.cnki.cn10-1361/h.20190602
Language and Demography: Theories and Methods
Li Wei
AbstractThe complex interrelationships between demographic patterns and changes on the one hand, and language development, language change, language maintenance and language shift, and language planning, on the other have given rise to an interdisciplinary field known as Demographic Linguistics. This article reviews the key theories and methods that are relevant to this interdisciplinary field. The principal aim is to promote this new field of applied linguistic research in China, where important demographic changes are taking place.
Key wordsdemography; language; theory; method; China
人口結(jié)構(gòu)模式和人口結(jié)構(gòu)變化,語(yǔ)言發(fā)展、語(yǔ)言變化、語(yǔ)言維護(hù)、語(yǔ)言替換和語(yǔ)言規(guī)劃,這兩方面之間存在著復(fù)雜的關(guān)系,并催生了一個(gè)跨學(xué)科領(lǐng)域——人口語(yǔ)言學(xué)(demographic linguistics)。它與“語(yǔ)言人口學(xué)”(linguistic demography)不同,后者主要是統(tǒng)計(jì)語(yǔ)言分布情況。在過(guò)去的20年中,人口語(yǔ)言學(xué)已經(jīng)在國(guó)際上成為人口學(xué)和語(yǔ)言學(xué)交叉領(lǐng)域。本文借用雅各布·西格爾(Jacob Siegel)所著《民族語(yǔ)言學(xué)的人口和社會(huì)經(jīng)濟(jì)基礎(chǔ)》一書(shū)第一章的部分內(nèi)容(3~35頁(yè)),經(jīng)修改補(bǔ)充來(lái)介紹人口語(yǔ)言學(xué)的主要理論概念和研究方法,其主要目的是在正在發(fā)生重大人口結(jié)構(gòu)變化的中國(guó)推廣這一新的應(yīng)用語(yǔ)言學(xué)研究。
一、為什么語(yǔ)言學(xué)家應(yīng)該對(duì)人口統(tǒng)計(jì)學(xué)感興趣,反之亦然?
語(yǔ)言學(xué)中有一個(gè)比喻,即語(yǔ)言是一種生命體,它可以出生、成長(zhǎng)和死亡。但我們不能忘記,是語(yǔ)言的使用者賦予了語(yǔ)言以生命;語(yǔ)言之所以成長(zhǎng),是因?yàn)楦嗟娜耸褂盟鼈?而語(yǔ)言死亡則是因?yàn)闆](méi)有人再使用它們了。因此,語(yǔ)言的成長(zhǎng)和地理分布通常是根據(jù)語(yǔ)言在不同時(shí)期的使用人數(shù)及其分布方式來(lái)衡量的。有關(guān)各種群體過(guò)去的人口增長(zhǎng)及其分布的數(shù)據(jù)可以使我們了解特定語(yǔ)言的當(dāng)前水平、成長(zhǎng)和分布,而對(duì)人口增長(zhǎng)及其分布的預(yù)測(cè)可以使我們了解各種語(yǔ)言未來(lái)可能的成長(zhǎng)及其分布。人口的規(guī)模和增長(zhǎng)率不僅影響語(yǔ)言的擴(kuò)張和收縮,還影響其句法(語(yǔ)法)、語(yǔ)匯(詞匯),甚至物理表達(dá)(例如聲音和肢體動(dòng)作)。順便說(shuō)一句,我使用“語(yǔ)言使用者”(language user),而不是“說(shuō)話者”(speaker),因?yàn)椴皇撬械恼Z(yǔ)言都是說(shuō)的。世界上還存在著手語(yǔ),還有一些會(huì)讀會(huì)寫(xiě)但不會(huì)說(shuō)的語(yǔ)言使用者。
人口因素和人口事件,例如生育率、死亡率、移民、年齡-性別構(gòu)成、種族(ethnicity)和人種(race)、社會(huì)經(jīng)濟(jì)地位和健康特征,都可能會(huì)對(duì)語(yǔ)言產(chǎn)生重大影響。語(yǔ)言社團(tuán)的遷移會(huì)影響其成員所使用語(yǔ)言的地理分布和空間分布。人口的年齡-性別結(jié)構(gòu)和社會(huì)-階層結(jié)構(gòu)是影響語(yǔ)言活力和語(yǔ)言特征的主要因素。語(yǔ)言通常是定義種族的主要因素。人口的社會(huì)經(jīng)濟(jì)階層結(jié)構(gòu)會(huì)影響方言的形成和語(yǔ)言的變化。健康方面的限制可能對(duì)人們的語(yǔ)言使用方式產(chǎn)生深刻的影響,尤其是在他們的晚年生活中。
長(zhǎng)期以來(lái),人口學(xué)家和政治家對(duì)語(yǔ)言使用問(wèn)題一直非常關(guān)注,許多國(guó)家已將其納入人口普查和抽樣調(diào)查中。在過(guò)去的一個(gè)多世紀(jì)中,美國(guó)每十年一次的人口普查均包括對(duì)語(yǔ)言使用或英語(yǔ)知識(shí)和英語(yǔ)水平問(wèn)題的調(diào)查,例如讀寫(xiě)能力(literacy),以及最近增加的受教育程度等項(xiàng)目,收集關(guān)于被調(diào)查者讀寫(xiě)能力的信息。從普查或調(diào)查中獲得的有關(guān)語(yǔ)言使用或語(yǔ)言水平的統(tǒng)計(jì)數(shù)據(jù),可以協(xié)助某些法律、社會(huì)、經(jīng)濟(jì)或司法等方面的工作。
在人口學(xué)(demography)里,人口(population)是指特定時(shí)間在一個(gè)確定地理區(qū)域內(nèi)的居民總數(shù)。有時(shí),它僅指特定地區(qū)的一部分居民(如兒童人口、老年人口)。在人口普查或調(diào)查中實(shí)施人口定義涉及以下問(wèn)題:所涵蓋的人口類型(普通居民與實(shí)際人口或現(xiàn)有人口)、非法居民的身份、在該國(guó)的外國(guó)居民、沒(méi)有常住地的人、海外居民以及擁有雙重住所的居民。種群之間劃定界限通常出于歷史和政治原因。
同樣,語(yǔ)言邊界的劃定也多出于歷史和政治原因。一種語(yǔ)言可以與其親屬語(yǔ)言區(qū)分開(kāi),例如法語(yǔ)和西班牙語(yǔ),或者法屬克里奧爾語(yǔ)和巴黎法語(yǔ)。一種“語(yǔ)言”與另一種“語(yǔ)言”的差異大到什么程度才可以算作彼此獨(dú)立的語(yǔ)言?為什么古英語(yǔ)和現(xiàn)代英語(yǔ)被視為相同的語(yǔ)言,而法語(yǔ)卻被視為與西班牙語(yǔ)或拉丁語(yǔ)不同的語(yǔ)言?21世紀(jì)的英語(yǔ)使用者無(wú)法理解古英語(yǔ),法語(yǔ)的使用者也無(wú)法理解拉丁語(yǔ)。瑞典語(yǔ)和挪威語(yǔ)是可以互懂的,卻被認(rèn)為是彼此獨(dú)立的語(yǔ)言。普通話和廣東話不能互懂,卻被認(rèn)為是同一種語(yǔ)言——漢語(yǔ)。這些做法使我們認(rèn)識(shí)到歷史事件、政治影響和隨意性在劃分語(yǔ)言和統(tǒng)計(jì)語(yǔ)言數(shù)量方面的影響。由于瑞典語(yǔ)和挪威語(yǔ)在兩個(gè)獨(dú)立的國(guó)家使用,所以它們被認(rèn)為是獨(dú)立的語(yǔ)言;同樣,由于普通話和廣東話在同一國(guó)家使用,所以它們被認(rèn)為是同一種語(yǔ)言。烏克蘭語(yǔ)一度被視為俄語(yǔ)的方言,而且它曾經(jīng)是俄羅斯帝國(guó)的標(biāo)準(zhǔn)語(yǔ)言,但是由于它現(xiàn)在已是一個(gè)獨(dú)立國(guó)家的國(guó)語(yǔ),因此被視為一種獨(dú)立的語(yǔ)言。除了互懂度之外,還有很多方法可以衡量語(yǔ)言之間的差異,但是它們不能解決諸如上述語(yǔ)言劃分的不規(guī)則情況。
二、人口和語(yǔ)言研究的基本范式
人口學(xué)是研究人口的數(shù)量、分布、年齡-性別結(jié)構(gòu)及構(gòu)成(即人種和種族、出生地和出生國(guó)、婚姻和家庭狀況)以及這些要素變化(主要是出生、死亡和移民)。更寬泛的定義包括語(yǔ)言使用、健康特征和社會(huì)經(jīng)濟(jì)因素(例如讀寫(xiě)能力、教育程度、職業(yè)、收入和財(cái)富)等其他要素。
人口學(xué)家在數(shù)據(jù)分析中除了采用常用的人口估算方法,包括出生率、死亡率、移入率和移出率等,還使用群組分析法(cohort analysis)對(duì)人口的發(fā)展變化進(jìn)行深入的研究。要了解群組分析,我們需要將“時(shí)段”(period)數(shù)據(jù)與“群組”(cohort)數(shù)據(jù)區(qū)分開(kāi)。比如考察2020年北京市每個(gè)10歲年齡段(5歲及5歲以上)在家里使用非北京話的人口百分比的數(shù)據(jù)。我們現(xiàn)在考慮在10歲年齡段的家庭中說(shuō)非北京話者的百分比數(shù)組,其中每個(gè)連續(xù)10歲年齡段的百分比與相隔10年的連續(xù)日期有關(guān)。該數(shù)組代表了群組數(shù)據(jù),并隨著個(gè)人實(shí)際變老而變化。第一個(gè)數(shù)組描述時(shí)段數(shù)據(jù),第二個(gè)數(shù)組描述群組數(shù)據(jù)。
上文所述僅涉及一種類型的群組,也是最常見(jiàn)的類型,稱為出生群組(birth cohort)。出生群組由同一年出生的人組成,直到有人死亡才開(kāi)始失去成員,而同時(shí)通過(guò)凈移入獲得成員。群組分析也叫縱向分析,指在群組的整個(gè)生命周期或其中某個(gè)階段人口、社會(huì)經(jīng)濟(jì)、健康和語(yǔ)言現(xiàn)象發(fā)生變化時(shí)對(duì)其進(jìn)行分析和估算的一系列方法。人口學(xué)家面臨的一項(xiàng)共同任務(wù)是如何解釋同一年度不同年齡段之間社會(huì)經(jīng)濟(jì)特征的變異。年齡本身并不一定是導(dǎo)致年齡組之間差異的主要原因。因此需要使用群組分析,出生群組之間的變化可能才是其主因。例如,為什么在許多國(guó)家的普查中65~69歲年齡段的文盲率比15~19歲年齡段的要高很多?其解釋主要依靠群組分析,即每一個(gè)晚出生的群組都會(huì)比早出生的群組接受更多更好的教育。在所考察的年份中,最老的年齡段反映了幾十年前的教育水平,而最年輕的群組反映了近年來(lái)較好的教育。
對(duì)同一調(diào)查年的兩個(gè)年齡組的語(yǔ)言行為進(jìn)行簡(jiǎn)單比較,不能解釋不同群體在不同年齡段語(yǔ)言行為的實(shí)際差別。當(dāng)從一個(gè)年齡轉(zhuǎn)到另一個(gè)年齡時(shí),出生群組具有了其獨(dú)特的經(jīng)歷。人口學(xué)家根據(jù)年齡、群組和時(shí)段影響或效應(yīng)三方的貢獻(xiàn),對(duì)同一天或兩天之間社會(huì)經(jīng)濟(jì)變量的年齡變化進(jìn)行分析。與社會(huì)經(jīng)濟(jì)現(xiàn)象一樣,相同類型的分析范式也適用于分析語(yǔ)言現(xiàn)象。
這種分析被稱為年齡-時(shí)段-群組(age-period-cohort,APC)分析,可以應(yīng)用到一系列年齡組的語(yǔ)言比率或頻率的分析之中,以便確定所謂的年齡效應(yīng)、時(shí)段效應(yīng)和群組效應(yīng)各自對(duì)語(yǔ)言比例或頻率的差異和變化產(chǎn)生的影響。例如,想要分析美國(guó)2010年50~54歲和80~84歲兩個(gè)年齡段之間英語(yǔ)說(shuō)得很好的拉美裔人口比例下降的原因,或者1980~2010年之間50~54歲的英語(yǔ)說(shuō)得很好的拉美裔人口比例上升的原因,年齡效應(yīng)、時(shí)段效應(yīng)和群組效應(yīng)都會(huì)有貢獻(xiàn),但它們之間的關(guān)系會(huì)有所不同。
時(shí)段效應(yīng)是指在特定年中所發(fā)生的事件(例如,戰(zhàn)爭(zhēng)、流行病、重大政治事件)對(duì)所研究語(yǔ)言現(xiàn)象的影響。年齡效應(yīng)是指不同年齡對(duì)所關(guān)注的語(yǔ)言變量的影響。群組效應(yīng)是指不同出生群組的特征和經(jīng)驗(yàn),尤其是早期生活經(jīng)歷,對(duì)所研究語(yǔ)言現(xiàn)象的影響。如果不考慮這3個(gè)因素,對(duì)特定年齡的變化或差異的解釋就可能會(huì)出錯(cuò)。重要的分析點(diǎn)是,年齡在某一特定年份或時(shí)段包含著許多不同的出生群組,這些群組在其早年和晚年具有不同的經(jīng)歷,從而影響他們晚年時(shí)對(duì)時(shí)段和年齡影響的反應(yīng)。同樣,不同時(shí)期的相同年齡代表不同的群組和不同的時(shí)段。這說(shuō)明,僅關(guān)注某一年份語(yǔ)言特征中的年齡差異可能會(huì)導(dǎo)致對(duì)年齡差異的誤解。
三、人口與語(yǔ)言研究中的主要主題
語(yǔ)言和人口研究者對(duì)許多不同的問(wèn)題都很關(guān)注。在將人口學(xué)理論和方法應(yīng)用于語(yǔ)言分析時(shí),我們可以比較使用各種語(yǔ)言的人數(shù)、其地理分布及其人口和社會(huì)經(jīng)濟(jì)特征。我們可能會(huì)研究語(yǔ)言使用的年齡-性別變異,包括區(qū)分年齡(即不同年齡)、時(shí)段(即不同年份)和群組(即不同出生年份)對(duì)語(yǔ)言使用的影響帶來(lái)的差異和變化。在語(yǔ)言使用上,性別、人種、家庭和社會(huì)階層等方面的差異也引起了很多人的興趣。人口學(xué)家像社會(huì)語(yǔ)言學(xué)家一樣,一方面對(duì)人口和社會(huì)經(jīng)濟(jì)變量之間的關(guān)聯(lián)感興趣,如人種-種族群體、家庭地位和社會(huì)經(jīng)濟(jì)地位,另一方面也對(duì)語(yǔ)言使用和語(yǔ)言變化感興趣。
應(yīng)用標(biāo)準(zhǔn)的人口學(xué)范式,我們可以探討各種語(yǔ)言的使用者的出生、死亡和遷移(即移民)。由于遷移在語(yǔ)言傳播和語(yǔ)言變化中起著重要作用,因此值得特別關(guān)注。在對(duì)一種語(yǔ)言的使用者數(shù)量進(jìn)行估算和預(yù)測(cè)的基礎(chǔ)上,如果我們可以為該語(yǔ)言使用者的不同年齡組確定目前的死亡率,那么我們就可以為他們建立一個(gè)生命表。生命表是一個(gè)具有函數(shù)的統(tǒng)計(jì)表,該函數(shù)顯示了每個(gè)年齡的出生群組成員的生存概率、每個(gè)年齡的生存者數(shù)量、該群組成員的預(yù)期壽命和其他相關(guān)函數(shù)。將語(yǔ)言視為人口研究的單位,我們可以計(jì)算其增長(zhǎng)率、死亡率和出生率,并解釋其含義。有關(guān)人口統(tǒng)計(jì)來(lái)源和方法的詳細(xì)介紹,請(qǐng)參見(jiàn)西格爾(Siegel 2018)、西格爾和斯旺森(Siegel & Swanson 2004)。
人口學(xué)家和其他社會(huì)科學(xué)家一直關(guān)注的一個(gè)問(wèn)題是遺傳和環(huán)境在第一語(yǔ)言習(xí)得和第二語(yǔ)言習(xí)得中的相對(duì)作用。遺傳和環(huán)境在多大程度上有助于母語(yǔ)或本族語(yǔ)的習(xí)得?這些因素也關(guān)系到新語(yǔ)言誕生和消亡的過(guò)程。
人口學(xué)家和應(yīng)用語(yǔ)言學(xué)家共同感興趣的其他主題包括語(yǔ)言社區(qū)的共存和沖突、國(guó)家語(yǔ)言水平等級(jí)以及家庭和鄰里在語(yǔ)言水平和語(yǔ)言使用的變化中的作用等。官方語(yǔ)言水平是影響人口普查和調(diào)查中所收集的人口統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的因素,非官方語(yǔ)言的水平也是一個(gè)影響用“外語(yǔ)”編寫(xiě)的調(diào)查問(wèn)卷所收集數(shù)據(jù)質(zhì)量的因素。
人口學(xué)家像文化人類學(xué)家和社會(huì)語(yǔ)言學(xué)家一樣,對(duì)具有獨(dú)特語(yǔ)言特征的種群感興趣,例如土著種群,由于文化、地理位置或人口稀少而被孤立或邊緣化的種群,生活在某個(gè)社會(huì)歷史時(shí)代之前的特定群體。人口學(xué)家長(zhǎng)期以來(lái)一直對(duì)這種獨(dú)特種群的人口特征和社會(huì)經(jīng)濟(jì)特征感興趣,將其作為一種重建人口歷史的方法,以及提高對(duì)當(dāng)代人口變化的理解的方法。語(yǔ)言人口學(xué)還涉及感覺(jué)障礙者、其他類型的言語(yǔ)障礙者、在受限的社會(huì)環(huán)境中使用特殊語(yǔ)言(例如宗教服務(wù)中的神圣語(yǔ)言)的人。
調(diào)查可以設(shè)計(jì)為橫斷面調(diào)查或縱向調(diào)查。在橫斷面(日歷年)調(diào)查中,數(shù)據(jù)被匯總并用來(lái)分析特定年份??赡苄枰@取數(shù)年的橫斷面數(shù)據(jù),以分析其時(shí)間趨勢(shì)或它們對(duì)歷史變化的影響。在縱向調(diào)查中,能夠隨著時(shí)間的推移和被調(diào)查者年齡的增長(zhǎng)跟蹤相同的群組(出生年份組)。在一種被稱為定組調(diào)查(panel survey)的特殊類型的縱向調(diào)查中,隨著時(shí)間的推移會(huì)對(duì)相同的個(gè)體進(jìn)行跟蹤調(diào)查。由于縱向(定組)調(diào)查成本高昂且操作復(fù)雜,因此這方面的調(diào)查并不經(jīng)常進(jìn)行,取而代之的是橫斷面調(diào)查。然而,橫斷面研究很容易造成誤解,以為不同年齡段之間的差異是年齡導(dǎo)致的變化。在美國(guó)進(jìn)行的最大的全國(guó)抽樣調(diào)查是“美國(guó)社區(qū)調(diào)查”,它提供了種族數(shù)據(jù),包括語(yǔ)言使用的數(shù)據(jù)。它的實(shí)施是為了取代從2010年開(kāi)始的10年一次的人口普查的“長(zhǎng)表”。它是滾動(dòng)抽樣,能保證數(shù)據(jù)不斷采集。較小城市的小區(qū)域調(diào)查數(shù)據(jù)可以以1年、3年和5年的表格呈現(xiàn)?!爱?dāng)前人口調(diào)查”(CPS)和“收入與計(jì)劃參與調(diào)查”(SIPP)都包括有關(guān)美國(guó)語(yǔ)言使用的信息。美國(guó)另外兩個(gè)全國(guó)抽樣調(diào)查——“國(guó)家健康調(diào)查”(NHS)和“健康與退休研究”(HRS),以及“美國(guó)社區(qū)調(diào)查”,提供了一些有關(guān)感覺(jué)和認(rèn)知障礙人群的數(shù)據(jù),這些數(shù)據(jù)可以幫助我們了解個(gè)人有效使用語(yǔ)言的能力。還有部分專門(mén)性的全國(guó)抽樣調(diào)查,目的是獲取有關(guān)移民特征的數(shù)據(jù),其中包括有關(guān)語(yǔ)言使用和語(yǔ)言水平的數(shù)據(jù)。
(二)其他記錄來(lái)源
某些語(yǔ)言信息可以從官方文件中獲取,例如重要證件、移民文件、當(dāng)?shù)貙W(xué)校記錄和人口登記簿。只有少數(shù)幾個(gè)國(guó)家(如愛(ài)沙尼亞、拉脫維亞、羅馬尼亞、俄羅斯、斯洛伐克和斯洛文尼亞)通過(guò)普查、重要統(tǒng)計(jì)數(shù)據(jù)和移民文件提供了全面的民族特征。美國(guó)移民統(tǒng)計(jì)局不收集有關(guān)移民語(yǔ)言習(xí)慣的信息??傮w而言,普查和全國(guó)抽樣調(diào)查中可獲得的語(yǔ)言使用數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過(guò)重要統(tǒng)計(jì)數(shù)據(jù)記錄和國(guó)際移民文件中的數(shù)據(jù)。通常出現(xiàn)在這些資源中的數(shù)據(jù)有時(shí)可以從人口登記簿中獲得。人口登記簿是地方一級(jí)的持續(xù)的人口核算系統(tǒng),包括出生、死亡和移民事件的匯編和合并。芬蘭是唯一個(gè)擁有一整套人口統(tǒng)計(jì)數(shù)據(jù)(生育率、死亡率和移民)的國(guó)家,該套統(tǒng)計(jì)數(shù)據(jù)是基于語(yǔ)言群體收集的(引自Haug et al. 2000:135)。冰島的人口登記已被用作選擇樣本研究該國(guó)移民人口的基礎(chǔ)(Wojtynska and Har?ardóttir 2012)。
還有一些人口數(shù)據(jù)的來(lái)源可以作為在研究移民和其他與民族語(yǔ)言有關(guān)的群體時(shí)選擇樣本的基礎(chǔ),包括就業(yè)人口列表、汽車駕駛員列表、選舉列表、互聯(lián)網(wǎng)和電話服務(wù)的訂戶列表。
(三)語(yǔ)言匯編
世界上最全面、最權(quán)威、最受好評(píng)的語(yǔ)言匯編是美國(guó)國(guó)際語(yǔ)言暑期學(xué)院(SIL,現(xiàn)為美國(guó)國(guó)際語(yǔ)言學(xué)校)的《民族語(yǔ):世界語(yǔ)言》。最新版本是第20版,于2017年發(fā)布。2015年出版的第18版列出了7471種語(yǔ)言,其中7102種是活語(yǔ)言,369種已滅絕,并且228個(gè)語(yǔ)族中包括50個(gè)(不在語(yǔ)族中的)孤立語(yǔ)。自1984年以來(lái),已為這些語(yǔ)言分配了代碼?!睹褡逭Z(yǔ):世界語(yǔ)言》已不定期發(fā)布了半個(gè)多世紀(jì)。
《民族語(yǔ):世界語(yǔ)言》提供了所收錄各語(yǔ)言的使用者人數(shù)、地理分布、語(yǔ)言種屬關(guān)系以及對(duì)其語(yǔ)言活力的估計(jì)等信息。研究人員廣泛使用它來(lái)分析語(yǔ)言的數(shù)量、語(yǔ)言趨勢(shì)、語(yǔ)言分布和語(yǔ)言特征。他們認(rèn)為,盡管由于缺乏區(qū)分語(yǔ)言和方言的可靠標(biāo)準(zhǔn)而導(dǎo)致區(qū)域覆蓋范圍不足和分類不一致,但在語(yǔ)言的人口特征方面,這本匯編已是提供了足夠準(zhǔn)確的資料。遺憾的是,書(shū)中沒(méi)有給出信息的來(lái)源。
五、調(diào)查數(shù)據(jù)的質(zhì)量與社會(huì)政策及環(huán)境
在官方的統(tǒng)計(jì),尤其是人口普查中,政治因素和民族政策等常常對(duì)某些數(shù)據(jù),特別是關(guān)系到少數(shù)民族的數(shù)據(jù)的可獲性(availability),產(chǎn)生一定的影響。人口普查的方式和統(tǒng)計(jì)期間的政治氣氛也可能會(huì)影響具體區(qū)域、群體和民族數(shù)據(jù)的完整性和準(zhǔn)確性。當(dāng)調(diào)查者在文盲群體或手語(yǔ)使用者中收集數(shù)據(jù)時(shí),如何才能收集到可靠數(shù)據(jù),受訪者會(huì)不會(huì)感到調(diào)查者施加壓力,宗教群體或特殊語(yǔ)言使用者會(huì)不會(huì)被忽略、錯(cuò)分等,對(duì)調(diào)查數(shù)據(jù)的質(zhì)量都是挑戰(zhàn)。
法國(guó)的INSEE不會(huì)收集任何有關(guān)語(yǔ)言的數(shù)據(jù),因?yàn)樯贁?shù)民族在法國(guó)沒(méi)有得到官方的認(rèn)可(Haug et al. 2000);希臘和土耳其也是如此,那里的統(tǒng)計(jì)機(jī)構(gòu)沒(méi)有任何可能統(tǒng)計(jì)政府不允許統(tǒng)計(jì)的信息(Haug et al. 2000)。鮑德溫-愛(ài)德華茲(Baldwin-Edwards 2006)指出,在政府縱容下,普查中不問(wèn)適當(dāng)?shù)膯?wèn)題,所以即使在20世紀(jì)末,希臘的穆斯林人口數(shù)仍然不得而知。在佛朗哥統(tǒng)治下,西班牙實(shí)行單語(yǔ)制。直到1986年,人口普查才反映出該國(guó)的多語(yǔ)種特征。比利時(shí)在定義了語(yǔ)言社區(qū)的邊界后,于1961/1962年在人口普查中取消了關(guān)于語(yǔ)言的問(wèn)題(Haug et al. 2000)。類似的原因同樣可以解釋1950年捷克斯洛伐克人口普查中對(duì)匈牙利族的輕描淡寫(xiě),和1975年保加利亞人口普查中土耳其族的人口稀少。由于政治條件的改變,從一次人口普查到另一次人口普查,很多人甚至可能經(jīng)歷了國(guó)家名稱的變化。少數(shù)民族可能選擇不與當(dāng)局合作并抵制人口普查(例如1991年南斯拉夫人口普查中科索沃和馬其頓的阿爾巴尼亞人),或者不回答特定的問(wèn)題,例如種族、宗教或語(yǔ)言等問(wèn)題。意識(shí)形態(tài)傾向還可能影響到一些少數(shù)群體普查數(shù)據(jù)的準(zhǔn)確性?;\罩人口的意識(shí)形態(tài)傾向常常與大族群和小族群之間的關(guān)系密切相連。在1920年的美國(guó)人口普查中,明顯受到剛結(jié)束不久的第一次世界大戰(zhàn)的影響,宣告自己擁有日耳曼血統(tǒng)的人數(shù)量顯著下降(Wiley 2010)。還有一些群體,干脆被歸入“所有其他群體”,特別是被視為異類的小型游牧群體,如吉普賽人,上文所述的種種情況也發(fā)生在他們身上,人口普查經(jīng)常會(huì)漏掉他們(Haug et al. 2000)。
政治影響也可以朝不同方向發(fā)展,導(dǎo)致一些少數(shù)民族“過(guò)度參與”,因?yàn)榉稍诮逃?、就業(yè)和住房等方面以特殊的財(cái)政資源、特殊的計(jì)劃以及額外的服務(wù)和設(shè)施來(lái)給予他們特別照顧。這可能解釋了美國(guó)印第安人人口不同尋常的增長(zhǎng)速度,一種遠(yuǎn)遠(yuǎn)超出了能用出生、死亡和移民數(shù)據(jù)解釋的速度。一些少數(shù)民族活動(dòng)家利用法律的反歧視政策向其選民鼓吹參加人口普查的必要性,以確保獲得最大計(jì)數(shù),而不是最準(zhǔn)確計(jì)數(shù)。
六、人口普查數(shù)據(jù)的評(píng)估
對(duì)調(diào)查數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,這已經(jīng)被認(rèn)為是現(xiàn)代人口普查的規(guī)范,但除了美國(guó)、加拿大和一些西歐國(guó)家,很少有國(guó)家進(jìn)行這種評(píng)估。相關(guān)人員已經(jīng)開(kāi)發(fā)出多種方法來(lái)評(píng)估普查數(shù)據(jù)和調(diào)查數(shù)據(jù)。人口普查和調(diào)查數(shù)據(jù)可能存在漏計(jì)(即人員遺漏)、未報(bào)告(即對(duì)主問(wèn)題的回答不完整)以及在報(bào)告主問(wèn)題時(shí)存在偏見(jiàn)(即報(bào)告一類變量以犧牲另一類變量為代價(jià))。
為了判斷普查或調(diào)查中的凈漏計(jì)數(shù),通常使用3種方法,即人口統(tǒng)計(jì)分析、雙系統(tǒng)分析和樣本重新計(jì)數(shù)。第一種方法,即人口統(tǒng)計(jì)分析,涉及多種技術(shù),包括將普查總數(shù)與普查值或調(diào)查值的獨(dú)立估算值進(jìn)行比較,與連續(xù)人口普查的一致性進(jìn)行比較。其中,普查值或調(diào)查值的獨(dú)立估算值可以通過(guò)生死統(tǒng)計(jì)數(shù)據(jù)、移民數(shù)據(jù)、醫(yī)療保險(xiǎn)數(shù)據(jù)和其他行政記錄數(shù)據(jù)估算。第二種方法,即雙系統(tǒng)分析,涉及將人口普查中的個(gè)人樣本或住戶樣本與獨(dú)立調(diào)查中的樣本或行政記錄集中的樣本進(jìn)行逐個(gè)匹配。在第一種方法中,分析人員使用匯總數(shù)據(jù);在第二種方法中,分析人員使用個(gè)人數(shù)據(jù),即所謂的微數(shù)據(jù)。
在最近的幾次人口普查中,美國(guó)人口普查局采用了上面列舉的方法來(lái)評(píng)估普查數(shù)據(jù)和調(diào)查數(shù)據(jù)。對(duì)于2000年人口普查和2010年人口普查,通過(guò)人口統(tǒng)計(jì)分析和雙系統(tǒng)分析獲得的估算值與美國(guó)全國(guó)人口普查總數(shù)非常接近,這表明凈漏計(jì)數(shù)接近于零。因此,早期人口普查曾經(jīng)引起激烈辯論的凈漏計(jì)普查結(jié)果調(diào)整的問(wèn)題,可以簡(jiǎn)單地通過(guò)宣布全國(guó)人口普查總數(shù)得到解決。但這個(gè)結(jié)論沒(méi)有解決更加困難和重要的州和城市人口普查準(zhǔn)確性問(wèn)題。
當(dāng)個(gè)人未報(bào)告主問(wèn)題或“內(nèi)容”項(xiàng)(如“在家說(shuō)的語(yǔ)言”)時(shí),未報(bào)告該項(xiàng)者的人數(shù)百分比或無(wú)回應(yīng)率可以計(jì)算出來(lái)。例如,2010年,在“美國(guó)社區(qū)調(diào)查”中,5歲及以上的人口中,有3.4%的人沒(méi)有報(bào)告家庭使用的語(yǔ)言,或者回答于理不通,導(dǎo)致只能推測(cè)其所使用的語(yǔ)言。
為了評(píng)估人口普查數(shù)據(jù)或調(diào)查數(shù)據(jù)中有關(guān)主問(wèn)題項(xiàng)目報(bào)告的質(zhì)量,即為了判斷報(bào)告的變異性和報(bào)告偏差(即報(bào)告了變量的錯(cuò)誤類別),假設(shè)在調(diào)查中類似的問(wèn)題被問(wèn),就可以在人口普查或調(diào)查與另一個(gè)調(diào)查或行政記錄系統(tǒng)之間進(jìn)行匹配研究。例如,美國(guó)社區(qū)調(diào)查的數(shù)據(jù)可以與美國(guó)人口調(diào)查局進(jìn)行的另一項(xiàng)全國(guó)有代表性的抽樣調(diào)查——“當(dāng)前人口調(diào)查”的數(shù)據(jù)相匹配,這兩項(xiàng)調(diào)查都詢問(wèn)了非英語(yǔ)家庭在家使用的語(yǔ)言和這些家庭成員的英語(yǔ)水平。接著,可以計(jì)算出各種度量以反映錯(cuò)報(bào)主問(wèn)題項(xiàng)目的不同方面,包括用于報(bào)告變異性的總誤差度量和用于報(bào)告偏差的凈誤差度量(參見(jiàn)Siegel & Swanson 2004)。
七、人口和語(yǔ)言學(xué)的分析方法
對(duì)于收集好的人口和語(yǔ)言使用數(shù)據(jù),可以使用多種方法來(lái)分析結(jié)果。
社會(huì)網(wǎng)絡(luò)分析。社會(huì)網(wǎng)絡(luò)分析是一種分析個(gè)人之間關(guān)系的方法,更具體地說(shuō),是一種分析社會(huì)行為者群體關(guān)系數(shù)據(jù)的方法。它處理網(wǎng)絡(luò)成員的數(shù)量、結(jié)構(gòu)屬性和位置屬性,例如他們的聲望、他們的社會(huì)聯(lián)系和群體協(xié)會(huì),因?yàn)樗鼈儽舜讼嗷ビ绊?。網(wǎng)絡(luò)的屬性會(huì)影響其在語(yǔ)言變化的傳播中的影響力,甚至影響其在競(jìng)爭(zhēng)的語(yǔ)言和方言之間采用特定語(yǔ)言或方言時(shí)的影響力。社會(huì)語(yǔ)言學(xué)中的經(jīng)典社會(huì)網(wǎng)絡(luò)分析之作是米爾羅伊(Milroy 1980);把社會(huì)網(wǎng)絡(luò)分析運(yùn)用到英國(guó)華人移民社區(qū)的語(yǔ)言選擇和語(yǔ)言轉(zhuǎn)換的則是李嵬(Li Wei 1994)。
生態(tài)分析。社會(huì)學(xué)家、人口統(tǒng)計(jì)學(xué)家和流行病學(xué)家長(zhǎng)期以來(lái)在人口、社會(huì)經(jīng)濟(jì)、健康和住房變量的變異研究中應(yīng)用了一種稱為生態(tài)相關(guān)的回歸分析方法。在生態(tài)分析中,觀察單位是地理單位(例如城市、縣或州),而不是個(gè)人。在研究一個(gè)變量與其他變量的變異時(shí),地理單位可能沒(méi)有特殊的地理意義。其目的是在非地理問(wèn)題上得出有關(guān)個(gè)人的推論。在從區(qū)域到個(gè)人的這種推理性飛躍中,存在很大的風(fēng)險(xiǎn),即得出的推理是謬誤的,因此必須謹(jǐn)慎地在有限的條件下應(yīng)用生態(tài)相關(guān)性。Haug & Wanner(2000)給出了一個(gè)生態(tài)分析應(yīng)用的例子,該分析利用語(yǔ)言群體的空間集中度來(lái)估算瑞士各語(yǔ)言群體之間生育率和死亡率的差異。
對(duì)人口問(wèn)題感興趣的語(yǔ)言學(xué)家傾向于使用以下方法。
比較語(yǔ)言學(xué)分析和歷史語(yǔ)言學(xué)分析。比較語(yǔ)言學(xué)分析包括測(cè)量語(yǔ)言之間的相似和差異,以確定其家族關(guān)系的程度和它們可能來(lái)自共同祖語(yǔ)的血統(tǒng)。語(yǔ)言之間的相似和差異是根據(jù)其語(yǔ)言特征來(lái)衡量的,即根據(jù)詞匯、句法/語(yǔ)法和物理表達(dá)(語(yǔ)音、手勢(shì)、重音、語(yǔ)調(diào)等)。在歷史語(yǔ)言學(xué)分析中,要利用歷史(包括史前的和考古學(xué)的)數(shù)據(jù)努力從一組相關(guān)語(yǔ)言中重建原始母語(yǔ)。為此,可以分析語(yǔ)言的基本單位,包括聲音(音位)和意義(語(yǔ)素),以及整個(gè)單詞和句法結(jié)構(gòu)。
比較語(yǔ)言學(xué)分析可以以多種方式得到應(yīng)用。可能會(huì)要求一組被調(diào)查者用當(dāng)?shù)胤窖詫?xiě)下某種標(biāo)準(zhǔn)語(yǔ)的許多對(duì)應(yīng)句子或短語(yǔ);或者,受過(guò)訓(xùn)練的田野研究者可以從個(gè)人觀察中記錄一系列物品的口語(yǔ)形式?,F(xiàn)在,電子設(shè)備是記錄被調(diào)查者的首選方法。
考古研究??脊艑W(xué)家發(fā)掘出的過(guò)去社會(huì)的文物可能包含各種有用的銘文和字形(符號(hào)標(biāo)記),可用于重建語(yǔ)言的歷史或某個(gè)特定語(yǔ)言的歷史。他們可能會(huì)對(duì)研究遷徙的方式和與其他社區(qū)的關(guān)系,尤其是對(duì)研究社會(huì)文化提供線索。分析骨骼殘留物和骨頭碎片則可以確定死者的年齡和死因。
進(jìn)化分析。進(jìn)化研究涉及調(diào)查工藝制品、文化習(xí)俗和生物的生理結(jié)構(gòu)等從最早的形態(tài)到現(xiàn)在的形式之變化和發(fā)展。這種類型的調(diào)查顯示了樹(shù)形圖分析的價(jià)值,該分析已被用于研究各種語(yǔ)言之間的歷史關(guān)系,并為各種民族語(yǔ)言群體的歷史關(guān)系提供了線索??梢栽诘乩砩献粉櫼恍┳迦旱恼Z(yǔ)言,以確定它們是否擁有關(guān)于某個(gè)文化習(xí)俗或器物的專門(mén)詞語(yǔ),而這些族群居住地周邊的其他族群的語(yǔ)言中卻沒(méi)有這些專門(mén)詞語(yǔ)。如果有這樣的詞語(yǔ)證據(jù),這就表明一個(gè)族群從其原始居住地遷移到了另一族群的居住地。
DNA分析。由于祖先的遷移和交配,生物的基因組或基因結(jié)構(gòu)從一個(gè)民族語(yǔ)言族群轉(zhuǎn)移到另一民族語(yǔ)言族群。DNA分析已被應(yīng)用到各種語(yǔ)言的現(xiàn)代說(shuō)話者身上,希望找到有關(guān)語(yǔ)言彼此之間關(guān)系的證據(jù),以及有關(guān)產(chǎn)生這些語(yǔ)言的原始語(yǔ)的證據(jù)。相信通過(guò)使用基因標(biāo)記,可以追溯語(yǔ)言的史前發(fā)展,包括其使用者的早期遷移模式和語(yǔ)言變化。最近的許多研究試圖應(yīng)用基因分析來(lái)確定史前時(shí)期的語(yǔ)言變化。這些研究涉及語(yǔ)言分類、語(yǔ)言的地理分布、語(yǔ)言的遷移以及語(yǔ)言變化等問(wèn)題。有關(guān)此類研究的討論,請(qǐng)參見(jiàn)Forster & Renfrew(2011),該研究試圖將某個(gè)地區(qū)的Y同源染色體頻率(男性優(yōu)勢(shì))與該可能性相關(guān)聯(lián),即男人語(yǔ)言(如與大量說(shuō)不同語(yǔ)言的女人結(jié)婚的男人的語(yǔ)言)將是該地區(qū)的共同語(yǔ)言。
DNA研究主要在撒哈拉以南的非洲進(jìn)行,在那里,在許多民族國(guó)家中,有許多小的民族語(yǔ)言族群,它們被“鎖定”在有限的地理區(qū)域中長(zhǎng)達(dá)數(shù)百年,甚至數(shù)千年。它們具有共同的生物繼承物、語(yǔ)言和文化,這與世界上其他大部分地區(qū)的情況不同,在世界其他地方,語(yǔ)言與文化的廣泛借用和種族之間的通婚已經(jīng)發(fā)生。因此,通過(guò)對(duì)撒哈拉以南非洲地區(qū)的民族語(yǔ)言族群進(jìn)行DNA分析來(lái)追蹤基因變化是可能的。分子人類學(xué)家S. Tishkoff和她的合作者團(tuán)隊(duì)分析了100多個(gè)非洲人中的1000多個(gè)DNA標(biāo)記的變異模式(Cole 2011)。從語(yǔ)言區(qū)別開(kāi)始,該項(xiàng)目有幾個(gè)目標(biāo)——繪制基因特征圖、重建歷史人口變化,并確定疾病的基因易感性。
個(gè)人名字分析。姓和名的分析旨在識(shí)別民族語(yǔ)言群體,確定其地理分布,跟蹤其遷移,以及用于其他用途。它用于補(bǔ)充其他測(cè)量民族語(yǔ)言群體的方法,這些方法被認(rèn)為是不準(zhǔn)確的,并且在相當(dāng)有規(guī)律的時(shí)間間隔內(nèi)不可使用。為了進(jìn)行姓氏分析,研究者制定并匹配了兩個(gè)獨(dú)立的名單。第一個(gè)名單旨在代表特定民族語(yǔ)言族群的成員中已被驗(yàn)證了的姓名列表,第二個(gè)名單是即將被確定的民族語(yǔ)言族群的成員的姓名列表。第一個(gè)名單通常由博學(xué)的專家或用計(jì)算機(jī)方法根據(jù)電話簿、選舉清單、家譜表和不同國(guó)家的類似來(lái)源編纂而成。除了匹配錯(cuò)誤之外,該方法還存在遺漏和收錄錯(cuò)誤,這些錯(cuò)誤產(chǎn)生的原因是婚姻導(dǎo)致的姓氏變更、姓氏屬于一個(gè)以上種族、拼寫(xiě)錯(cuò)誤和為了掩蓋原始的種族劃分而改名。因此,該方法充其量只是一種側(cè)面佐證的方法。
語(yǔ)言分析的其他方法包括口語(yǔ)中跨文化互動(dòng)分析、敘述和生活史研究、內(nèi)容分析(CA)、批評(píng)性話語(yǔ)分析(CDA)、讀寫(xiě)能力研究和語(yǔ)料庫(kù)語(yǔ)言學(xué)。例如,敘事和生活史研究可以提供有關(guān)語(yǔ)言變異和語(yǔ)言接觸的大量信息,社會(huì)語(yǔ)言學(xué)家可以通過(guò)深入的敘述和生活史研究來(lái)分析移民過(guò)程。
在語(yǔ)料收集方面,人口語(yǔ)言學(xué)家經(jīng)常使用民族志學(xué)的田野方法。人類學(xué)家傾向于將民族志學(xué)的田野方法視為其職業(yè)必不可少的技能和工具。民族志學(xué)的方法包括參與觀察、田野訪談、文檔收集與分析。這些方法包括一系列技術(shù),具體包括在現(xiàn)場(chǎng)筆記中記錄觀察和訪談、對(duì)實(shí)地經(jīng)歷進(jìn)行錄像。此外,在現(xiàn)場(chǎng)筆記中,人類學(xué)家可以將土著語(yǔ)(native language)錄音,特別是在土著語(yǔ)瀕于滅絕的情況下;最近,人類學(xué)家使用音頻和視頻設(shè)備來(lái)記錄土著語(yǔ)。田野訪談可能會(huì)很密集,以便獲得足夠的數(shù)據(jù)進(jìn)行分析;或者,它們可能是焦點(diǎn)群體的作品。并非總是可以保留現(xiàn)場(chǎng)筆記本來(lái)記錄現(xiàn)場(chǎng)采訪,但是在可能的情況下盡可能這樣做,并且以后會(huì)轉(zhuǎn)寫(xiě)現(xiàn)場(chǎng)筆記。收集的文件可能包括日記和生活史,也可能包括各種類型的官方文件。這項(xiàng)工作提出了地點(diǎn)選擇、與被試關(guān)系中的道德規(guī)范、口譯者的使用和方法的組織工作等問(wèn)題??梢詫?duì)各種類型的人進(jìn)行此類訪談,包括土著人、認(rèn)知障礙者和普通受訪者。
還有其他一些方法。
焦點(diǎn)小組。焦點(diǎn)小組是這樣一小組人,他們被召集在一起以表達(dá)對(duì)某一主題的看法,對(duì)這個(gè)主題,他們要么有經(jīng)驗(yàn),要么有觀點(diǎn)。這一方法被用于測(cè)試大型調(diào)查中所問(wèn)問(wèn)題的可行性,并獲得有關(guān)某些政治主題、消費(fèi)產(chǎn)品或政策問(wèn)題等的粗略定性信息。它們是從不說(shuō)優(yōu)勢(shì)語(yǔ)的人那里獲取有關(guān)個(gè)人態(tài)度和經(jīng)驗(yàn)信息的特別合適的方法。在這種情況下,焦點(diǎn)小組的會(huì)議進(jìn)程由雙語(yǔ)工作者以特定的社區(qū)語(yǔ)言進(jìn)行,而口譯員可以將會(huì)議進(jìn)程的觀感傳達(dá)給主要研究人員。至少兩個(gè)雙語(yǔ)工作人員的存在,增加了對(duì)回答進(jìn)行真實(shí)解釋的可能性。
語(yǔ)言地圖。在地圖上表示出語(yǔ)言的分布、語(yǔ)言的方言變異或語(yǔ)言結(jié)構(gòu)的“組成部分”的變異(例如語(yǔ)音、詞匯和語(yǔ)法),這是另一種有價(jià)值的分析工具。專題圖通常用于顯示語(yǔ)言現(xiàn)象。這些圖可以被設(shè)計(jì)為點(diǎn)密度圖、地區(qū)分布圖、比例符號(hào)圖和等高線圖。在地區(qū)分布圖中,地理亞單位通過(guò)顏色、陰影或交叉線圖案進(jìn)行區(qū)分,以顯示目標(biāo)變量中區(qū)域間的變異程度。等高線圖是顯示同言線的圖。同言線是邊界線,界定了所說(shuō)的特定語(yǔ)言的區(qū)域,或者界定了說(shuō)話者使用同一語(yǔ)言的變式形式的區(qū)域。
地理信息系統(tǒng)。地理信息系統(tǒng)(GIS)是一種計(jì)算機(jī)自動(dòng)化的系統(tǒng),它可以為由地理坐標(biāo)標(biāo)識(shí)的指定地理區(qū)域?qū)τ傻乩碜鴺?biāo)標(biāo)識(shí)的數(shù)據(jù)進(jìn)行編輯和制圖。地理坐標(biāo)信息和人口數(shù)據(jù)(或其他“內(nèi)容”的數(shù)據(jù))的鏈接是地理信息系統(tǒng)的基礎(chǔ)。全球制圖國(guó)際公司(GMI)已用地理信息系統(tǒng)的格式匯編了SIL《民族語(yǔ):世界語(yǔ)言》中列出的語(yǔ)言。GMI與美國(guó)國(guó)際語(yǔ)言學(xué)校合作開(kāi)發(fā)了一個(gè)世界7100種活語(yǔ)言的點(diǎn)和面(多邊形)位置的數(shù)據(jù)集。接著,GMI為第17版《民族語(yǔ):世界語(yǔ)言》中描述的語(yǔ)言制作了地圖,從而產(chǎn)生了世界語(yǔ)言地圖系統(tǒng)(WLMS)(SIL International 2014)。這些數(shù)據(jù)對(duì)于了解世界語(yǔ)言的位置和分布,研究人類文化多樣性與生物多樣性之間的關(guān)系、武裝沖突與語(yǔ)言邊界之間的關(guān)系,以及涉及語(yǔ)言的數(shù)量、所處位置和語(yǔ)言分布等其他情況具有寶貴的價(jià)值。
計(jì)算機(jī)建模和模擬。模型是人口現(xiàn)象、社會(huì)現(xiàn)象、經(jīng)濟(jì)現(xiàn)象或語(yǔ)言現(xiàn)象之間統(tǒng)計(jì)關(guān)系的概括表示。在人口統(tǒng)計(jì)學(xué)中,它可能是用于估計(jì)或預(yù)測(cè)人口的公式,或者是多個(gè)種族群體的特定年齡死亡率的通用模式。這個(gè)模型要么可以基于集合數(shù)據(jù)來(lái)表達(dá),可稱為宏觀模擬建模;要么可以用單個(gè)數(shù)據(jù)表達(dá),可稱為微觀模擬建模。模擬包括使用假定的數(shù)據(jù)評(píng)估某些模型的定量含義,以便了解模型中一個(gè)或多個(gè)變量對(duì)變量之間關(guān)系的影響。例如,模型可以表達(dá)下半個(gè)世紀(jì)美國(guó)各種假定的凈移入移民水平與人口增長(zhǎng)之間的關(guān)系。然后使用計(jì)算機(jī)評(píng)估模型的各種移民水平。
變異的測(cè)量。分析人員通常使用標(biāo)度來(lái)指示某些特征的變異性或經(jīng)歷某種事件的強(qiáng)度。因變量可以是連續(xù)的定量變量(如年齡)、非連續(xù)的定量變量(如完成學(xué)業(yè)的年份)或非定量的分層(序數(shù))變量?!懊绹?guó)社區(qū)調(diào)查”為獲得被調(diào)查者英語(yǔ)水平的信息,對(duì)在家中不說(shuō)英語(yǔ)的被調(diào)查者采用了一個(gè)序數(shù)非量化變量的四度量表——根本不說(shuō)、說(shuō)得不好、說(shuō)得好、說(shuō)得很好。基于一個(gè)或多個(gè)語(yǔ)法或語(yǔ)音規(guī)則,從較低級(jí)的方言到標(biāo)準(zhǔn)語(yǔ)言的轉(zhuǎn)換可以在線性刻度上標(biāo)示,例如從零到五。
新媒體和“大數(shù)據(jù)”。隨著計(jì)算機(jī)的廣泛使用和對(duì)社交媒體平臺(tái)(包括博客、在線社區(qū)和社交網(wǎng)站)的訪問(wèn),一種新型的社會(huì)研究成為可能,該社會(huì)研究集中在報(bào)道自然對(duì)話中人們談?wù)摰膶?duì)他們關(guān)系重大的問(wèn)題。此類數(shù)據(jù)不會(huì)在不久的將來(lái)取代現(xiàn)有的各種調(diào)查,但確實(shí)提供了補(bǔ)足現(xiàn)有調(diào)查的機(jī)會(huì),因?yàn)樗兄谡{(diào)查者對(duì)抽樣調(diào)查所獲得的資料進(jìn)行深入了解,有助于把調(diào)查覆蓋到傳統(tǒng)方法難以覆蓋的人群。
過(guò)去幾十年中開(kāi)發(fā)出來(lái)的一些新的通信設(shè)備,已經(jīng)徹底改變了新信息的傳播方式。這些技術(shù)發(fā)展讓世界上相當(dāng)大一部分人口可以通過(guò)互聯(lián)網(wǎng)、社交媒體(如臉書(shū)、推特、領(lǐng)英等)、手機(jī)和衛(wèi)星通信進(jìn)行連接。在一些最新設(shè)備問(wèn)世之前,調(diào)查者一直在通過(guò)計(jì)算機(jī)輔助的個(gè)人訪談來(lái)補(bǔ)充面對(duì)面訪談和郵寄問(wèn)卷?,F(xiàn)在的數(shù)字?jǐn)?shù)據(jù)已合并了傳統(tǒng)的采集方法來(lái)創(chuàng)建通信的新方式。
通信的數(shù)字形式允許在數(shù)以百萬(wàn)計(jì)的人之間實(shí)時(shí)聯(lián)網(wǎng)。這可以實(shí)現(xiàn)將信息材料從地球一端的參與者瞬時(shí)轉(zhuǎn)移到地球另一端的參與者。與成熟的民族志采訪和其他的面對(duì)面?zhèn)€人采訪相比,新媒體獲取信息的方式大不相同,但是由于各種原因,許多人無(wú)法觸及這些新媒體設(shè)備,因此新媒體不會(huì)取代傳統(tǒng)研究方式。
當(dāng)前的計(jì)算能力和存儲(chǔ)容量使分析生成的海量數(shù)據(jù)(通常稱為大數(shù)據(jù))成為可能。這些大數(shù)據(jù)是由政府、企業(yè)、互聯(lián)網(wǎng)服務(wù)供應(yīng)商以及其他機(jī)構(gòu)和公司收集和存儲(chǔ)的商業(yè)數(shù)據(jù)和行政數(shù)據(jù)。使用這些數(shù)據(jù)集,可以降低調(diào)查成本,減輕受訪者負(fù)擔(dān),改善和擴(kuò)大我們的社會(huì)經(jīng)濟(jì)指標(biāo),使之更加及時(shí)地獲得效應(yīng),并研究許多新問(wèn)題。
但錯(cuò)誤解釋和濫用數(shù)據(jù)的風(fēng)險(xiǎn)也很大。許多收集到的管理數(shù)據(jù)都是專有的,并且不代表任何特定人群。也沒(méi)有什么安全措施可以確保數(shù)據(jù)是準(zhǔn)確報(bào)告的。
目前正在開(kāi)發(fā)分析這些龐大數(shù)據(jù)的方法,但是使用它們來(lái)獲取有關(guān)人口行為和人口流動(dòng)的詳細(xì)信息的可能性是顯而易見(jiàn)的。企業(yè)已經(jīng)使用大數(shù)據(jù)來(lái)分析消費(fèi)者的行為,政府已經(jīng)使用大數(shù)據(jù)來(lái)檢查和保護(hù)公眾并跟蹤其運(yùn)行,教育機(jī)構(gòu)已經(jīng)使用大數(shù)據(jù)來(lái)進(jìn)行學(xué)術(shù)研究。
八、讀寫(xiě)能力
我在本文開(kāi)頭提到,人口和語(yǔ)言研究中,語(yǔ)言使用者(language user)這一概念比說(shuō)話者(speaker)更合適。這不僅是因?yàn)橐紤]到使用盲文和手語(yǔ)者的情況,也是為了讓研究者更多重視讀寫(xiě)能力(literacy)在人們語(yǔ)言生活中的地位。人口調(diào)查里語(yǔ)言的聽(tīng)說(shuō)讀寫(xiě)應(yīng)當(dāng)分別提問(wèn)。如果人們可以閱讀或書(shū)寫(xiě),則可以認(rèn)為他們具備讀寫(xiě)能力,不是文盲。文盲數(shù)據(jù)往往在人口調(diào)查中有所表現(xiàn)。在缺乏文盲數(shù)據(jù)的情況下,可以用教育水平數(shù)據(jù)來(lái)估測(cè)文盲數(shù)據(jù)。有一種特殊類型的讀寫(xiě)能力被稱為功能性文盲(functional illiteracy)。功能性文盲被定義為在社會(huì)中執(zhí)行某些基本功能的必要的讀寫(xiě)能力。實(shí)際上,由于每個(gè)國(guó)家對(duì)完成學(xué)業(yè)的要求不同,對(duì)履行基本職能的社會(huì)要求不同,各國(guó)對(duì)功能性文盲的定義也有所不同。在美國(guó),有時(shí)候是以在學(xué)校接受教育的年數(shù)為標(biāo)準(zhǔn)定義讀寫(xiě)能力的,完成4年學(xué)校教育到中學(xué)畢業(yè)之間的狀況為具備讀寫(xiě)能力,中學(xué)畢業(yè)為具備功能性讀寫(xiě)能力(functional literacy)。因此美國(guó)在人口普查或調(diào)查中不經(jīng)常收集人們讀寫(xiě)能力方面的數(shù)據(jù)。欠發(fā)達(dá)國(guó)家經(jīng)常調(diào)查此類數(shù)據(jù),不過(guò),更多的數(shù)據(jù)來(lái)源于有關(guān)教育發(fā)展以外的其他問(wèn)題的抽樣調(diào)查中。“人口與健康調(diào)查”(DHS)通常要求被調(diào)查者從以下3種教育水平中作出選擇:未上過(guò)學(xué),上過(guò)小學(xué),上過(guò)中學(xué)及以上。假定沒(méi)有上過(guò)學(xué)的人和一部分上過(guò)小學(xué)的人不具備讀寫(xiě)能力,這些數(shù)據(jù)可以用來(lái)估算文盲的比例。
在1997年之前,美國(guó)“人口與健康調(diào)查”通過(guò)詢問(wèn)婦女是否能夠閱讀和理解信件或報(bào)紙來(lái)測(cè)量她們的讀寫(xiě)能力。如果婦女回答“不難”或“困難”,則被認(rèn)為具備讀寫(xiě)能力。1997年之后,“人口與健康調(diào)查”通過(guò)要求女性閱讀簡(jiǎn)單的句子來(lái)測(cè)量她們的讀寫(xiě)能力,如果被調(diào)查人可以閱讀部分句子或全部句子,則被認(rèn)為不是文盲。具有中等或更高學(xué)歷的婦女被推測(cè)具備讀寫(xiě)能力,那么語(yǔ)句閱讀的測(cè)試僅針對(duì)那些受教育程度較低的婦女。
除了各國(guó)政府提供的有關(guān)讀寫(xiě)能力的數(shù)據(jù)外,聯(lián)合國(guó)教科文組織還根據(jù)從各個(gè)國(guó)家收到的數(shù)據(jù)匯編讀寫(xiě)能力的估計(jì)值,并以印刷形式和互聯(lián)網(wǎng)形式發(fā)布其匯編。通過(guò)欠發(fā)達(dá)地區(qū)的自我報(bào)告而獲得的有關(guān)讀寫(xiě)能力數(shù)據(jù)的質(zhì)量可能因地而異,這主要是因?yàn)椴煌貐^(qū)讀寫(xiě)能力所要求的讀寫(xiě)水平的標(biāo)準(zhǔn)不同??梢圆捎脮?shū)面或口頭測(cè)試來(lái)實(shí)現(xiàn)更大程度的可比性,但是這種收集程序更加復(fù)雜,既昂貴又耗時(shí)??偠灾?,目前還沒(méi)有關(guān)于欠發(fā)達(dá)國(guó)家人口讀寫(xiě)能力的準(zhǔn)確數(shù)據(jù)。
九、國(guó)際人口趨勢(shì)
由于各種語(yǔ)言的使用者數(shù)量與人口數(shù)量相對(duì)應(yīng),人口的計(jì)算或估計(jì),尤其是有關(guān)人口地理分布的數(shù)據(jù),對(duì)于理解各種語(yǔ)言的使用者數(shù)量及其地理分布非常重要。而人口預(yù)測(cè)可以提供未來(lái)幾年人口可能的增長(zhǎng)數(shù)量和分布情況,對(duì)于判斷各種語(yǔ)言使用者的未來(lái)可能數(shù)量及其分布也同樣重要。簡(jiǎn)而言之,關(guān)于人口變化的信息對(duì)于研究語(yǔ)言的增長(zhǎng)和衰退至關(guān)重要。
根據(jù)美國(guó)人口普查局的估計(jì),2015年世界上有73億人,其中44億人居住在亞洲,這中間14億居住在中國(guó),13億居住在印度。非洲的總?cè)丝冢?2億)少于中國(guó)或印度,而歐洲人口只有7億,拉丁美洲/加勒比地區(qū)只有6億,北美只有4億。因此,世界上大多數(shù)人生活在亞洲,超過(guò)了整個(gè)西半球、非洲和歐洲的人口總和。近幾十年來(lái)出現(xiàn)了大量國(guó)際移民,特別是從欠發(fā)達(dá)地區(qū)移向較發(fā)達(dá)地區(qū)。盡管較發(fā)達(dá)地區(qū)接收了這么多移民,而且這些地區(qū)的人口死亡率在持續(xù)降低,但世界上大多數(shù)人口增長(zhǎng)仍然出現(xiàn)在欠發(fā)達(dá)地區(qū),而不是較發(fā)達(dá)地區(qū)。這是因?yàn)榍钒l(fā)達(dá)地區(qū)的人口生育率比較發(fā)達(dá)地區(qū)高得多,這不僅抵消了欠發(fā)達(dá)地區(qū)由于國(guó)際移民造成的人口流失,而且也抵消了較發(fā)達(dá)地區(qū)因人口增壽而獲得的增加值。然而,由于許多欠發(fā)達(dá)國(guó)家的生育率下降,世界人口增長(zhǎng)正在放緩。
世界上較發(fā)達(dá)國(guó)家長(zhǎng)期以來(lái)一直處于低生育率和低死亡率的軌道上。結(jié)果,他們正經(jīng)歷著迅速的老齡化,最佳工作年齡段的人口比例較低,而老年人的比例較高(65歲及以上的人口比例為17%)。在欠發(fā)達(dá)國(guó)家中也出現(xiàn)了類似的趨勢(shì),但是這種變化發(fā)生的時(shí)間滯后了幾十年(65歲及以上的人口比例為6%)。它們現(xiàn)在也正在經(jīng)歷老齡化,盡管比較發(fā)達(dá)地區(qū)的速度慢。更準(zhǔn)確地說(shuō),世界各國(guó)人口的老齡化是以下三者共同作用的結(jié)果:生育率下降,老年人死亡率比年輕人死亡率下降更大,從中年活到老年的成功率越來(lái)越高。
雖然較發(fā)達(dá)地區(qū)的大多數(shù)人口居住在城市地區(qū)(77%),并且其人口在繼續(xù)“城市化”,但欠發(fā)達(dá)地區(qū)的人口城市化進(jìn)程要快得多。2015年,欠發(fā)達(dá)地區(qū)約48%的人口生活在城市地區(qū),而在2000年,這一比例只是38%。而在較發(fā)達(dá)地區(qū),2000年這一比例是75%,僅僅略低于2015年。
十、與中國(guó)的語(yǔ)言和人口相關(guān)的主題
中國(guó)正在經(jīng)歷重大的社會(huì)人口變化,有許多問(wèn)題需要系統(tǒng)地研究。在海外,大多數(shù)人關(guān)心的都是中國(guó)獨(dú)生子女政策的影響,將獨(dú)生子女政策作為人口規(guī)劃的一項(xiàng)關(guān)鍵政策。該政策究竟如何影響?yīng)毶优彝サ恼Z(yǔ)言發(fā)展,需要仔細(xì)研究。但是最近中國(guó)有關(guān)二孩政策的變化導(dǎo)致了新一代孩子的出生,很多二胎孩子與哥哥或姐姐的年齡差超出了正常的范圍,有的甚至超過(guò)了10歲。一些年長(zhǎng)的哥哥或姐姐承擔(dān)了照顧兒童的角色。這一定會(huì)對(duì)家庭語(yǔ)言政策以及家庭中年齡較大和較小兒童的語(yǔ)言發(fā)展產(chǎn)生影響。
在人口老齡化方面,中國(guó)也正面臨著嚴(yán)峻的挑戰(zhàn)。語(yǔ)言發(fā)展、老年人疾病、與老年人的交流和老年人的護(hù)理都是社會(huì)政策的重要問(wèn)題。與此相關(guān)的常見(jiàn)現(xiàn)象是祖父母對(duì)小孩的養(yǎng)育(與父母對(duì)孩子的養(yǎng)育形成對(duì)照)。如果家庭中孩子的主要照顧者是年老的祖父母,那么他們的語(yǔ)言示范對(duì)幼童的語(yǔ)言發(fā)展有什么影響?
當(dāng)然,在中國(guó),語(yǔ)言和人口統(tǒng)計(jì)方面最大的問(wèn)題是大規(guī)模移民。移民是中國(guó)工業(yè)化和城市化的一部分。不同方言背景的人群進(jìn)入城市中心,與其他語(yǔ)言和方言的使用者接觸。學(xué)者們對(duì)大城市的移民和人們的語(yǔ)言態(tài)度進(jìn)行了研究。但是,更需要學(xué)者認(rèn)真研究語(yǔ)言結(jié)構(gòu)以及它們?nèi)绾问艿揭泼窈驼Z(yǔ)言接觸的影響。父母移民到城市甚至海外的“留守”兒童的語(yǔ)言和讀寫(xiě)能力的發(fā)展與教育是需要引起更多重視的重要政策問(wèn)題。
技術(shù)的進(jìn)步正在改變?nèi)藗儽舜私涣骱褪褂谜Z(yǔ)言的方式。隨著越來(lái)越多的人城市化并使用新的媒體技術(shù)進(jìn)行交流,他們的語(yǔ)言實(shí)踐也將隨之發(fā)生變化。這也是未來(lái)研究的重要主題。
總之,人口與語(yǔ)言之間的關(guān)系也成為新的跨學(xué)科的研究領(lǐng)域。中國(guó)作為世界人口大國(guó),人口結(jié)構(gòu)繼續(xù)不斷地發(fā)生著巨變,這些變化對(duì)語(yǔ)言的影響,語(yǔ)言在人口結(jié)構(gòu)中的作用,都成為繼續(xù)全面系統(tǒng)研究的課題,其結(jié)果對(duì)各種社會(huì)政策及服務(wù)都具有重要意義。
參考文獻(xiàn)
Baldwin-Edwards, M. 2006. Migration between Greece and Turkey: From the “Exchange of Populations” to non-recognition of borders. South East Europe Review?9(3), 115–122.
Cole, B. 2011. In the blood. Penn Arts and Sciences Magazine, Fall/Winter issue, 2011.
Coulmas, F. 1997. Introduction. In F. Coulmas (ed.), Sociolinguistics. Oxford: Blackwell Publishers.
Courbage, Y. 1998. Survey of the statistical sources on religion, language(s), national and ethnic group in Europe. In W. Haug, Y. Courbage & P. Compton (eds.), The Demographic Characteristics of National Minorities in Certain European States, Vol. I. Strasbourg: Council of Europe.
Forster, P. & C. Renfrew. 2011. Mother tongue and Y chromosomes. Science?333, September 9.
Haug, W. & P. Wanner. 2000. In W. Haug, Y. Courbage & P. Compton (eds.), The Demographic Situation of Language and Religious Groups in Switzerland (Vol. II).?Strasbourg: Council of Europe.
Haug, W., Y. Courbage & P. Compton. (eds.) 1998. The Demographic Characteristics of National Minorities in Certain European States (Vol. I). Strasbourg: Council of Europe.
Haug, W., Y. Courbage & P. Compton. (eds.) 2000. The Demographic Characteristics of National Minorities in Certain European States (Vol. II). Strasbourg: Council of Europe.
Li, W. 1994. Three Generations Two Languages One Family. Clevedon: Multilingual Matters.
Milroy, L. 1980. Language and Social Networks. Oxford: Blackwell Publishers.
Nieminen, M. 2000. The demographic characteristics of the Swedish speaking population in Finland. In W. Haug, Y. Courbage & P. Compton (eds.), The Demographic Characteristics of National Minorities in Certain European States (Vol. II).?Strasbourg: Council of Europe.
Siegel, J. S. 2018. Demographic and Socioeconomic Basis of Ethnolinguistics. London: Springer.
Siegel, J. S. & D. A. Swanson. (eds.) 2004. The Methods and Materials of Demography?(2nd edn.). San Diego: Elsevier Academic Press.
SIL International. 2014. Ethnologue: Languages of the World?(17th edn.). In M. P. Lewis, G. F. Simons & C. D. Fennig (eds.), Dallas: SIL International. Online version: www.ethnologue.com.
SIL International. 2015. Ethnologue: Languages of the World?(18th edn.). In M. P. Lewis, G. F. Simons & C. D. Fennig (eds.), Dallas: SIL International. Online version: www.ethnologue.com.
SIL International. 2016. Ethnologue: Languages of the World (19th edn.). In M. P. Lewis, G. F. Simons & C. D. Fennig (eds.), Dallas: SIL International. Online version: www.ethnologue.com.
SIL International. 2020. Ethnologue: Languages of the World?(20th edn.). In G. F. Simons & C. D. Fennig (eds.), Dallas: SIL International. Online version: www.ethnologue.com.
Wiley, T. G. 2010. Language policy in the USA. In K. Potowski (ed.), Language Diversity in the United States. Cambridge: Cambridge University Press.
Wojtynska, A. & K. E. Har?ardóttir. 2012. Researching immigrant populations: The case of Iceland. Paper presented at the International Conference on Methods for Surveying and Enumerating Hard-to-Reach Populations, New Orleans, December, 2012.
World Mapping International. 2016. World language mapping system: Language area and point data for geographic information systems (GIS). In World?GeoDatasets. Colorado Springs: World Mapping International.
責(zé)任編輯:王 飆