李偉平,權(quán)德慶,蔡 軍,魏 華,雷 文
近年來,城鎮(zhèn)居民人均可支配收入不斷提高,消費(fèi)結(jié)構(gòu)進(jìn)一步升級(jí),生存型消費(fèi)支出在消費(fèi)總支出中所占比重逐步下降,為體育消費(fèi)發(fā)展創(chuàng)造了良好的社會(huì)條件。中央明確要求,構(gòu)建群眾性體育服務(wù)體系,積極引導(dǎo)群眾體育消費(fèi)[11]。體育事業(yè)發(fā)展“十二五”規(guī)劃著重提出,要引導(dǎo)和擴(kuò)大體育消費(fèi)需求,適應(yīng)人民群眾生活水平提高、消費(fèi)結(jié)構(gòu)變化的新形勢(shì)[7]。實(shí)現(xiàn)引導(dǎo)和擴(kuò)大城鎮(zhèn)居民體育消費(fèi)的目標(biāo),非常有必要對(duì)城鎮(zhèn)居民體育消費(fèi)結(jié)構(gòu)及其特征進(jìn)行調(diào)查和追蹤調(diào)查。據(jù)文獻(xiàn)資料顯示,國(guó)內(nèi)眾多學(xué)者已開展了系列的調(diào)查研究,并取得了一些重要的調(diào)研成果[2,6,9],但是,由于調(diào)查數(shù)據(jù)分析技術(shù)的局限,以往對(duì)數(shù)據(jù)的處理主要采用描述統(tǒng)計(jì)分析,然而,數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等信息技術(shù)的迅速發(fā)展和關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)和決策樹等數(shù)據(jù)挖掘技術(shù)的普及應(yīng)用,為探索調(diào)研數(shù)據(jù)背后隱藏的深層次知識(shí)與數(shù)量規(guī)律性提供了新的技術(shù)和手段,也為研究城鎮(zhèn)居民體育消費(fèi)結(jié)構(gòu)及其特征拓展了新的視角。因此,選擇適當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù)研究和探討城鎮(zhèn)居民體育消費(fèi)結(jié)構(gòu)特點(diǎn),識(shí)別城鎮(zhèn)居民不同體育消費(fèi)水平的特征,探尋城鎮(zhèn)居民體育消費(fèi)項(xiàng)目的內(nèi)在關(guān)聯(lián)性,對(duì)研究城鎮(zhèn)居民體育消費(fèi)的統(tǒng)計(jì)規(guī)律性具有重要啟發(fā)意義。
本研究運(yùn)用文獻(xiàn)資料調(diào)研的方式對(duì)現(xiàn)有研究成果進(jìn)行梳理,并結(jié)合開放式問卷、專家走訪及調(diào)查對(duì)象訪談等方法形成了初測(cè)問卷,隨后經(jīng)過3輪專家調(diào)查確定其信度和效度。調(diào)查問卷內(nèi)部一致性信度為0.86,重測(cè)信度為0.84,其結(jié)構(gòu)效度的檢驗(yàn)運(yùn)用因子分析確定城鎮(zhèn)居民體育消費(fèi)調(diào)查內(nèi)容的結(jié)構(gòu)維度及各所包含的題項(xiàng),并用主成分分析的方法來驗(yàn)證其構(gòu)想效度,結(jié)果顯示較為理想,有100%的調(diào)查項(xiàng)目的共同度達(dá)到了0.50以上(共同度是否達(dá)到0.5以上是項(xiàng)目檢查統(tǒng)計(jì)學(xué)上的要求)。
數(shù)據(jù)收集采用分層抽樣和簡(jiǎn)單隨機(jī)抽樣為主的抽樣方法,對(duì)西安市八區(qū)五縣的城鎮(zhèn)居民進(jìn)行抽樣。在樣本量的選定上,學(xué)者Tinsley(1987)[5]建議,問卷項(xiàng)目總數(shù)與被測(cè)樣本量比例最好大于10∶1,由于本研究所采用的調(diào)查項(xiàng)目為45項(xiàng),因此,樣本數(shù)目至少要450份以上。本研究選擇樣本量為1350個(gè),符合社會(huì)學(xué)研究的樣本需求,共發(fā)放問卷1350份,回收問卷1197份,回收率為88.67%,有效問卷973份,有效率為72.07%。
數(shù)據(jù)挖掘就是從大量的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中、不易察覺的又可能有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘(Data Mining)又稱為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是基于機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析原有的數(shù)據(jù),進(jìn)行歸納性推理,從數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)庫(kù)中提取可信的、新穎的、有效的、人們感興趣的、能幫人理解的知識(shí)的高級(jí)處理過程。這些知識(shí)是隱含的、事先未知的有用信息,提取的知識(shí)表現(xiàn)為概念、規(guī)則、模式、規(guī)律等形式,以幫助管理者做出正確的決策。它給出了數(shù)據(jù)特性或數(shù)據(jù)之間的關(guān)系,是對(duì)數(shù)據(jù)所包含的信息更抽象的描述。數(shù)據(jù)挖掘的主要目的是提高決策能力,檢測(cè)異常模式,在過去的經(jīng)驗(yàn)基礎(chǔ)上預(yù)言未來趨勢(shì)等。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別在于,數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí),數(shù)據(jù)挖掘所得到的信息應(yīng)具有先前未知、有效和可解釋三個(gè)特征。常用的數(shù)據(jù)挖掘方法包括人工神經(jīng)網(wǎng)路、決策樹、邏輯回歸、支持向量機(jī)以及樸素貝葉斯等[10,12,15]。
本研究中數(shù)據(jù)挖掘的流程按照CRISP-DM(Cross-Industry Standard Process for Data Mining)的標(biāo)準(zhǔn)實(shí)施,主要分為以下6個(gè)步驟:定義問題、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、模型建立、結(jié)果評(píng)估和模型發(fā)布[12]。第一步是定義問題:本研究中數(shù)據(jù)挖掘的主要目的是獲取體育消費(fèi)結(jié)構(gòu)特征信息,識(shí)別不同消費(fèi)水平城鎮(zhèn)居民的特征,研究城鎮(zhèn)居民體育消費(fèi)的規(guī)律性,探尋城鎮(zhèn)居民體育消費(fèi)項(xiàng)目?jī)A向。第二步是數(shù)據(jù)理解:收集到的問卷調(diào)查數(shù)據(jù)全部為分類數(shù)據(jù),不同的數(shù)據(jù)對(duì)應(yīng)于所需研究的具體問題。第三步是數(shù)據(jù)準(zhǔn)備:原始數(shù)據(jù)庫(kù)有1197個(gè)樣本,經(jīng)過篩選排除無回答、缺失值或回答不符合本研究需要的樣本,剩下973個(gè)樣本。數(shù)據(jù)分割的比例配比為訓(xùn)練集(40%),測(cè)試集(30%),驗(yàn)證集(30%)。分割方法為簡(jiǎn)單隨機(jī)抽樣,利用Clementine 12.0的Partition節(jié)點(diǎn)完成。分割后的三個(gè)數(shù)據(jù)集用新增變量Partition的取值標(biāo)識(shí),但仍合并在同一個(gè)數(shù)據(jù)文件里。對(duì)變量進(jìn)行歸類,將其歸為用以劃分?jǐn)?shù)據(jù)集的篩選變量和分析變量;第四步是建立合適的模型:利用數(shù)據(jù)挖掘中的KMeans快速聚類法、序列關(guān)聯(lián)規(guī)則、決策樹、貝葉斯網(wǎng)絡(luò)、C&R決策樹、CHAD決策樹、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)和QUEST決策樹等分別構(gòu)建模型。第五是模型的評(píng)估:選用提升圖、分類矩陣等方法進(jìn)行技術(shù)上的評(píng)估,依據(jù)各模型的效果選擇合適的模型,分別對(duì)城鎮(zhèn)居民體育消費(fèi)構(gòu)成、項(xiàng)目以及不同體育消費(fèi)水平城鎮(zhèn)居民特征進(jìn)行進(jìn)一步分析,在應(yīng)用時(shí)也需結(jié)合實(shí)際情況加以調(diào)整。第六步是結(jié)果發(fā)布。
3.1.1 西安市城鎮(zhèn)居民體育消費(fèi)支出構(gòu)成基本情況
在西安市城鎮(zhèn)居民的日常消費(fèi)支出中(表1),衣、食、住、行是目前西安市城鎮(zhèn)居民最主要的支出,占被調(diào)查者總數(shù)的97.71%。醫(yī)療保健和教育分別占被調(diào)查者總數(shù)的65.98%和61.87%,居第二位和第三位,有39.98%的被調(diào)查者日常消費(fèi)支出中涉及體育消費(fèi)支出內(nèi)容。西安市城鎮(zhèn)居民日常消費(fèi)支出第一選擇中排前三位的依次為衣、食、住、行,教育,醫(yī)療保?。辉诘诙x擇和第三選擇中,教育和醫(yī)療保健分別排名第一位、第二位;體育在第一選擇、第二選擇和第三選擇中分別排名倒數(shù)第二、倒數(shù)第二和倒數(shù)第四,這表明衣、食、住、行等基本消費(fèi)支出是西安市城鎮(zhèn)居民日常消費(fèi)支出首要考慮的問題,體育消費(fèi)在西安市城鎮(zhèn)居民的日常消費(fèi)支出中所占比例仍然處于較低水平。
表1 本研究西安市城鎮(zhèn)居民日常消費(fèi)支出構(gòu)成情況一覽表Table 1 Composition of Urban Residents in the Daily Consumption Expenditure of Xi’an City
3.1.2 西安市城鎮(zhèn)居民體育消費(fèi)支出構(gòu)成關(guān)聯(lián)性特征
在西安市城鎮(zhèn)居民體育消費(fèi)調(diào)查分析中,通過傳統(tǒng)的描述統(tǒng)計(jì)分析,能夠發(fā)現(xiàn)城鎮(zhèn)居民日常消費(fèi)支出的基本構(gòu)成情況,反映出城鎮(zhèn)居民日常消費(fèi)的基本特征和體育消費(fèi)支出在日常消費(fèi)支出中的比重。但是,當(dāng)被調(diào)查者第一選擇的消費(fèi)支出是衣食住行時(shí),后續(xù)選擇中出現(xiàn)體育消費(fèi)支出的可能性;或者是當(dāng)?shù)谝贿x擇和第二選擇等前項(xiàng)選擇是衣食住行、教育等消費(fèi)支出時(shí),后續(xù)選擇中出現(xiàn)體育消費(fèi)支出的可能性等問題很難通過運(yùn)用描述統(tǒng)計(jì)方法予以解決。在上述問題中,被調(diào)查者的選擇行為彼此有先后的關(guān)系,從第一選擇到第五選擇代表一定的前后順序,第一選擇在前,第五選擇在后,并呈現(xiàn)出一定的關(guān)聯(lián)性特征。因此,從所收集到的大量序列數(shù)據(jù)中,挖掘城鎮(zhèn)居民日常消費(fèi)支出選擇的前后關(guān)聯(lián)性特征,進(jìn)而推斷其后續(xù)的發(fā)生可能,對(duì)于研究城鎮(zhèn)居民體育消費(fèi)支出構(gòu)成特征具有更為重要的意義。
本研究通過運(yùn)用spss-Clementine 12.0數(shù)據(jù)挖掘平臺(tái),建立序列關(guān)聯(lián)規(guī)則模型,對(duì)“西安市城鎮(zhèn)居民體育消費(fèi)調(diào)查”數(shù)據(jù)庫(kù)中西安市城鎮(zhèn)居民體育消費(fèi)支出構(gòu)成調(diào)查數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,給定最小支持度和最小置信度的閾值均為30%(序列關(guān)聯(lián)規(guī)則的支持度定義為包含某序列規(guī)則的事務(wù)數(shù)占總事務(wù)的比例;序列關(guān)聯(lián)規(guī)則的置信度定義為同時(shí)包含前項(xiàng)和后項(xiàng)的事務(wù)數(shù)與僅包含前項(xiàng)的事務(wù)數(shù)的比,也是規(guī)則支持度與前項(xiàng)支持度的比[12],得到涉及體育消費(fèi)支出的關(guān)聯(lián)規(guī)則(表2)。
表2 本研究西安市城鎮(zhèn)居民體育消費(fèi)支出構(gòu)成關(guān)聯(lián)規(guī)則一覽表Table 2 Urban Residents’Sports Consumption Expenditure of Xi’an City Association Rules
從序列關(guān)聯(lián)規(guī)則可知,規(guī)則1表示日常消費(fèi)支出中選擇衣食住行和儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有體育消費(fèi)支出的置信度為37.15%。規(guī)則2和規(guī)則8顯示,日常消費(fèi)支出中選擇儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有體育消費(fèi)支出的置信度為37.02%;日常消費(fèi)支出中選擇儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有醫(yī)療保健支出的置信度為31.31%。這表明,城鎮(zhèn)居民在選擇儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于醫(yī)療保健支出的可能性。規(guī)則4和規(guī)則9顯示,日常消費(fèi)支出中選擇教育>儲(chǔ)蓄的城鎮(zhèn)居民還將會(huì)有體育消費(fèi)支出的置信度為33.70%;日常消費(fèi)支出中選擇教育>儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有旅游支出的置信度為31.31%。這表明,城鎮(zhèn)居民在選擇教育>儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于旅游支出的可能性。規(guī)則3和規(guī)則10顯示,日常消費(fèi)支出中選擇衣食住行>教育>儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有體育消費(fèi)支出的置信度為35.26%;日常消費(fèi)支出中選擇衣食住行>教育>儲(chǔ)蓄的城鎮(zhèn)居民,還將會(huì)有文化娛樂支出的置信度為31.00%。這表明,城鎮(zhèn)居民在選擇衣食住行>教育>儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于文化娛樂支出的可能性。
3.2.1 西安市城鎮(zhèn)居民體育消費(fèi)項(xiàng)目的基本情況
表3顯示,西安市城鎮(zhèn)居民體育消費(fèi)中前五位的項(xiàng)目分別為購(gòu)買體育服裝、鞋、帽(28.18%),觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽(19.02%),到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉(10.90%),健身、健康咨詢(7.41%)和購(gòu)買體育健身器材(6.44%)。由此判斷購(gòu)買體育服裝、鞋、帽,觀看體育比賽(電視、網(wǎng)絡(luò)、手機(jī))和到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉是城鎮(zhèn)居民主要的體育消費(fèi)項(xiàng)目。
表3 本研究西安市城鎮(zhèn)居民的體育消費(fèi)項(xiàng)目情況一覽表Table 3 Urban Residents’Sports Consumption of Xi’an City Project
從體育消費(fèi)的發(fā)展態(tài)勢(shì)上看,滿足基本體育鍛煉需求的體育服裝、鞋、帽已不再是體育消費(fèi)的全部,城鎮(zhèn)居民的體育消費(fèi)內(nèi)容呈現(xiàn)出多元化特征,體育消費(fèi)內(nèi)容開始逐步延伸到健身、健康咨詢、體育旅游和訂閱體育書刊、體育雜志等享受體育精神文化和享受體育生活質(zhì)量方面,但是,當(dāng)前城鎮(zhèn)居民的體育消費(fèi)整體上仍處于由實(shí)物型體育消費(fèi)向參與型體育消費(fèi)和觀賞型體育消費(fèi)過渡的階段。調(diào)查中還發(fā)現(xiàn),在購(gòu)買體育服裝、鞋、帽,訂閱體育書刊、體育雜志,購(gòu)買體育郵票、紀(jì)念品、球迷產(chǎn)品等體育消費(fèi)支出方面,女性體育消費(fèi)者多于男性體育消費(fèi)者;在到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉,接受專業(yè)的健身指導(dǎo)、體育旅游和觀看體育比賽等方面,男性體育消費(fèi)者多于女性。女性體育消費(fèi)者更傾向于實(shí)物型體育消費(fèi),而男性體育消費(fèi)者更傾向于參與型體育消費(fèi)和觀賞型體育消費(fèi)。
3.2.2 西安市城鎮(zhèn)居民體育消費(fèi)項(xiàng)目的關(guān)聯(lián)性特征
本研究通過運(yùn)用SPSS-Clementine12.0數(shù)據(jù)挖掘平臺(tái),建立序列關(guān)聯(lián)規(guī)則模型,對(duì)“西安市城鎮(zhèn)居民體育消費(fèi)調(diào)查”數(shù)據(jù)庫(kù)中西安市城鎮(zhèn)居民體育消費(fèi)項(xiàng)目調(diào)查數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,給定最小支持度和最小置信度的閾值均為30%,得到涉及體育消費(fèi)支出的關(guān)聯(lián)規(guī)則(表4)。
表4 本研究西安市城鎮(zhèn)居民體育消費(fèi)項(xiàng)目的關(guān)聯(lián)規(guī)則一覽表Table 4 Association Rules of Urban Residents’Sports Consumption Project of Xi'an City
從序列關(guān)聯(lián)規(guī)則(表4)可知,規(guī)則1表示,體育消費(fèi)項(xiàng)目中選擇購(gòu)買體育服裝、鞋、帽和購(gòu)買體育健身器材的城鎮(zhèn)居民,還將會(huì)選擇接受專業(yè)的健身指導(dǎo)的置信度為42.90%。規(guī)則2表示,體育消費(fèi)項(xiàng)目中選擇到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉和體育康復(fù)醫(yī)療的城鎮(zhèn)居民,還將會(huì)選擇健身、健康咨詢的置信度為42.05%。規(guī)則3和規(guī)則4顯示,體育消費(fèi)項(xiàng)目中選擇購(gòu)買體育服裝、鞋、帽的城鎮(zhèn)居民,還將會(huì)選擇接受專業(yè)的健身指導(dǎo)的置信度為39.61%;體育消費(fèi)項(xiàng)目中選擇購(gòu)買體育服裝、鞋、帽的城鎮(zhèn)居民,還將會(huì)選擇觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽的置信度為30.78%。這表明,城鎮(zhèn)居民在選擇購(gòu)買體育服裝、鞋、帽以后,將選擇接受專業(yè)的健身指導(dǎo)的可能性大于用于觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽的可能性。規(guī)則5和規(guī)則6顯示,體育消費(fèi)項(xiàng)目中選擇到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉的城鎮(zhèn)居民,還將會(huì)選擇訂閱體育書刊、體育雜志的置信度為35.82%;體育消費(fèi)項(xiàng)目中選擇到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉的城鎮(zhèn)居民,還將會(huì)選擇購(gòu)買體育服裝、鞋、帽的置信度為55.71%。這表明,城鎮(zhèn)居民在選擇到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉以后,將選擇購(gòu)買體育服裝、鞋、帽的可能性大于用于訂閱體育書刊、體育雜志的可能性。
3.2.3 西安市城鎮(zhèn)居民預(yù)期體育消費(fèi)的項(xiàng)目情況
調(diào)查結(jié)果顯示,有28.6%的受訪者首選的預(yù)期體育消費(fèi)項(xiàng)目是到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉。從受訪者的文化程度看,小學(xué)及以下文化程度受訪者,其預(yù)期體育消費(fèi)項(xiàng)目是購(gòu)買體育服裝、鞋、帽,比重為18.9%;碩士及以上學(xué)位的受訪者的預(yù)期體育消費(fèi)項(xiàng)目是體育旅游,比重是9.82%;而受訪者是初中、高中、中專、大專及本科文化程度的,其首選預(yù)期體育項(xiàng)目均是到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉,其比重分別是 22.7%、24.2%、25%、26.5% 和27.8%。
對(duì)不同收入受訪者分析,月收入在6000元以上的受訪者其首選預(yù)期體育消費(fèi)項(xiàng)目都是接受專業(yè)的健身指導(dǎo),月收入在2000元以下的受訪者,其預(yù)期體育消費(fèi)項(xiàng)目是購(gòu)買體育服裝、鞋、帽,其他收入水平的受訪者都是到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉。
按受訪者的不同職業(yè)分,只有離、退休人員及自由職業(yè)者的首選預(yù)期體育消費(fèi)項(xiàng)目,是觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽,其他職業(yè)者的首選預(yù)期體育消費(fèi)項(xiàng)目,都是到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉。
有24.4%的受訪者第二個(gè)預(yù)期體育消費(fèi)項(xiàng)目,是觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽。有22.1%的受訪者第三個(gè)儲(chǔ)蓄目的是購(gòu)買體育服裝、鞋、帽。
綜上所述,城鎮(zhèn)居民有較強(qiáng)參與體育消費(fèi)的預(yù)期,從預(yù)期體育消費(fèi)項(xiàng)目來看,以參與型體育消費(fèi)項(xiàng)目為主,實(shí)物型體育消費(fèi)項(xiàng)目在預(yù)期體育消費(fèi)項(xiàng)目中的比重下降,這可能與城鎮(zhèn)居民在體育消費(fèi)過程中,逐步重視體育的健身、文化等功能有關(guān)。
3.3.1 西安市城鎮(zhèn)居民體育消費(fèi)水平基本情況
城鎮(zhèn)居民體育消費(fèi)水平,是指一定時(shí)期內(nèi)城鎮(zhèn)居民在體育產(chǎn)品和服務(wù)的消費(fèi)過程中,對(duì)滿足城鎮(zhèn)居民體育需要方面所達(dá)到的程度,并通過消費(fèi)的體育產(chǎn)品和服務(wù)的數(shù)量和質(zhì)量反映出來,可用價(jià)值(貨幣)單位來表示。
調(diào)查結(jié)果(圖1)顯示,有42.7%的被調(diào)查者沒有參與體育活動(dòng)支出,參與型體育消費(fèi)支出在300元以下,300~700元,700~1500元,1500~2000元,2000元以上的,其比重分別為 26.6%,16.9%,7.7%,2.7%,3.5%。有35.10%的被調(diào)查者沒有體育服裝、鞋、帽支出,體育服裝、鞋、帽支出在300元以下,300~700元,700~1500元,1500~2000元,2000元以上的,其比重分別為15.58%,23.06%,15.98%,7.30%,2.98%。有76.26%的被調(diào)查者沒有大型體育器材支出,大型體育器材支出在300元以下,300~700元,700~1500元,1500~2000元,2000元 以 上 的,其 比 重 分 別 為 17.57%,3.08%,1.14%,1.02%,0.93% 。
圖1 本研究西安市城鎮(zhèn)居民體育服裝、鞋帽、大型體育器材和參與體育活動(dòng)消費(fèi)情況示意圖Figure 1.Xi’an City Urban Residents’Sports Clothing,Shoes and Hats,Large Sports Equipment and Participating in the Consumption of Sports
圖2顯示,有46.97%的被調(diào)查者沒有小型體育器材支出,小型體育器材支出在100元以下,101~200元,201~300元,301~500元,500元以上的,其比重分別為25.28%,13.26%,7.50%,4.32%,2.67%。有 38.34%的被調(diào)查者沒有體育圖書、報(bào)刊、音像制品支出,體育圖書、報(bào)刊、音像制品支出在100元以下,101~200元,201~300元,301~500元,500元以上的,其比重分別為43.68%,5.96%,6.47%,3.49%,2.06%。有49.56%的被調(diào)查者沒有觀看體育比賽支出,沒有觀看體育比賽支出在100元以下,101~200元,201~300元,301~500元,500元以上的,其比重分別為27.09%,12.78%,4.85%,3.74%,1.98%。
圖2 本研究西安市城鎮(zhèn)居民小型體育器材、觀看體育比賽和體育信息消費(fèi)情況示意圖Figure 2.Small Sports Equipment,Urban Residents in Xi’an City Watching Sports Competitions and Sports Information Consumption
3.3.2 西安市基于K-Means聚類的城鎮(zhèn)居民體育消費(fèi)水平階層劃分
本研究通過運(yùn)用SPSS-Clementine 12.0數(shù)據(jù)挖掘平臺(tái),建立K-Means聚類模型,對(duì)“西安市城鎮(zhèn)居民體育消費(fèi)調(diào)查”數(shù)據(jù)庫(kù)中西安市城鎮(zhèn)居民體育消費(fèi)水平調(diào)查數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘。
在采用K-Means聚類時(shí),聚為三類、四類和五類時(shí),聚為三類、四類組間差異較大,聚為五類時(shí)組間差異都不明顯。從方差分析上看,聚為四類的結(jié)果好于聚為三類、五類的。采用K-Means方法聚為四類時(shí),第一類有318個(gè)樣本,主要特征為沒有體育消費(fèi);第二類有287個(gè)樣本,主要特征為體育消費(fèi)支出處于較低水平;第三類為170個(gè)樣本,主要特征為體育消費(fèi)支出處于中等水平;第四類為139個(gè)樣本,主要特征為體育消費(fèi)支出處于較高水平,該分類對(duì)體育消費(fèi)者市場(chǎng)的區(qū)分度較為理想。綜上所述,本研究采用根據(jù)體育消費(fèi)內(nèi)容變量進(jìn)行K-Means聚類分析獲得的結(jié)果對(duì)數(shù)據(jù)的解釋性較好,最佳的類數(shù)是四類。根據(jù)聚類的結(jié)果,將西安市城鎮(zhèn)居民按照不同的體育消費(fèi)特征分為四類體育消費(fèi)人群(表5)。
3.3.3 西安市城鎮(zhèn)居民不同體育消費(fèi)水平的特征
為了進(jìn)一步了解不同類型的體育消費(fèi)者的人口特征、心理趨向性和體育生活方式,本研究在聚類結(jié)果的基礎(chǔ)上,采用建立CART決策樹、C5.0決策樹、CHAID決策樹、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)和貝葉斯網(wǎng)路模型(圖3)來探索西安市城鎮(zhèn)居民不同體育消費(fèi)水平的特征,得到分類矩陣(圖3)。
表5 本研究西安市城鎮(zhèn)居民體育消費(fèi)水平聚類結(jié)果一覽表Table 5 The Level of Sports Consumption of Urban Residents in the City of Xi’an Clustering Results
圖3 本研究西安市城鎮(zhèn)居民不同體育消費(fèi)水平特征數(shù)據(jù)挖掘模型指標(biāo)性能圖Figure 3.Model Performance Map Data of different Sports level of Consumption of Urban Residents in Xi’an City Mining
從圖3可知,C5.0決策樹模型、貝葉斯網(wǎng)絡(luò)模型、C&R決策樹模型、CHAD決策樹模型、SVM模型、神經(jīng)網(wǎng)絡(luò)模型、QUEST決策樹模型的總體精確性分別為84.9%、66.5%、72.2%、67.2%、60.4%、61.2%、60.6%。通 過幾個(gè)模型評(píng)估效果的比對(duì),發(fā)現(xiàn)C5.0在訓(xùn)練組、測(cè)試組以及驗(yàn)證組中的預(yù)測(cè)準(zhǔn)確率相對(duì)于其他數(shù)據(jù)挖掘方法都較高。因此,最終采用解釋性強(qiáng)、正確率較高的C5.0決策樹模型。
從C5.0決策樹模型的依賴關(guān)系網(wǎng)絡(luò)可以看出,對(duì)城鎮(zhèn)居民體育消費(fèi)水平影響從大到小的指標(biāo)依次為:文化程度>每天參加體育鍛煉的時(shí)間>是否喜歡體育鍛煉>月收入>每天自由支配的余暇時(shí)間>職業(yè)>年齡>身邊是否有免費(fèi)健身場(chǎng)所>性別。由此得出,城鎮(zhèn)居民體育消費(fèi)水平的高低與其文化程度特征有最強(qiáng)的關(guān)聯(lián)性。
此外,將C5.0決策樹模型中的決策規(guī)則進(jìn)行對(duì)比分析,得到不同體育消費(fèi)水平的西安市城鎮(zhèn)居民在人口特征、心理趨向性和體育生活方式等變量中呈現(xiàn)出來的典型特征,最終形成城鎮(zhèn)居民體育消費(fèi)特征模型(表6)。
1.在西安市城鎮(zhèn)居民的日常消費(fèi)支出中,衣、食、住、行等生存型消費(fèi)支出仍然是他們目前最主要的支出,作為發(fā)展與享受型的體育消費(fèi)支出,在西安市城鎮(zhèn)居民的日常消費(fèi)支出中所占比例仍然處于較低水平。在西安市城鎮(zhèn)居民日常消費(fèi)支出構(gòu)成數(shù)據(jù)的挖掘中發(fā)現(xiàn),衣食住行,教育,儲(chǔ)蓄等消費(fèi)支出與體育消費(fèi)支出之間存在關(guān)聯(lián)性特征。西安市城鎮(zhèn)居民在選擇儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于醫(yī)療保健支出的可能性;城鎮(zhèn)居民在選擇教育 > 儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于旅游支出的可能性;西安市城鎮(zhèn)居民在選擇衣食住行 > 教育 > 儲(chǔ)蓄支出以后,將選擇體育消費(fèi)支出的可能性大于用于文化娛樂支出的可能性。
表6 本研究西安市城鎮(zhèn)居民不同體育消費(fèi)水平的特征模型一覽表Table 6 Feature Model of Xi’an City Urban Residents’Sports Consumption Level
2.西安市城鎮(zhèn)居民的體育消費(fèi)項(xiàng)目呈現(xiàn)出多元化特征,但還處于由實(shí)物型體育消費(fèi)向參與型體育消費(fèi)和觀賞型體育消費(fèi)過渡的階段。在西安市城鎮(zhèn)居民體育消費(fèi)項(xiàng)目數(shù)據(jù)的挖掘中發(fā)現(xiàn),購(gòu)買體育服裝、鞋、帽,購(gòu)買體育健身器材和接受專業(yè)的健身指導(dǎo)之間存在關(guān)聯(lián)性特征。到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉、體育康復(fù)醫(yī)療和健身、健康咨詢之間存在關(guān)聯(lián)性特征。西安市城鎮(zhèn)居民在選擇購(gòu)買體育服裝、鞋、帽以后,將選擇接受專業(yè)的健身指導(dǎo)的可能性大于用于觀看電視、網(wǎng)絡(luò)、手機(jī)上的體育比賽的可能性;西安市城鎮(zhèn)居民在選擇到收費(fèi)的健身娛樂場(chǎng)所參加鍛煉以后,將選擇購(gòu)買體育服裝、鞋、帽的可能性大于用于訂閱體育書刊、體育雜志的可能性。
3.對(duì)西安市城鎮(zhèn)居民體育消費(fèi)水平影響從大到小的指標(biāo)依次為:文化程度>每天參加體育鍛煉的時(shí)間>是否喜歡體育鍛煉>月收入 >每天自由支配的余暇時(shí)間>職業(yè)>年齡>身邊是否有免費(fèi)健身場(chǎng)所>性別。高體育消費(fèi)水平型,中等體育消費(fèi)水平型,低體育消費(fèi)水平型和無體育消費(fèi)型的西安市城鎮(zhèn)居民在人口特征、體育心理趨向性和體育生活方式等變量中表現(xiàn)出不同典型特征。
此項(xiàng)研究成果的不足之處在于調(diào)查的范圍存在一定局限性,應(yīng)在全國(guó)范圍內(nèi)抽樣調(diào)查后進(jìn)一步進(jìn)行深入研究,特別是大數(shù)據(jù)集中數(shù)據(jù)挖掘算法的篩選和城鎮(zhèn)居民體育消費(fèi)水平綜合評(píng)價(jià)的后續(xù)研究。
[1]李菁菁,邵培基,黃亦瀟.數(shù)據(jù)挖掘在中國(guó)的現(xiàn)狀和發(fā)展研究[J].管理工程學(xué)報(bào),2004,(3):10-15.
[2]駱秉全,孫文.北京市不同家庭類型體育消費(fèi)特征研究[J].體育科學(xué),2008,28(11):22-29.
[3]錢曉東.數(shù)據(jù)挖掘中分類方法綜述[J].圖書情報(bào)工作,2007,(3):68-71.
[4]魏華,權(quán)德慶,雷福民,等.中國(guó)群眾體育場(chǎng)地發(fā)展變化及驅(qū)動(dòng)力研究[J].體育科學(xué),2012,32,(7):3-8.
[5]文靜.城市居民健身消費(fèi)力及其影響因素研究[D].福建師范大學(xué),2008.
[6]吳江萍.長(zhǎng)株潭三市居民休閑體育消費(fèi)研究[J].消費(fèi)經(jīng)濟(jì),2009,(2):63-66.
[7]體育事業(yè)“十二五”規(guī)劃[Z].北京:國(guó)家體育總局,2012.
[8]袁冰,朱東華,任智軍.基于數(shù)據(jù)挖掘技術(shù)的專利情報(bào)分析方法及實(shí)證研究[J].情報(bào)雜志,2006,(12):99-101.
[9]詹建國(guó),孫立平,黃俊亞.我國(guó)城市居民現(xiàn)階段體育用品消費(fèi)特征研究——以北京、西安、無錫3城市調(diào)研為例[J].體育科學(xué),2000,(4):6-9.
[10]趙丹群.數(shù)據(jù)挖掘:原理、方法及其應(yīng)用[J].現(xiàn)代圖書情報(bào)技術(shù),2000,(6):41-44.
[11]中共中央、國(guó)務(wù)院關(guān)于進(jìn)一步加強(qiáng)和改進(jìn)新時(shí)期體育工作的意見[Z].2002.
[12]朱建平.數(shù)據(jù)挖掘的統(tǒng)計(jì)方法及實(shí)踐[M].北京:中國(guó)統(tǒng)計(jì)出版社,2005.
[13]Computer control on multimeter measurement instrument based on RS232in LabVIEW[A].Proceed Second Int Symposium Test Automation Instrumentation[C].2008.
[14]MARAGATHAM G,LAKSHMI M.Study on classifiers using genetic algorithm and class based rules generation[A].Proceed 2012Int Conference Software Computer Appl(ICSCA 2012)[C].2012.
[15]The popularity of movies predict system based on data mining technology for CDN[A].Proceed 20103rd IEEE Int Conference Computer Science Inform Technol[C].2010.