梁夢(mèng)玉,肖 漢,高建義
(深圳瑞捷工程咨詢股份有限公司,廣東 深圳 518129)
近年來,由于城市化進(jìn)程放緩,房屋住宅由增量向存量轉(zhuǎn)變,住宅市場(chǎng)對(duì)品質(zhì)的要求愈加嚴(yán)格。與此同時(shí),工程質(zhì)量問題頻發(fā),導(dǎo)致小業(yè)主對(duì)于戶內(nèi)觀感質(zhì)量缺陷投訴頻繁。第三方評(píng)估作為甲方采取的監(jiān)管手段之一,通過定期或者不定期檢查,對(duì)施工過程中的質(zhì)量問題進(jìn)行監(jiān)督和改進(jìn),為工程質(zhì)量的提升起到了積極作用。但部分工程質(zhì)量問題發(fā)生后的整改工作直接影響到工程進(jìn)度,造成經(jīng)濟(jì)損失,而目前的評(píng)估模式仍局限于“發(fā)現(xiàn)問題,解決問題”的“診斷”作用,缺乏預(yù)警功能。因此,以提高評(píng)估工作的預(yù)見性為目的的大數(shù)據(jù)質(zhì)量風(fēng)險(xiǎn)動(dòng)態(tài)預(yù)警模型具有極高的商業(yè)價(jià)值。
工程質(zhì)量的管控是一個(gè)由多方協(xié)作的復(fù)雜過程,對(duì)于房屋滲漏、開裂、空鼓等倍受消費(fèi)者關(guān)注的質(zhì)量通病,涉及到人、機(jī)械、材料和環(huán)境等多方因素的影響。不可否認(rèn),工程施工工藝環(huán)環(huán)相扣,質(zhì)量通病問題的發(fā)生與前序施工管理過程有密不可分的關(guān)系。若能通過對(duì)評(píng)估大數(shù)據(jù)質(zhì)量通病背后的影響因素進(jìn)行挖掘,研究前序施工工藝與質(zhì)量通病的密切程度,將起到對(duì)質(zhì)量通病問題進(jìn)行洞察和預(yù)警的作用。
基于大數(shù)據(jù)挖掘技術(shù)的風(fēng)險(xiǎn)預(yù)警已經(jīng)在電子商務(wù)、金融、天氣預(yù)報(bào)等信息化程度很高的領(lǐng)域得到了廣泛的應(yīng)用。在其他信息化相對(duì)不高的農(nóng)林,工程等領(lǐng)域,也有一定的應(yīng)用價(jià)值。如邱明月利用 Apriori 算法分析草原火災(zāi)案件的具體特征與影響因素之間的關(guān)聯(lián)特征,對(duì)案件的相關(guān)因素與犯罪行為進(jìn)行關(guān)聯(lián)規(guī)則挖掘,為公安機(jī)關(guān)提供可參考的辦案思路與建議[1]。許未等基于 Apriori 的關(guān)聯(lián)規(guī)則算法構(gòu)建出鐵路事故致因網(wǎng)絡(luò),從而探尋各因素之間的復(fù)雜關(guān)聯(lián)關(guān)系[2]。
本文利用關(guān)聯(lián)規(guī)則研究和挖掘過程評(píng)估中的檢查項(xiàng)分別與揭示開裂、空鼓、滲漏問題的檢查項(xiàng)之間的關(guān)聯(lián)。針對(duì)揭示開裂、空鼓、滲漏問題的檢查項(xiàng),篩選與其有較強(qiáng)關(guān)系的前序施工工藝類型,并將該關(guān)系量化。
數(shù)據(jù)挖掘(data mining)是一個(gè)跨學(xué)科的計(jì)算機(jī)科學(xué)分支。它是用人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)庫(kù)的交叉方法在相對(duì)較大型的數(shù)據(jù)集中發(fā)現(xiàn)模式的計(jì)算過程。數(shù)據(jù)挖掘過程的總體目標(biāo)是從一個(gè)數(shù)據(jù)集中提取信息,并將其轉(zhuǎn)換成可理解的結(jié)構(gòu),以進(jìn)一步使用。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的研究方法之一,是一種在大型數(shù)據(jù)庫(kù)中發(fā)現(xiàn)變量之間的有趣性關(guān)系的方法。它的目的是利用一些有趣性的量度來識(shí)別數(shù)據(jù)庫(kù)中發(fā)現(xiàn)的強(qiáng)規(guī)則。最早是由 Agrawal 等人針對(duì)購(gòu)物籃分析問題提出的,其目的是為了發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系規(guī)則。購(gòu)物籃子里記錄的是一次交易中商品的類別,通過分析大量的交易數(shù)據(jù)得出這些商品在每次購(gòu)買行為中出現(xiàn)的規(guī)律。
關(guān)聯(lián)規(guī)則屬于描述性數(shù)據(jù)挖掘算法,是一種基于無監(jiān)督學(xué)習(xí)的算法。與序列挖掘相比,關(guān)聯(lián)規(guī)則學(xué)習(xí)通常不考慮在事務(wù)中、或事務(wù)間項(xiàng)目的順序。關(guān)聯(lián)規(guī)則有效性的度量主要有兩個(gè)指標(biāo),支持度和置信度。支持度是規(guī)則能涵蓋的交易次數(shù)的百分比,置信度是指基于前項(xiàng)的條件概率的估計(jì)。由于算法會(huì)產(chǎn)生大量的可能規(guī)則,因此通常采用最小支持度和置信度的閾值來篩選有效規(guī)則,縮小可選規(guī)則的范圍。
關(guān)聯(lián)規(guī)則在交易數(shù)據(jù)庫(kù)中的應(yīng)用場(chǎng)景與評(píng)估得分?jǐn)?shù)據(jù)庫(kù)很相似。購(gòu)物籃分析的是每一次交易中的商品數(shù)據(jù),而檢查項(xiàng)關(guān)聯(lián)度分析的是每一個(gè)項(xiàng)目中檢查項(xiàng)之間的關(guān)系。評(píng)估體系中的最細(xì)顆粒度-檢查項(xiàng)的評(píng)分從各維度、各階段詳細(xì)地反應(yīng)了項(xiàng)目的工程質(zhì)量水平。因此,分析檢查項(xiàng)之間的關(guān)聯(lián)關(guān)系可以深入洞察工程質(zhì)量缺陷的內(nèi)在規(guī)律。
Apriori 算法的優(yōu)點(diǎn)在于基于先驗(yàn)性質(zhì)來減少頻繁項(xiàng)集產(chǎn)生時(shí)需要探查的候選集的個(gè)數(shù)。先驗(yàn)性質(zhì)主要分為:①若X為頻繁項(xiàng)集,則X的所有子集都是頻繁項(xiàng)集;②若X為非頻繁項(xiàng)集,則X的所有超集均為非頻繁項(xiàng)集。
數(shù)據(jù)集來源為深圳瑞捷工程咨詢股份有限公司數(shù)據(jù)倉(cāng)庫(kù)中 2018-2019 年過程評(píng)估原始評(píng)分?jǐn)?shù)據(jù),包括實(shí)測(cè)實(shí)量和質(zhì)量風(fēng)險(xiǎn)兩部分。該數(shù)據(jù)集為將各房企體系的原始評(píng)分根據(jù)同一標(biāo)準(zhǔn)對(duì)照后的數(shù)據(jù)。從原始數(shù)據(jù)集里僅選取包括項(xiàng)目 ID,行業(yè)指標(biāo)名稱和指標(biāo)得分特征這 3 組變量。根據(jù)選擇的算法和項(xiàng)目的目標(biāo),將指標(biāo)得分特征下的檢查項(xiàng)類別設(shè)置為新的變量特征,得到結(jié)構(gòu)為[項(xiàng)目 ID,檢查項(xiàng)類別 1 得分,檢查項(xiàng)類別 2 得分,…]的數(shù)據(jù)寬表。每個(gè)檢查項(xiàng)類別的得分為質(zhì)量風(fēng)險(xiǎn)和實(shí)測(cè)實(shí)量根據(jù)國(guó)標(biāo)計(jì)算后的加權(quán)平均分。
結(jié)合算法的要求和項(xiàng)目的目的,需要首先對(duì)數(shù)據(jù)進(jìn)行離散化處理。即,將檢查項(xiàng)的評(píng)分值按照臨界值 0.9 處理為兩種類別:“做得好”和“做得差”。由于工程施工的規(guī)律和評(píng)估業(yè)務(wù)的特性,此寬表存在大量缺失數(shù)據(jù)。為避免數(shù)據(jù)處理給分析過程帶來噪聲,結(jié)合業(yè)務(wù)邏輯,將所有缺失值處理為 0 值。
將“滲漏”“空鼓”和“開裂”相關(guān)的檢查項(xiàng)分別挑選出來進(jìn)行算法實(shí)施,并根據(jù)設(shè)定的支持度和置信度閾值對(duì) Apriori 的算法結(jié)果進(jìn)行篩選。為了盡可能使得結(jié)果涵蓋三個(gè)方面的質(zhì)量通病,算法采用了不同的閾值。同時(shí),為了起到預(yù)警的作用,要求所篩選的前項(xiàng)檢查項(xiàng)必須不發(fā)生在目標(biāo)檢查項(xiàng)的施工階段之后。揭示“滲漏”問題的檢查項(xiàng)有 3 項(xiàng),揭示“空鼓”問題的檢查項(xiàng)有 6 項(xiàng),揭示“開裂”問題的有 3 項(xiàng)。設(shè)定的支持度(計(jì)數(shù))和置信度列表如表 1 所示。
表1 算法參數(shù)設(shè)置
運(yùn)行算法后得到 241 符合參數(shù)要求的規(guī)則,并經(jīng)工程邏輯判定后得到共 47 條有效的強(qiáng)規(guī)則。分別挑選部分最強(qiáng)有效規(guī)則列表(見表 2)。其中,支持度(support)代表前項(xiàng)檢查項(xiàng)和后項(xiàng)檢查項(xiàng)在數(shù)據(jù)集所有項(xiàng)目中同時(shí)發(fā)生問題的概率;置信度(confidence)表示后項(xiàng)基于前項(xiàng)發(fā)生問題的條件概率,表示該規(guī)則相信程度;提升度(lift)表明前項(xiàng)和后項(xiàng)之間的相關(guān)性。若提升度>1,則表明該規(guī)則有效,前項(xiàng)和后項(xiàng)具有正相關(guān)性。
由表 2 的關(guān)聯(lián)規(guī)則列表可知,若主體結(jié)構(gòu)施工階段外觀有脹模錯(cuò)臺(tái)現(xiàn)象,且裝修階段的分層抹灰工藝較差,會(huì)極大概率導(dǎo)致裝修階段出現(xiàn)抹灰外墻滲漏問題,置信度表明這個(gè)條件概率值為 0.48。而提升度等于 3.36 表明,這兩個(gè)前項(xiàng)檢查項(xiàng)的發(fā)生會(huì)正向促進(jìn)外墻滲漏的發(fā)生;若在主體結(jié)構(gòu)的模板搭建階段發(fā)現(xiàn)止水螺桿以及排水孔的預(yù)留孔洞有問題,那么也會(huì)加劇(lift=3.32)裝修階段外墻滲漏的問題發(fā)生,此條規(guī)則的置信度為 0.48;此外,在砌筑階段若外墻門垛出現(xiàn)裂縫,則也會(huì)大概率導(dǎo)致外墻滲漏問題的發(fā)生。
表2 部分強(qiáng)關(guān)聯(lián)規(guī)則
與空鼓問題相關(guān)的關(guān)聯(lián)規(guī)則同理解析。由所列規(guī)則可知,若內(nèi)墻且地面飾面磚的接縫高低差做的不好,都會(huì)有 0.96(置信度=0.958 3)的概率引起內(nèi)墻飾面磚的空鼓問題。此外,若墻面抹灰有裂縫和飾面磚有接縫高低差同時(shí)在一個(gè)項(xiàng)目中出現(xiàn),則這個(gè)項(xiàng)目的內(nèi)墻飾面磚也會(huì)有 0.94 的概率(置信度=0.938 1)出現(xiàn)空鼓問題。
青海湖流域位于青藏高原東北部,地處青海省西部柴達(dá)木盆地、東部湟水谷地、南部江河源頭與北部祁連山地的樞紐地帶,總面積2.96×104km2。區(qū)域海拔3000~5000m ,多年平均氣溫-1.14~1.17℃,降水量253~515mm,水面蒸發(fā)量800~1000mm,屬于典型的高寒干旱大陸性氣候[11]。受東南季風(fēng)、西南季風(fēng)和西風(fēng)環(huán)流影響,全年降雨集中在夏季,占年降水量的70%~80%。
導(dǎo)致墻面的抹灰裂縫的因素之一——抹灰的砂漿配合比若不合格,則表明墻面易出現(xiàn)抹灰裂縫的概率為 0.75 (置信度=0.75);若裝修階段抹灰的養(yǎng)護(hù)不到位,且灰縫不夠飽滿,則同樣有 0.75 的概率(置信度=0.75)會(huì)出現(xiàn)墻面抹灰開裂的問題;此外,同樣是抹灰的養(yǎng)護(hù)不到位且基層處理沒做好,也有 0.76 的概率(置信度=0.76)出現(xiàn)墻面抹灰開裂問題。由于提升度均>1,所以認(rèn)為這幾項(xiàng)前項(xiàng)因素均對(duì)墻面抹灰開裂的問題出現(xiàn)有正向提升作用。
對(duì)于外墻抹灰滲漏問題,綜合分析以上數(shù)據(jù)挖掘成果,從施工工序來看,主體結(jié)構(gòu)施工階段、砌筑階段、裝修階段的質(zhì)量缺陷均可影響滲漏問題的發(fā)生,影響因素主要可以分為以下幾類。
1)主體結(jié)構(gòu)施工質(zhì)量的影響。①外墻止水螺桿滲漏;②外墻預(yù)留排水孔設(shè)置不合理或孔洞造成滲漏;③后澆帶施工縫處理不好導(dǎo)致滲漏;④脹模錯(cuò)臺(tái)應(yīng)鑿平再抹灰,處理不好造成裂縫從而引起滲漏;⑤砌筑階段砌體豎向勾縫不合格導(dǎo)致外墻滲漏。
2)外門窗施工質(zhì)量的影響。①門窗塞縫發(fā)泡膠的施工質(zhì)量問題;②外門的門垛裂縫;③門窗的安全玻璃質(zhì)量問題;④門窗洞口的尺寸誤差;⑤由于門窗外排水坡道設(shè)置不合理引起窗臺(tái)積水等。
3)墻面抹灰施工質(zhì)量的影響。①抹灰效果不好造成裂縫;②抹灰起砂等抹灰未達(dá)要求的情況;③砂漿配合比不合理引起砂漿開裂等。
根據(jù)上文針對(duì)挖掘結(jié)果的因素分析,滲漏現(xiàn)象被發(fā)現(xiàn)往往是在裝修甚至交付階段,事后進(jìn)行補(bǔ)救往往事倍功半。但根據(jù)關(guān)聯(lián)規(guī)則建立的數(shù)學(xué)模型,最早可在主體結(jié)構(gòu)施工階段就對(duì)滲漏問題進(jìn)行預(yù)警。從主體結(jié)構(gòu)施工階段,到砌筑階段再到裝修階段,每一階段都有若干項(xiàng)關(guān)鍵指標(biāo)。當(dāng)發(fā)現(xiàn)項(xiàng)目這幾項(xiàng)關(guān)鍵指標(biāo)出現(xiàn)問題后,再根據(jù)關(guān)聯(lián)規(guī)則的評(píng)價(jià)參數(shù)對(duì)項(xiàng)目滲漏問題發(fā)生的風(fēng)險(xiǎn)概率進(jìn)行預(yù)警,對(duì)滲漏事件發(fā)生的可能性以及類型進(jìn)行預(yù)警。
本文分析的空鼓開裂主要包括的內(nèi)容為飾面磚的空鼓,以及墻面抹灰的空鼓開裂。飾面磚的空鼓主要和接縫高低差有強(qiáng)關(guān)聯(lián)。地面飾面磚的空鼓也會(huì)預(yù)示墻面飾面磚空鼓的發(fā)生,反之亦然。從施工管理的角度解釋,在同一項(xiàng)目中,墻面和地面飾面磚多由同一施工隊(duì)伍承包,地磚和墻磚鋪設(shè)質(zhì)量基本一致。
1)砌體的質(zhì)量問題和抹灰的質(zhì)量問題引起的墻面抹灰的空鼓開裂。墻面抹灰的空鼓開裂問題主要?dú)w因于砌體的質(zhì)量問題和抹灰的質(zhì)量問題。在砌筑階段,若構(gòu)造柱的混凝土振搗不密實(shí),或者模板安裝不牢固,引起漲模問題,都會(huì)導(dǎo)致空鼓開裂。另外,砌體出現(xiàn)透縫,也會(huì)引起相應(yīng)部位的抹灰出現(xiàn)空鼓開裂問題。抹灰的質(zhì)量缺陷也是墻面空鼓開裂的重要成因。數(shù)據(jù)指出,抹灰的養(yǎng)護(hù)做得不到位,造成起砂或者基層處理不干凈或不平整都會(huì)導(dǎo)致墻面空鼓開裂問題。
2)抹灰的質(zhì)量缺陷引起的墻面抹灰開裂。墻面抹灰開裂問題同理也與抹灰的施工工藝息息相關(guān):抹灰的砂漿配合比不合理可能導(dǎo)致砂漿產(chǎn)生收縮性裂縫;抹灰保溫保濕養(yǎng)護(hù)不到位或方法不對(duì)導(dǎo)致產(chǎn)生收縮裂縫;基層處理不干凈、不平整可能導(dǎo)致抹灰產(chǎn)生裂縫;孔洞封堵質(zhì)量差,不同材料伸縮系數(shù)不同,導(dǎo)致不同材料結(jié)合處容易產(chǎn)生裂縫;一般在不同結(jié)構(gòu)交接處掛網(wǎng),不同結(jié)構(gòu)伸縮性不同,不掛網(wǎng)可能引起裂縫。
3)砌體的質(zhì)量缺陷引起的墻面抹灰開裂。砌體的質(zhì)量缺陷同樣會(huì)引起墻面抹灰開裂問題:墻頂補(bǔ)砌補(bǔ)塞不飽滿可能導(dǎo)致抹灰裂縫;過梁的固定長(zhǎng)度不夠,導(dǎo)致過梁沉降過大從而使得拉裂抹灰面;灰縫不飽滿會(huì)引起抹灰厚度不一樣,可能產(chǎn)生裂縫;豎向通縫導(dǎo)致砌體整體性差,容易導(dǎo)致通縫處抹灰面被拉裂。
根據(jù)以上分析,數(shù)據(jù)挖掘的結(jié)果所展示的墻面空鼓開裂和飾面磚空鼓問題,大概率是由于抹灰和砌體自身的問題導(dǎo)致的,這也與工程邏輯相符。因此在砌筑階段應(yīng)該格外關(guān)注與空鼓開裂相關(guān)的關(guān)鍵指標(biāo),在裝修階段確保抹灰施工工藝達(dá)到質(zhì)量標(biāo)準(zhǔn),對(duì)防范空鼓開裂具有重要作用。
本文利用了數(shù)據(jù)挖掘算法 Apriori 分析出評(píng)估數(shù)據(jù)庫(kù)中與消費(fèi)者關(guān)注度高的滲漏、空鼓和開裂問題有強(qiáng)關(guān)聯(lián)的施工工藝,并將該關(guān)系量化,基于項(xiàng)目的現(xiàn)狀形成多條規(guī)則,得以動(dòng)態(tài)地,準(zhǔn)確地預(yù)測(cè)質(zhì)量缺陷問題的發(fā)生概率。由于所有的變量均來自于評(píng)估數(shù)據(jù)庫(kù),因此該結(jié)果具有隨著數(shù)據(jù)庫(kù)的不斷更新的特性,但是符合工程邏輯的因果關(guān)系基本不會(huì)改變。本次挖掘得出的關(guān)鍵因素可以作為統(tǒng)計(jì)學(xué)模型的自變量,為下一步建立預(yù)測(cè)消費(fèi)者關(guān)注項(xiàng)的質(zhì)量好壞程度的機(jī)器學(xué)習(xí)模型打下基礎(chǔ)。
由于評(píng)估業(yè)務(wù)的不連續(xù)性導(dǎo)致數(shù)據(jù)集存在大量的缺失值是本次工作不完善的地方。此外,評(píng)價(jià)施工工藝的好壞的標(biāo)準(zhǔn)可以根據(jù)實(shí)際需求進(jìn)行調(diào)整,如本文采用評(píng)分 0.9 作為閾值,若降低閾值,挖掘出的有效規(guī)則或會(huì)更少,提高閾值,產(chǎn)生的強(qiáng)關(guān)聯(lián)規(guī)則覆蓋的檢查項(xiàng)或會(huì)更多。
綜上,雖然本文結(jié)果由于數(shù)據(jù)質(zhì)量問題存在不完善的地方,但是依然具有較高的工程應(yīng)用價(jià)值。如可結(jié)合目前智慧工地系統(tǒng),利用信息化工具對(duì)項(xiàng)目的工程質(zhì)量進(jìn)行動(dòng)態(tài)預(yù)警,這項(xiàng)工作對(duì)于推動(dòng)工程質(zhì)量管理的信息化、數(shù)據(jù)化轉(zhuǎn)型有重要意義。Q