譚保華,任志鵬,趙建平,王鵬
(1.長(zhǎng)春理工大學(xué) 校友(基金會(huì))工作辦公室,長(zhǎng)春 130022;2.長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)
校友資源是學(xué)校最寶貴的人才資源,近年來,各高校不斷加強(qiáng)和重視校友工作,智能信息系統(tǒng)、微信公眾平臺(tái)、APP等現(xiàn)代化的系統(tǒng)相繼應(yīng)用到校友的管理工作中,有效地提高了校友工作的管理層次,高校對(duì)校友資源的管理更加科學(xué)化、智能化[1]。
隨著校友信息數(shù)據(jù)進(jìn)入大數(shù)據(jù)時(shí)代,如何將大數(shù)據(jù)分析技術(shù)更好地應(yīng)用到校友信息的管理和維護(hù)中,實(shí)現(xiàn)智能化、科學(xué)化管理,使校友工作更具創(chuàng)新思路和工作方法,將給高校校友工作者一個(gè)機(jī)遇和挑戰(zhàn),也將為今后的高校校友工作提供一個(gè)有用的參考。
大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)詞匯,隨之而來的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。
大數(shù)據(jù)分析在體育、經(jīng)濟(jì)、教育、文化等多方面領(lǐng)域進(jìn)行應(yīng)用,促進(jìn)了人類社會(huì)科技、文明的飛速發(fā)展?;诖髷?shù)據(jù)分析技術(shù)的高校校友工作同樣具有非常重要的意義。
通過對(duì)校友信息的分析,智能提取校友企業(yè)產(chǎn)品與重點(diǎn)研究方向,結(jié)合學(xué)校具體專業(yè),給出科學(xué)的合作方案和重點(diǎn)合作研究方向,助推高校與校友企業(yè)開展產(chǎn)學(xué)研深度合作。從而建立與校友企業(yè)的產(chǎn)學(xué)研合作長(zhǎng)效機(jī)制,不斷增強(qiáng)學(xué)校培養(yǎng)人才能力,科研能力,為祖國(guó)建設(shè)可持續(xù)性輸送人才。
系統(tǒng)將校友按從事行業(yè)、工作地域、興趣愛好等數(shù)據(jù)信息智能的分析和提取出來,使學(xué)校有針對(duì)性地與校友進(jìn)行雙向的溝通交流,使各地校友隨時(shí)掌握了解母校發(fā)展動(dòng)態(tài),為母校建設(shè)提供各種幫助。使學(xué)校能夠及時(shí)聯(lián)絡(luò)并成立相應(yīng)的地區(qū)校友組織,為校友搭建資源共享,合作共贏的平臺(tái)。實(shí)時(shí)動(dòng)態(tài)信息交互聯(lián)絡(luò)圖如圖1所示。
圖1 實(shí)時(shí)動(dòng)態(tài)信息交互聯(lián)絡(luò)圖
根據(jù)信息智能提取出相同行業(yè)、相同興趣愛好的校友,使同行業(yè)及共同興趣愛好的校友們能夠快速有效地實(shí)現(xiàn)跨區(qū)域精準(zhǔn)互聯(lián),從而能夠經(jīng)常組織起形式多樣的利國(guó)益校活動(dòng)。
根據(jù)學(xué)校每年的就業(yè)數(shù)據(jù),將畢業(yè)生分地區(qū)推薦給當(dāng)?shù)氐男S呀M織,地區(qū)校友組織聯(lián)絡(luò)人可以準(zhǔn)確獲取信息內(nèi)容,及時(shí)與新校友取得聯(lián)絡(luò),安排接送站以及迎新服務(wù),不斷充實(shí)壯大校友組織。使年輕校友能夠盡早的得到校友組織的關(guān)懷和幫助,有利于他們的快速成長(zhǎng)。
通過對(duì)捐贈(zèng)校友的信息分析,充分挖掘校友對(duì)母校的情感聯(lián)系,能夠最大限度地發(fā)揮校友對(duì)母校的捐款及奉獻(xiàn),以及帶動(dòng)校友邀請(qǐng)同學(xué)以班級(jí)為單位捐款捐物,形成校友與學(xué)校可持續(xù)共同發(fā)展。按組團(tuán)捐贈(zèng)統(tǒng)計(jì)分析數(shù)據(jù)圖如圖2和圖3所示。
圖2 按組團(tuán)捐贈(zèng)統(tǒng)計(jì)分析數(shù)據(jù)圖
圖3 按捐贈(zèng)次數(shù)分類統(tǒng)計(jì)數(shù)據(jù)圖
設(shè)計(jì)思想旨在為校友建立一個(gè)在大數(shù)據(jù)技術(shù)基礎(chǔ)上的信息整合分析平臺(tái),為校友信息收集、信息管理、信息交流等提供一體化服務(wù)[2]。
平臺(tái)主要包括校友基本信息、校友行為需求預(yù)測(cè)、校友行為大數(shù)據(jù)關(guān)聯(lián)、校友行為大數(shù)據(jù)交互等模塊?;緮?shù)據(jù)模塊示意圖如圖4所示。
圖4 基本數(shù)據(jù)模塊示意圖
校友的信息從入學(xué)時(shí)即建立起來,包括招生、學(xué)籍、培養(yǎng)、畢業(yè)論文及就業(yè)等信息智能動(dòng)態(tài)的搜集整理好,最后與就業(yè)當(dāng)?shù)匦S褧?huì)數(shù)據(jù)進(jìn)行整合匹配,形成完整的校友信息數(shù)據(jù)庫(kù)。校友在校期間與工作期間的重要活動(dòng)、經(jīng)典瞬間及各種獲獎(jiǎng)證書等均可分類存儲(chǔ)到校友信息庫(kù)中,隨時(shí)進(jìn)行智能的檢索及分析。
通過大數(shù)據(jù)分析技術(shù),分析校友的專業(yè)、從事行業(yè)及興趣愛好等,構(gòu)建出符合校友需求的行為模式方法,預(yù)測(cè)校友需要從事的工作及活動(dòng),將校友企業(yè)的人事信息、產(chǎn)品信息及校友活動(dòng)信息及時(shí)推送,為校友開展事業(yè)助力[3]。
將各地具有相關(guān)行業(yè)及興趣愛好的校友信息關(guān)聯(lián)提取,研究校友行為模式與業(yè)績(jī)的關(guān)聯(lián)性,智能提醒和指導(dǎo)校友加入同行業(yè)校友商業(yè)圈,形成資源共享,合作共贏的良好行為模式。
利用大數(shù)據(jù)技術(shù)融合校友數(shù)據(jù),實(shí)現(xiàn)校友跨地區(qū)跨行業(yè)數(shù)據(jù)互聯(lián),對(duì)校友信息共享平臺(tái)的數(shù)據(jù)檢索、更新和數(shù)據(jù)庫(kù)智能分類存儲(chǔ)進(jìn)行科學(xué)管理,完善校友檔案信息嵌入式交互。
智能信息搜索以對(duì)象為中心,通過用戶循環(huán)搜索完善對(duì)象描述模型,從而獲取到關(guān)聯(lián)對(duì)象信息來提高校友信息獲取的全面性與準(zhǔn)確性。根據(jù)校友登錄系統(tǒng)后產(chǎn)生的數(shù)據(jù)信息,利用知識(shí)圖譜與邏輯推導(dǎo)技術(shù),對(duì)已有的校友信息進(jìn)行相似度匹配,并通過機(jī)器學(xué)習(xí)、容錯(cuò)檢測(cè)及分析量化,將數(shù)據(jù)庫(kù)中的校友信息不斷完善,對(duì)重復(fù)的校友信息給出合并提示并刪除冗余信息[5]。
圖5 智能搜集結(jié)構(gòu)圖
校友信息智能挖掘技術(shù)以基于Web挖掘技術(shù)為平臺(tái),為了應(yīng)對(duì)校友數(shù)據(jù)海量與動(dòng)態(tài)的特點(diǎn),采用動(dòng)態(tài)數(shù)據(jù)挖掘技術(shù),將來自動(dòng)態(tài)數(shù)據(jù)庫(kù)與實(shí)時(shí)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行采集、預(yù)處理、挖掘、結(jié)果評(píng)估與應(yīng)用解釋,構(gòu)建出一個(gè)科學(xué)完善且長(zhǎng)期的數(shù)據(jù)采集模式[4]?;趙eb挖掘技術(shù)的校友信息資源智能分析模型如圖6所示。
圖6 基于Web挖掘技術(shù)的校友信息資源智能分析模型
在數(shù)據(jù)層中,從動(dòng)態(tài)數(shù)據(jù)庫(kù)與實(shí)時(shí)數(shù)據(jù)庫(kù)中獲取校友信息的初始化信息;在挖掘?qū)又校瑢?duì)初始化校友信息資源庫(kù)中的素材進(jìn)行Web的內(nèi)容、結(jié)構(gòu)、應(yīng)用挖掘;在分析層中,將挖掘的校友信息處理后進(jìn)行知識(shí)化信息描述,以此來識(shí)別與聚類;在應(yīng)用層中,用戶通過軟件平臺(tái)來查看校友信息挖掘分析結(jié)果。
通過對(duì)校友相關(guān)信息行為的挖掘與需求分析,將校友的各個(gè)特征屬性信息進(jìn)行聚合,同時(shí)進(jìn)行相關(guān)信息的精準(zhǔn)推薦。首先利用聚合方法對(duì)校友多源信息特征進(jìn)行主要特征提取,對(duì)其主要特征進(jìn)行深層次、多屬性的挖掘與聚合,將校友信息構(gòu)建成校友關(guān)系網(wǎng),對(duì)特征關(guān)聯(lián)進(jìn)行挖掘是聚合的優(yōu)勢(shì)體現(xiàn),這為校友關(guān)系網(wǎng)的構(gòu)建創(chuàng)造既可橫向拓展又可進(jìn)行縱向深入分析的有利條件,從而實(shí)現(xiàn)校友特征多角度的個(gè)性化推薦,完成特定主題的相關(guān)信息推送。精準(zhǔn)信息推送服務(wù)如圖7所示。
圖7 精準(zhǔn)信息推送服務(wù)
融合多種校友信息數(shù)據(jù),建設(shè)統(tǒng)一的數(shù)據(jù)模型,其復(fù)雜數(shù)據(jù)涉及一些數(shù)據(jù)的清洗與建模,其中對(duì)數(shù)據(jù)進(jìn)行清洗,能夠保證數(shù)據(jù)質(zhì)量,同時(shí)根據(jù)時(shí)間的推移不斷的進(jìn)行數(shù)據(jù)更新,以完善其數(shù)據(jù)實(shí)體間的關(guān)聯(lián)。在信息積累的基礎(chǔ)上利用數(shù)據(jù)分析技術(shù),建立預(yù)測(cè)與決策支持平臺(tái),該平臺(tái)依據(jù)積累的大量校友數(shù)據(jù),對(duì)校友特征進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)關(guān)聯(lián)信息,從而構(gòu)建校友關(guān)系網(wǎng),挖掘潛在的價(jià)值信息,為校友關(guān)系網(wǎng)建設(shè)與學(xué)校的可持續(xù)建設(shè)挖掘更富有價(jià)值的決策信息。多數(shù)據(jù)分析技術(shù)模型如圖8所示。
圖8 多數(shù)據(jù)分析模型
隨著數(shù)據(jù)獲取方式的不斷發(fā)展,所能獲得的校友數(shù)據(jù)信息量也越來越大,所涉及數(shù)據(jù)的整合、調(diào)度也有了更高的要求。通過一種并行化正向最大匹配去冗余過濾處理方法,利用Map對(duì)多數(shù)據(jù)進(jìn)行掃描將屬性特征暫存,根據(jù)數(shù)據(jù)特征的相似度進(jìn)行數(shù)據(jù)關(guān)系判斷,將提取的特征進(jìn)行向量化表示,利用Reduce實(shí)現(xiàn)冗余去除操作,從而進(jìn)行數(shù)據(jù)處理、整合以及修復(fù),并且使用多連接查詢優(yōu)化算法,解決多數(shù)據(jù)的查詢優(yōu)化問題,進(jìn)而完善多數(shù)據(jù)調(diào)度問題。數(shù)據(jù)整合與調(diào)度流程圖如圖9所示。
圖9 數(shù)據(jù)整合與調(diào)度流程圖
高校校友資源是學(xué)校的寶貴資產(chǎn),大數(shù)據(jù)分析技術(shù)為校友工作創(chuàng)新提供了科學(xué)的支撐,從關(guān)聯(lián)數(shù)據(jù)中獲取校友的重要信息,充分挖掘校友的潛在信息,制定科學(xué)合理的方案,不斷創(chuàng)新校友工作思路和方法,對(duì)促進(jìn)校友與學(xué)校共同可持續(xù)發(fā)展具有非常重要的意義。