張武生
(咸陽師范學(xué)院體育系,陜西咸陽,712000)
計算機數(shù)據(jù)挖掘技術(shù)在CBA聯(lián)賽中的應(yīng)用
張武生
(咸陽師范學(xué)院體育系,陜西咸陽,712000)
隨著計算機應(yīng)用大幅度的增加,現(xiàn)代社會逐漸發(fā)展成一個規(guī)模大、分享廣、數(shù)據(jù)應(yīng)用力度強的時代——“大數(shù)據(jù)時代”。同時以CBA為代表的籃球運動逐步成為人們收看的熱點,但是CBA聯(lián)賽與計算機數(shù)據(jù)挖掘結(jié)合開發(fā)還比較少,而掌握數(shù)據(jù)挖掘技術(shù)將對我國籃球事業(yè)發(fā)展起著重大的意義。本文針對數(shù)據(jù)挖掘技術(shù)在CBA聯(lián)賽中應(yīng)用的可行性及具體的改良初步探討。關(guān)鍵詞:計算機;數(shù)據(jù)挖掘;CBA
數(shù)據(jù)挖掘在現(xiàn)代社會的20世紀(jì)80年代就已經(jīng)出現(xiàn),這項技術(shù)能從數(shù)據(jù)倉庫中提取人們所感知、未知、隱藏在數(shù)據(jù)中的一些有效信息與知識把這些概念規(guī)則、規(guī)律的方式呈現(xiàn)給客戶,這樣使得現(xiàn)時代對信息量不足,信息復(fù)雜的問題得以解決,也讓大時代的信息化技術(shù)得以提升。
數(shù)據(jù)挖掘技術(shù)的誕生是數(shù)據(jù)庫的影響,是人們對數(shù)據(jù)庫的探索、勘察,數(shù)據(jù)挖掘慢慢的被世界所認(rèn)同。出現(xiàn)的原因歸屬于需求點。最近幾年,數(shù)據(jù)挖掘技術(shù)成為了各個行業(yè)的重點關(guān)注,因為計算機技術(shù)的大幅度發(fā)展,數(shù)據(jù)的存儲量越來越大,并存放在各種數(shù)據(jù)庫中,能夠被廣泛應(yīng)用。如此廣泛的數(shù)據(jù)量,如若像從前一樣拿出來參考肯定不能發(fā)覺這些數(shù)據(jù)的真正價值,如此數(shù)據(jù)量中也一定有著不一般的價值,在此,有人提出了數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是把沒有發(fā)現(xiàn)的重要信息從大量的數(shù)據(jù)庫中提取出來,是從數(shù)據(jù)庫內(nèi)部捕獲知識的過程,是綜合數(shù)據(jù)備用、數(shù)據(jù)探索、數(shù)據(jù)結(jié)果發(fā)表以及數(shù)據(jù)信息解釋的系統(tǒng)工程。烏薩瑪菲亞德博士1996年提出了一個數(shù)據(jù)挖掘定義:“數(shù)據(jù)挖掘”是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)庫中,獲得隱藏在之中的、人們不以為知的,但又是具有利用價值的信息”。這個定義被學(xué)術(shù)界廣泛認(rèn)可。隨后十多年中,在數(shù)據(jù)庫系統(tǒng)和機器學(xué)習(xí)方面,數(shù)據(jù)挖掘被大多數(shù)研究人員定義為了主要核心課題。許多業(yè)界的人士意圖在響應(yīng)查詢、信息管理、決策支持、過程控制等許多方面利用從數(shù)據(jù)庫或數(shù)據(jù)倉庫中發(fā)現(xiàn)出來的規(guī)則和知識,這在他們看來是一個能帶來足夠大回報的重要領(lǐng)域。
圖1數(shù)據(jù)挖掘分析
數(shù)據(jù)挖掘技術(shù)想要進(jìn)入CBA聯(lián)賽中就必須要對當(dāng)前我國CBA聯(lián)賽的形式進(jìn)行可行性分析。雖然數(shù)據(jù)挖掘技術(shù)是依靠計算機的分析和運算來完成的,但沒有專業(yè)的人員的也不能完成這項操作。數(shù)據(jù)挖掘技術(shù)在我國的起步要慢于其它國家,但是這方面的專業(yè)技術(shù)人員已經(jīng)開始從事對這項技術(shù)的專項研究,而且在高等院校中也開加可技術(shù)數(shù)據(jù)挖掘?qū)I(yè),比如北京大學(xué)、上海交大、清華大學(xué)、電子科技大學(xué)、武漢大學(xué)等都開始招收計算機科學(xué)技術(shù)與數(shù)據(jù)挖掘方向的研究生,并切成為了現(xiàn)有的熱門專業(yè)。視屏分析是數(shù)據(jù)挖掘中的一個要點,視頻分析工作之所以能夠順利的進(jìn)行,必須要有數(shù)量充足的視頻分析人員。在CBA聯(lián)賽的各支隊伍中有的已經(jīng)聘請了專業(yè)的視頻分析人員。
3.1 據(jù)收集方法的改良研究
筆者探討的數(shù)據(jù)收集方法可以定義為數(shù)據(jù)準(zhǔn)備,其中包括了數(shù)據(jù)的收集與數(shù)據(jù)的未知處理,這一環(huán)節(jié)是數(shù)據(jù)挖掘中最為重要的一個環(huán)節(jié)。當(dāng)前,CBA聯(lián)賽的數(shù)據(jù)收集方式可謂是品種繁多,但總的概括只有兩種:官方數(shù)據(jù)統(tǒng)計和隊伍數(shù)據(jù)統(tǒng)計。官方的數(shù)據(jù)統(tǒng)計較為簡單,就是得分與籃板的基本數(shù)據(jù)統(tǒng)計,優(yōu)點是將數(shù)據(jù)公開化,收集方便,有參考價值,缺點就是內(nèi)容不夠充裕,不全面,不精確,分析下來實用性不是很高,意義不大。球隊數(shù)據(jù)統(tǒng)計就是利用影像設(shè)備記錄下比賽錄像,對視屏內(nèi)容進(jìn)行反觀處理,然后做出統(tǒng)計,常規(guī)來說會采納國外視屏軟件,并由專業(yè)人員進(jìn)行數(shù)據(jù)記錄評定。視頻錄像可以定義為原始數(shù)據(jù)收集,分析視屏就是對原始數(shù)據(jù)的預(yù)先處理,經(jīng)歷了這兩個階段,所產(chǎn)生的數(shù)據(jù)比官方統(tǒng)計的數(shù)據(jù)要更為詳細(xì)更加有利用價值。所以球隊的數(shù)據(jù)參考價值遠(yuǎn)遠(yuǎn)高于官方統(tǒng)計的數(shù)據(jù),數(shù)據(jù)更為詳細(xì)。但是球隊的統(tǒng)計也有很明顯的缺點,其一,數(shù)據(jù)不公開沒有開明性,這些數(shù)據(jù)被球隊嚴(yán)格的管理保密,無法對外透露,也就是說這些數(shù)據(jù)沒有良好的交融性,得不到共享,這也直接的損失了數(shù)據(jù)量,每只球隊最多也就一名錄像分析師,大部分都是由教練與翻譯操作,分析師的主要職責(zé)是統(tǒng)計教練需要的數(shù)據(jù)內(nèi)容,由于賽程緊張,匯總數(shù)據(jù)量龐大,能夠搜集的數(shù)據(jù)量匱乏也是必然結(jié)果。顯然當(dāng)前CBA聯(lián)賽中的兩種收集方法都不足以滿足數(shù)據(jù)挖掘的成功實施。如果可以將兩者結(jié)合起來,集合目前兩種收集方法的優(yōu)點,那么自然就解決了數(shù)據(jù)收集問題。
3.2 技術(shù)人員需求與分配的改良研究
當(dāng)前的CBA聯(lián)賽技術(shù)人員缺乏,能力不夠全面,分工系統(tǒng)出現(xiàn)問題。若想對CBA聯(lián)賽進(jìn)行數(shù)據(jù)挖掘,這一方面的技術(shù)人員配置就應(yīng)該有:專業(yè)錄像人員,錄像分析人員,數(shù)據(jù)庫構(gòu)建與管理人員,官方數(shù)據(jù)分析師與球隊數(shù)據(jù)分析師等。筆者參考幾個技術(shù)人員方面做出分析并提出改善措施。
(1)專業(yè)錄像人員
專業(yè)錄像人員將CBA賽況全程記錄下來,要求精細(xì),全方位的記錄好賽事情況?;谀壳暗墓俜郊夹g(shù)配置完全可以得到滿足,而當(dāng)前的每只球隊都有自己的專業(yè)攝像技術(shù)人員,筆者覺得這項工作實際上太過于重復(fù),只要官方組建一個可以使得所有球隊都能看到錄像的公共平臺,使得所有球隊都能夠輕松找到賽事錄像,那么每只球隊在賽事錄像技術(shù)人員上的配置就大大減少了,大大降低投入成本。
(2)錄像分析人員
錄像分析人員就是借助相關(guān)設(shè)備對錄像內(nèi)容進(jìn)行分析,從中提取大量數(shù)據(jù)的專業(yè)相關(guān)人員。當(dāng)前中國籃協(xié)并沒有相關(guān)的錄像分析員來對錄像進(jìn)行分析與解析,反倒是每只隊伍高額聘請專業(yè)的人員來對錄像進(jìn)行解析,筆者看來,籃協(xié)其實可以將此工作統(tǒng)一進(jìn)行,成立專業(yè)的錄像解析團(tuán)隊,對賽況進(jìn)行全面的分析,把有價值的信息數(shù)據(jù)上傳至數(shù)據(jù)庫中,給每個球隊與愛好者們共享資源,這樣既省下了球隊時間、人力及財力,還能更強力的推動數(shù)據(jù)挖掘的進(jìn)一步開展,增加了研究資源,吸取了觀眾的眼球。
(3)數(shù)據(jù)庫構(gòu)建與管理人員
數(shù)據(jù)庫構(gòu)建與管理人員利用數(shù)據(jù)庫相關(guān)專業(yè)知識,建立存放所有CBA聯(lián)賽數(shù)據(jù)的數(shù)據(jù)庫專業(yè)團(tuán)隊。但目前只有CBA官方建立了數(shù)據(jù)庫,由錄像解析人員分析更為珍貴的資料,并沒有被數(shù)據(jù)庫收納,各球隊也只是簡單的收納數(shù)據(jù)獲得數(shù)據(jù),如Excel表格及office自帶的access數(shù)據(jù)庫,查詢、比較及共享功能都較為落后。所以將來官方人員無需太大變動,為了接收錄像分析人員所分析的數(shù)據(jù),專業(yè)人員必須增加,從而滿足數(shù)據(jù)庫的管理優(yōu)勢,還要把數(shù)據(jù)庫更為深化與長遠(yuǎn)的方式進(jìn)行拓展,添加數(shù)據(jù)收集類型與數(shù)據(jù)之間的關(guān)聯(lián),為大數(shù)據(jù)分析做好強有力的準(zhǔn)備工作。如表1所搜集的運動員比賽數(shù)據(jù)。
表1 CBA賽況數(shù)據(jù)統(tǒng)計表
科學(xué)技術(shù)的進(jìn)步,引領(lǐng)著時代的潮流,各項資源技術(shù)的應(yīng)用在大數(shù)據(jù)的時代得到完美的體現(xiàn)。在現(xiàn)代化的科學(xué)進(jìn)程中,CBA聯(lián)賽必須結(jié)合發(fā)達(dá)的計算機技術(shù),才能更好的為體育訓(xùn)練、營銷等服務(wù)。
[1]歐陽為民.數(shù)據(jù)庫加權(quán)關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)[J].軟件學(xué)報,2010,12
[2]單曙光.對籃球比賽技術(shù)統(tǒng)計規(guī)范和分析評價的研究[D].北京:北京體育大學(xué),2012.
[3]黃欣榮.大數(shù)據(jù)對科學(xué)認(rèn)識論的發(fā)展[J].自然辯證法研究,2014
Computer Data Mining in CBA league
Zhang Wusheng
(Xianyang Normal University Department of Physical Education,Shanxi Xianyang,712000)
With the substantial increase in computer applications, and gradually developed into a modern society, large-scale, shared widely, strong efforts era data applications ----- "big data era." At the same time as the representative to the CBA basketball gradually become the hot spot to watch, but the CBA league development combined with computer data mining is still relatively small, and master data mining technology development in China will play a basketball significance. In this paper, the feasibility of data mining techniques and the specific improvements in the CBA league applications discussed.
Computer; data mining; CBA
TP393
A