□ 劉玥瑋(北京市海淀區(qū)育英學(xué)校高中二年級(jí)1班 北京 100039)
CBA正在如火如荼地進(jìn)行,各支球隊(duì)都努力爭(zhēng)取每一場(chǎng)比賽的勝利,尤其是今年這個(gè)賽季,季后賽的隊(duì)數(shù)增加到12支,以前排名處于中下游的球隊(duì)都看到了晉級(jí)季后賽的希望,所以比賽的觀賞性也提高不少。
隨著每輪比賽的進(jìn)行,每一場(chǎng)球都會(huì)產(chǎn)生大量的數(shù)據(jù),比如得分、籃板、助攻、上場(chǎng)時(shí)間等等。結(jié)合到多個(gè)場(chǎng)次,更是有不同的統(tǒng)計(jì)數(shù)據(jù)產(chǎn)生:場(chǎng)均得分、場(chǎng)均上場(chǎng)時(shí)間、場(chǎng)均籃板等等。如果是整個(gè)賽季,則有賽季出場(chǎng)次數(shù)、首發(fā)次數(shù)、賽季平均上場(chǎng)時(shí)間、賽季平均得分、賽季平均助攻數(shù)等等。這些數(shù)據(jù)都可以從不同角度體現(xiàn)出球員的不同特點(diǎn),例如從上場(chǎng)時(shí)間上可以看出該球員是核心球員還是角色球員,從場(chǎng)均得分、場(chǎng)均籃板、場(chǎng)均助攻、場(chǎng)均蓋帽以及場(chǎng)均犯規(guī)等數(shù)據(jù)上可以看出是主要得分球員還是藍(lán)領(lǐng)球員。
但這些數(shù)據(jù)都只是從一個(gè)或者多個(gè)方面反映了一位球員的能力、對(duì)球隊(duì)總的貢獻(xiàn),并沒(méi)有體現(xiàn)出對(duì)球隊(duì)輸贏的影響,比如某一球員在一場(chǎng)球中爆發(fā),得分很高,達(dá)到50多分甚至60多分,這只能說(shuō)明該球員在這場(chǎng)球中對(duì)球隊(duì)總得分的貢獻(xiàn)很大,但不能說(shuō)明球隊(duì)肯定能夠贏球。比如這個(gè)賽季11月11日北控主場(chǎng)對(duì)上海那一場(chǎng)比賽,上海球員弗雷戴特發(fā)揮大爆發(fā)得到75分,達(dá)到全隊(duì)總得分136的55%,但球隊(duì)卻輸了。
對(duì)于觀眾來(lái)講,大家更關(guān)注自己喜歡球隊(duì)的輸贏,這一點(diǎn)對(duì)于球隊(duì)的球員、教練和領(lǐng)導(dǎo)也更關(guān)心。如何將球員的各項(xiàng)指標(biāo)數(shù)據(jù)和球隊(duì)的輸贏結(jié)合起來(lái),讓我們?cè)诳礋狒[的同時(shí),能夠看出一些門道,便成為一個(gè)關(guān)心的領(lǐng)域,作者正是在這樣的領(lǐng)域做了一個(gè)嘗試。
作者先是對(duì)2017-2018賽季北京首鋼男子籃球俱樂(lè)部 (以下簡(jiǎn)稱北京首鋼)每場(chǎng)籃球數(shù)據(jù)進(jìn)行采集,并對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換整理,然后結(jié)合球隊(duì)的輸贏進(jìn)行數(shù)據(jù)相關(guān)分析,最后給出了北京首鋼隊(duì)主要球員的特點(diǎn)及建議。
當(dāng)前CAB共有20支球隊(duì),每支球隊(duì)都有幾年的數(shù)據(jù),鑒于時(shí)間上的限制,作者沒(méi)有對(duì)各個(gè)球隊(duì)都進(jìn)行分析,這里只收集了北京首鋼在2017-18賽季的數(shù)據(jù)作為例子。
本文所有數(shù)據(jù)均來(lái)自于新浪網(wǎng)CBA頻道,詳細(xì)情況參見(jiàn)ht tp∶//spor ts.sina.com.cn/cba/。
采集的數(shù)據(jù)共有兩類。第一類是北京首鋼在2017-2018賽季各輪次比賽日期、對(duì)手、主客場(chǎng)和比分,這類數(shù)據(jù)總共一張表格。第二類是每一輪次北京首鋼球員上場(chǎng)情況、比賽中的各種數(shù)據(jù),這類數(shù)據(jù)共38張表格。
數(shù)據(jù)采集共分兩步完成。
第一步:將新浪網(wǎng)頁(yè)上的數(shù)據(jù)手工拷貝到一個(gè)Excel文件中。這樣共有兩類數(shù)據(jù)共39個(gè)表格。
第二步:通過(guò)一段程序,將39個(gè)表格數(shù)據(jù)轉(zhuǎn)換成可供分析的數(shù)據(jù),具體數(shù)據(jù)模型見(jiàn)下面的數(shù)據(jù)整理。
為了分析球員的各項(xiàng)指標(biāo)數(shù)據(jù)對(duì)球隊(duì)輸贏的影響,結(jié)合實(shí)際數(shù)據(jù)情況,設(shè)計(jì)了這樣的數(shù)據(jù)模型:
(1)每一輪次的數(shù)據(jù)作為一個(gè)觀測(cè)值;
(2)輸贏作為目標(biāo)變量;
(3)每一位球員在每一輪次中的各項(xiàng)數(shù)據(jù)都作為一個(gè)變量。
這樣得到一個(gè)38個(gè)觀測(cè),366個(gè)變量的數(shù)據(jù)。下表列出了主要的變量列表:
表1
數(shù)據(jù)相關(guān)分析(Analysis of Cor relation)是對(duì)兩個(gè)或者多個(gè)變量之間的關(guān)系進(jìn)行分析,發(fā)現(xiàn)其內(nèi)在因素。在開始介紹相關(guān)分析之前,需要特別說(shuō)明的是相關(guān)關(guān)系不等于因果關(guān)系。
相關(guān)分析的方法很多,初級(jí)的方法可以快速發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,如正相關(guān),負(fù)相關(guān)或不相關(guān)。中級(jí)的方法可以對(duì)數(shù)據(jù)間關(guān)系的強(qiáng)弱進(jìn)行度量,如完全相關(guān),不完全相關(guān)等。高級(jí)的方法可以將數(shù)據(jù)間的關(guān)系轉(zhuǎn)化為模型,并通過(guò)模型對(duì)未來(lái)的業(yè)務(wù)發(fā)展進(jìn)行預(yù)測(cè)。
按照變量之間的類型不同,數(shù)據(jù)相關(guān)分析分為以下四種:
(1)自變量為數(shù)值型變量,因變量為數(shù)值型變量;
(2)自變量為數(shù)值型變量,因變量為分類變量;
(3)自變量為分類變量,因變量為數(shù)值型變量;
(4)自變量為分類變量,因變量為分類變量。
由于我們需要分析數(shù)據(jù)的自變量為數(shù)值型,而因變量只考慮輸贏,所以我們的分析屬于自變量為數(shù)值型變量,因變量為二元的分類變量。
分析過(guò)程比較簡(jiǎn)單,就是將各個(gè)關(guān)心的球員指標(biāo)數(shù)據(jù)分別與因變量進(jìn)行比對(duì),查看二者之間的關(guān)聯(lián)性。對(duì)于關(guān)聯(lián)性不強(qiáng)的,這里就不再贅述。另外我們只是分析了北京首鋼幾位重要球員的指標(biāo)數(shù)據(jù),其他球員要么出場(chǎng)次數(shù)太少,數(shù)據(jù)缺失嚴(yán)重,要么上場(chǎng)時(shí)間太短,多數(shù)指標(biāo)數(shù)據(jù)為零,因此這里給出的是球隊(duì)的幾位重要球員分析的結(jié)果。
(1)7 號(hào)(杰克遜)分析。
①失誤次數(shù)多于3個(gè)(含3個(gè))時(shí),11場(chǎng)球贏了10場(chǎng),相反,當(dāng)少于3個(gè)時(shí),20場(chǎng)球輸了9場(chǎng);
②罰球出手次數(shù)5個(gè)(含5個(gè))以上時(shí),16場(chǎng)球贏了14場(chǎng),相反,當(dāng)少于5個(gè)時(shí),15場(chǎng)球輸了8場(chǎng);
③前場(chǎng)籃板個(gè)數(shù)在2個(gè)(含2個(gè))以上時(shí),7場(chǎng)球贏了6場(chǎng);
④當(dāng)搶斷個(gè)數(shù)3個(gè)(含3個(gè))以上時(shí),8場(chǎng)球贏了7場(chǎng);
⑤當(dāng)?shù)梅衷?8分(含18分)以上時(shí),16場(chǎng)球贏了14場(chǎng),相反,但得分在18分以下時(shí),則是15場(chǎng)輸了8場(chǎng)。
注:“.”表示該球員未參加比賽,下同。
球員分析:失誤次數(shù)多反而贏球多,失誤次數(shù)少反而贏球少。失誤次數(shù)多說(shuō)明杰克遜傳球多,失誤次數(shù)少一方面說(shuō)明傳球好,更多的是說(shuō)明傳球少。而當(dāng)傳球多時(shí),無(wú)論是否是失誤或者傳球成功,目的都達(dá)到了,那就是起到串聯(lián)的作用,通過(guò)傳球帶領(lǐng)全隊(duì),而不是自己?jiǎn)未颡?dú)斗。至于罰球次數(shù)、搶斷和進(jìn)攻籃板,則說(shuō)明當(dāng)杰克遜打的比較硬氣時(shí),球隊(duì)往往贏多輸少。
(2)8 號(hào)(方碩)分析。
①三分球出手次數(shù)9個(gè)(含9個(gè))以上,共有8場(chǎng)球,球隊(duì)全部贏了;
②兩分球出手次數(shù)小于4個(gè)(含4個(gè)),共有4場(chǎng)球,球隊(duì)全部贏了。
球員分析:典型的外線球員,多投三分,少投兩分。
(3)20 號(hào)(翟曉川)分析。
①蓋帽2次(含2次)以上就能夠贏球,共有5場(chǎng)球?qū)儆谶@種情況,5場(chǎng)全贏;
②犯規(guī)5次(含5次)以上就能夠贏球,共有5場(chǎng)球?qū)儆谶@種情況,5場(chǎng)全贏。
球員分析:拼命三郎,打球積極,球隊(duì)便能贏球。
(4)23 號(hào)(常林)分析。
只要有蓋帽就能夠贏球,共有5場(chǎng)球?qū)儆谶@種情況,5場(chǎng)全贏。
球員分析:內(nèi)線球員,以后就坐鎮(zhèn)內(nèi)線,等著蓋別人的帽。
以上只是作者對(duì)于北京首鋼一支球隊(duì)、一個(gè)賽季的數(shù)據(jù)進(jìn)行的分析,鑒于作者目前的水平,僅考慮了最簡(jiǎn)單的一類相關(guān)分析。除此之外作者考慮了還可以進(jìn)行以下幾種類型的分析:
(1)分析其他球隊(duì)的情況;
(2)分析多個(gè)賽季的情況;
(3)多個(gè)變量相互作用對(duì)球隊(duì)輸贏的分析,比如將主客場(chǎng)因素考慮到分析中去;
(4)其它類型的相關(guān)分析。