周忠超,劉曦元
(國家無線電監(jiān)測中心云南監(jiān)測站,昆明 650031)
在大數(shù)據(jù)時代背景下,我們對于信息的獲取,已不僅僅滿足于數(shù)據(jù)表面,而是需要對這些數(shù)據(jù)進行加工、深度挖掘才能使數(shù)據(jù)體現(xiàn)出價值,從而為未來工作決策做出正確的判斷和提出預(yù)見性的建議。目前,隨著無線電監(jiān)測基礎(chǔ)數(shù)據(jù)的大量積累,數(shù)據(jù)挖掘在無線電監(jiān)測管理工作中顯得尤為重要,應(yīng)用愈加廣泛。對短波監(jiān)測而言,除了掌握和獲取短波信號動態(tài),如何對這些監(jiān)測數(shù)據(jù)進行深度挖掘,從而優(yōu)化常規(guī)監(jiān)測方法,更為科學(xué)高效地實現(xiàn)短波頻段資源監(jiān)管,為頻譜管理提供決策支撐,是未來短波監(jiān)測工作的又一個重要內(nèi)容。
短波通信是指利用波長為100-10m(頻率為3-30MHz)的電磁波進行的無線電通信。短波通信主要是利用不易被“摧毀”的“中繼系統(tǒng)”電離層的反射來進行,具有傳輸距離遠、機動重建性好、成本低廉、容易實現(xiàn)等優(yōu)點,廣泛應(yīng)用于政府、軍事、外交、氣象等領(lǐng)域。為了更好地掌握短波頻段電臺設(shè)置情況、頻率使用情況,合理進行頻譜資源配置,為短波頻譜管理工作提供數(shù)據(jù)支撐,開展短波監(jiān)測意義重大。日常短波監(jiān)測工作所關(guān)注的主要參數(shù)有:電臺呼號、發(fā)射地點、時間、發(fā)射頻率、所屬業(yè)務(wù)類型等。短波監(jiān)測數(shù)據(jù)分析挖掘,主要分為兩部分:研究監(jiān)測周期內(nèi)各參數(shù)自身的變化趨勢;與其他外部因素之間的關(guān)聯(lián)性等。
在進行短波監(jiān)測數(shù)據(jù)分析與挖掘時,假設(shè)研究的參數(shù)為n個,其具體分析步驟如下:(注:以下對研究參數(shù)本身周期內(nèi)變化規(guī)律分析稱為:內(nèi)部分析;對研究參數(shù)與其他參數(shù)之間的關(guān)系分析稱為:外部分析。)首先,進行內(nèi)部分析。對所研究的n個參數(shù),在一定周期內(nèi)單獨對每個參數(shù)進行統(tǒng)計與分析,以便觀察其自身變化情況;其次,進行單因素外部分析。先選擇其中一個參數(shù)(有Cn1種選擇)作為研究對象,與另外n-1個參數(shù)之間進行探究分析,共有(n-1)*Cn1種選擇,如:選擇電臺呼號為研究對象,對于同一個電臺呼號,對其出現(xiàn)的時段、發(fā)射頻率、位置、業(yè)務(wù)類型的分布分別進行統(tǒng)計,以便掌握某電臺的發(fā)射特征及規(guī)律;然后,進行雙因素外部分析。在第二步的基礎(chǔ)上繼續(xù)推進,再次選擇一個參數(shù)(有Cn-11種選擇)與另外n-2個參數(shù)之間的聯(lián)系探究,共有(n-2)*Cn-11種選擇,如:選擇發(fā)射頻率為第二個研究參數(shù),對使用某一發(fā)射頻率的某一電臺,對其出現(xiàn)的時段、位置、業(yè)務(wù)類型,進行統(tǒng)計分析;最后,逐步縮小范圍,進行n-1因素外部分析。對n-1個參數(shù)與另外一個參數(shù)之間的聯(lián)系探究,共有1種選擇,由此可以找到精確地規(guī)律,最終挖掘出具有足夠信息量、清晰具體的信息條目,找到一條完整的涉及所有參數(shù)項目的信息。具體流程如圖1所示:
圖1 短波數(shù)據(jù)挖掘基本流程
下面以電臺呼號、發(fā)射地點、時間、發(fā)射頻率、所屬業(yè)務(wù)類型這5個基本參數(shù)為例,運用以上數(shù)據(jù)挖掘方法進行統(tǒng)計分析。(注:由于監(jiān)測數(shù)據(jù)為敏感信息,以下示例中,涉及到的具體名稱、數(shù)據(jù)均以字母表示。)
選擇電臺呼號為研究對象,分析統(tǒng)計周期內(nèi)電臺呼號的個數(shù)以及每個出現(xiàn)的次數(shù),假設(shè)電臺呼號情況如表1所示:(現(xiàn)設(shè)電臺名稱為:XX、YY、ZZ,出現(xiàn)次數(shù)為:a、b、c,下同)
表1 電臺呼號
內(nèi)部分析,對于監(jiān)測周期內(nèi)電臺呼號分布情況進行了統(tǒng)計分析,可以得出統(tǒng)計周期內(nèi),存在3個電臺,分別為:XX,YY,ZZ。以下外部分析,繼續(xù)以電臺呼號為研究對象,以XX電臺為例,現(xiàn)選擇發(fā)射頻率作為一個外部因素,來分析電臺呼號與發(fā)射頻率之間的關(guān)系。XX電臺,對其發(fā)射頻率分布進行統(tǒng)計,可以按特定頻率間隔分段統(tǒng)計,假設(shè)XX電臺的頻率分布情況如表2所示:
表2 發(fā)射頻率
基于單因素外部分析的結(jié)果,得到以下組合:對3-10MHz頻段的XX電臺,進行分析;對10-20MHz頻段的XX電臺,進行分析;對20-30MHz頻段的XX電臺,進行分析。選擇另一個外部因素:發(fā)射時間,進行雙因素外部分析,以3-10MHz為例,對3-10MHz頻段的XX電臺,對其發(fā)射時間進行統(tǒng)計,假設(shè)其發(fā)射時間分布情況如表3所示。
表3 發(fā)射時間
基于雙因素外部分析結(jié)果,得到以下組合:
對3-10MHz頻段、0-8h的XX電臺,進行分析;對3-10MHz頻段、8-16 h的XX電臺,進行分析;對3-10MHz頻段、16-24h的XX電臺,進行分析。對10-20MHz、20-30MHz頻段的分析跟0-10MHz類似。選擇另一個外部因素為:發(fā)射位置,進行三因素外部分析。例如:對3-10MHz頻段、0-8h的XX電臺,對其發(fā)射位置進行分析。假設(shè)其發(fā)射位置分布情況如表4所示(發(fā)射位置分別記為:M、N,次數(shù)為:a,b)。
表4 發(fā)射位置
基于三因素外部分析結(jié)果,得到以下組合:對3-10MHz頻段、0-8h、M地區(qū)的XX電臺,進行分析;對3-10MHz頻段、0-8h、N地區(qū)的XX電臺,進行分析。對10-20MHz、20-30MHz頻段、8-16h、16-24h的分析跟以上類似。
選擇最后一個外部因素為:業(yè)務(wù)類型,進行四因素外部分析。無線電業(yè)務(wù)類型,是根據(jù)各頻段信號的用途、場景來進行的劃分。主要有:廣播業(yè)務(wù)、固定業(yè)務(wù)、航空移動業(yè)務(wù)等,對業(yè)務(wù)類型進行分類統(tǒng)計能夠掌握其業(yè)務(wù)分布規(guī)律,更高效地進行無線電監(jiān)管。
例如:對0-10MHz頻段、0-8h、M地區(qū)的XX電臺,對其業(yè)務(wù)類型進行分析:假設(shè)其分布情況如表5所示(業(yè)務(wù)類型以廣播和固定業(yè)務(wù)為例,次數(shù)設(shè)為:a,b)。
以上完成了5個研究參數(shù)的數(shù)據(jù)挖掘,可以得出如下所示的信息:如:對0-10MHz頻段、0-8h、M地區(qū)的XX電臺,其業(yè)務(wù)類型分布情況如表5所示。
表5 業(yè)務(wù)類型
該條信息完整包含了5個研究參數(shù)的具體內(nèi)容,實現(xiàn)了從監(jiān)測數(shù)據(jù)表中,提取具體、有價值信息的目的,將零散的信息匯總成一條條完整的信息條目,有利于進行頻譜數(shù)據(jù)分析。
本文介紹了一種基于短波監(jiān)測數(shù)據(jù)表進行的數(shù)據(jù)分析挖掘的方法,通過分析各個參數(shù)內(nèi)部關(guān)系、與其他參數(shù)之間的聯(lián)系來進行多維的數(shù)據(jù)分析,有利于從繁雜的數(shù)據(jù)表中提取信息,最終形成大量有效的信息流,便于進行監(jiān)測數(shù)據(jù)分析,為頻譜管理提供依據(jù)。