方芳
摘 ?要:概念格被認為是數(shù)據(jù)分析的有力工具,在諸多領域得到了研究和應用。隨著大數(shù)據(jù)時代的發(fā)展需要,要求概念格的完整性,概念格的節(jié)點大小隨著形式背景大小的增加呈指數(shù)增長。鑒于大數(shù)據(jù)時代構思概念格所面臨的挑戰(zhàn),該文將粒計算融于概念格的研究中,在概念格的多粒度計算模型的基礎上,通過概念格多粒度構造的漸進式算法,對概念格的概念進行分層次構造。同時,分析概念格多粒度構造與存儲模型的驗證及應用,來分析概念格構造的問題。
關鍵詞:概念格 ?粒計算 ??;拍罡?/p>
中圖分類號:O153.1 ? 文獻標識碼:A 文章編號:1672-3791(2019)10(c)-0013-02
概念格是基于對象和數(shù)據(jù)集中的屬性之間的二元關系的概念層次結構。它是形式概念分析理論的核心數(shù)據(jù)結構,最初由德國的Wille R教授在1982年提出。概念格被認為是數(shù)據(jù)分析的有力工具,在諸多領域得到了研究和應用。目前概念格的構造研究主要有三大類: 批處理構造、漸進式構造和分布式構造。粒計算是指通過系統(tǒng)訪問粒結構來解決問題,包括同一粒層中的粒子之間和不同粒層中的粒子之間的變換和推理。粒計算與概念格的融合研究,主要基于聯(lián)合概念格的概念層次結構與粒計算的粒度結構之間的天然關系來建立數(shù)學模型,形式概念對應于粒子,概念層對應為粒層,整個概念格的Hasse圖結構反映了其粒結構。
1 ?概念格的多粒度計算模型
在概念格的理論中,形式背景表示的數(shù)據(jù)就是不同概念及概念之間的關系。
2 ?概念格多粒度構造的漸進式算法
(1)概念格的多粒度構造有3種情況:①形式背景的變化帶來的概念格的變化,需要對每個粒層的粒子重新計算;②概念格的粒結構自身的調整,需要在粒層間進行轉換;③對完整概念格結構的展現(xiàn),需要將若干個粒子概念格展現(xiàn)為一個完整概念格。對應的,此部分內容包含粒子構造算法、粒層轉換算法和粒子合并算法3個部分內容。
(2)粒子構造算法是對包含形式背景變化的相應對象和屬性的粒子格的計算。構造算法根據(jù)對象與屬性的增加或刪除,對每個粒層的粒子重新計算。可以證明,此種情況下不影響同粒層中粒子之間的偏序關系,也不影響不同粒層間粒子的映射關系。因此可以采用經典概念格漸進式構造算法來完成。
(3)粒層轉換算法的實質是Zoom-in算子與Zoom-out 算子的算法實現(xiàn),是該部分內容的核心工作。其中,Zoom-in算子用于產生新的粒層、Zoom-out算子用于由下層粒層重構上層粒層。需要通過轉換算法進行粒層的構造發(fā)生在兩種情形:產生新粒層、由下層粒層重構上層粒層,分別對應于Zoom-in算子和Zoom-out算子。
(4)粒子合并算法是將同粒度層的若干個粒子概念格合并為一個概念格,實質是對不同子格上概念間被割裂的前驅后繼關系的重新增補。需要指出的是同粒度的粒子格之間的偏序關系在構造粒層時已經被計算和存儲算法可以借助這些偏序關系來漸進式地實現(xiàn)粒子合并。粒子合并算法中,粒的合并與相交:設(X1,Y1)和(X2,Y2)是任意兩個粒子,規(guī)定:
負載均衡算法的核心工作是根據(jù)粒子的節(jié)點規(guī)模來建立運算時間的概率分布函數(shù),再結合運籌學中的規(guī)劃問題進行求解,找出沖突概率最小的一個任務規(guī)劃。
3 ?概念格多粒度構造與存儲模型的驗證及應用
(1)概念格對10年以上的民航氣象數(shù)據(jù)進行分析。將民航氣象數(shù)據(jù)庫的數(shù)據(jù)清洗格式化后形成形式背景,然后對接到原型系統(tǒng)進行概念格的構造。從粗粒度開始,將發(fā)現(xiàn)的有意義的規(guī)則交給氣象工作人員研究分析,逐步深化構造粒度,直到找到氣象工作人員認可的精度為止。驗證和探索系統(tǒng)的時間性能、粒度、知識發(fā)現(xiàn)之間的關系,如圖1所示。
圖1是由形式背景、概念格、本體知識庫、知識庫應用組成的形式概念分析模型。該模型從縱向看是形式背景、概念格、本體知識庫、知識庫應用,也就是概念格多粒度構造方面的研究;從橫向看是形式概念分析、氣象數(shù)據(jù)、服務應用,也就是根據(jù)氣象數(shù)據(jù)來進行概念格粒計算出氣象知識,并且應用到實踐氣象數(shù)據(jù)分析中。
(2)其中,形式背景是將多值概念圖像背景轉化為單值概念圖像背景,以表達氣象服務領域的內涵和外延的過程。內涵是氣象數(shù)據(jù)中影響氣象變化的因素,外延是氣象數(shù)據(jù)在概念上的集合,這是概念格分析的基礎,構成了概念結構主體;概念格是氣象服務領域的概念進行整體集合,構成氣象服務概念的核心數(shù)據(jù)結構,并通過根系氣象服務中的層次關系、分級關系,為氣象服務形式概念模型提供知識庫映射,為概念格的邏輯關系提供描述方法;本體知識庫就是在概念格里得到的對象或者關系運用開源軟件將其工程化;知識庫應用是開展形式概念分析和本體知識庫設計的最終落腳點,將氣象數(shù)據(jù)實時轉化為氣象知識,并根據(jù)民航氣象要求提供服務。
4 ?結語
該文介紹了大數(shù)據(jù)集支撐下概念格的多粒度構造研究,包括概念格的多粒度計算模型、概念格多粒度構造的漸進式算法、概念格多粒度構造與存儲模型的驗證以及應用這3個方面的研究。通過該研究實現(xiàn)了構造和數(shù)據(jù)分析的同步,形成概念分析與粒計算的新融合。將以概念為基本粒子單元、整個概念格為粒架構的概念格粒計算的理論和模型,拓展到了以子概念格為基本粒子單元、整個概念格為復雜系統(tǒng)結構的概念格粒計算的理論和模型。這個拓展和深化符合人類從元知識系統(tǒng)到復雜知識系統(tǒng)的認識過程和一般規(guī)律,對認知科學和人工智能結合的研究有一定的參考作用。
參考文獻
[1] 李粉寧,范敏,李金海.形式概念分析中面向對象粒概念的動態(tài)更新[J].山東大學學報:理學版,2019,54(4):105-115.
[2] 李金海,吳偉志.形式概念分析的粒計算方法及其研究展望[J].山東大學學報:理學版,2017,52(7):1-12.
[3] 曾望林,折延宏.面向對象的多粒度形式概念分析[J].計算機科學,2018,45(10):51-53,63.