劉 盾,葉曉慶,李天瑞
(1.西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,四川 成都 610031;2.服務(wù)科學(xué)與創(chuàng)新四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610031;3.西南交通大學(xué) 計(jì)算機(jī)與人工智能學(xué)院,四川 成都 611756)
作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量, 人工智能正在對(duì)經(jīng)濟(jì)發(fā)展、 社會(huì)進(jìn)步、 國(guó)際政治經(jīng)濟(jì)格局等諸多方面產(chǎn)生重大而深遠(yuǎn)的影響。 近年來(lái),人工智能技術(shù)在各行各業(yè)得到了快速的發(fā)展和廣泛的應(yīng)用。 一方面,它已潛移默化地融入到人們的衣食住行和生活的方方面面中, 極大地推動(dòng)了人們智慧化生活方式; 另一方面,它也為人們?cè)诟黝I(lǐng)域的生產(chǎn)實(shí)踐提供了強(qiáng)大的推力, 進(jìn)而催生了眾多具有巨大商業(yè)價(jià)值的AI產(chǎn)業(yè)和行業(yè)。
可解釋性問(wèn)題一直以來(lái)是人工智能領(lǐng)域面臨的挑戰(zhàn)性問(wèn)題之一。對(duì)于復(fù)雜決策問(wèn)題,受數(shù)據(jù)源的多模態(tài)性、數(shù)據(jù)結(jié)構(gòu)的多樣性、數(shù)據(jù)內(nèi)涵的復(fù)雜性等因素影響,傳統(tǒng)的機(jī)器學(xué)習(xí)模型和算法已不能滿足大數(shù)據(jù)決策環(huán)境的新需求。隨著云計(jì)算、云存儲(chǔ)、云服務(wù)等分布式和并行計(jì)算理論的快速發(fā)展與廣泛普及,以及眾多新興機(jī)器學(xué)習(xí)方法的提出,都為人工智能研究提供了有力的技術(shù)支撐和有益的方法借鑒。然而,以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)模型與算法在執(zhí)行和計(jì)算過(guò)程中猶如一個(gè)不透明的黑箱,人們只能觀測(cè)數(shù)學(xué)模型的數(shù)據(jù)輸入和結(jié)果輸出,卻不了解系統(tǒng)內(nèi)部的運(yùn)行機(jī)制和工作原理,更難理解最終決策的判斷依據(jù)和背后機(jī)理。這種“說(shuō)不清,道不明”“只觀其果難覓其因”的現(xiàn)象極大地束縛了人工智能相關(guān)理論的落地,制約了人工智能相關(guān)技術(shù)的實(shí)施,也阻礙了人工智能與傳統(tǒng)行業(yè)的進(jìn)一步深度融合。
作為近二十年不確定性人工智能領(lǐng)域興起的一種新興數(shù)學(xué)工具和方法,粒計(jì)算(granular computing)理論通過(guò)在現(xiàn)實(shí)問(wèn)題中對(duì)粒的抽象與描述、在模型構(gòu)建中對(duì)粒的分析與轉(zhuǎn)換、在算法設(shè)計(jì)中對(duì)粒的合成與分解來(lái)處理復(fù)雜決策問(wèn)題, 一經(jīng)提出便引起了國(guó)內(nèi)外研究人員的濃厚興趣和廣泛關(guān)注。 一方面, 粒計(jì)算基于“多層次”和“多視角”兩個(gè)維度,借鑒“粒度粗化”和“粒度細(xì)化”兩種思想,采用滿意近似解替代精確解的策略來(lái)求解復(fù)雜決策問(wèn)題, 這能夠降低問(wèn)題求解過(guò)程中的計(jì)算復(fù)雜度, 大大提升計(jì)算能力; 另一方面, 粒計(jì)算通過(guò)模擬人類思維方式和行為模式來(lái)對(duì)原始信息加以理解、 概括、 描述和操作, 并利用信息?;侄螌?duì)基本粒子、 粒層和粒結(jié)構(gòu)進(jìn)行抽象、 描述和表示,使得決策者能夠更加深刻地理解問(wèn)題的本質(zhì)特征, 從而增強(qiáng)對(duì)決策過(guò)程的把控和決策結(jié)果的可解釋性。 可以看到, 粒計(jì)算理論完美地契合了復(fù)雜問(wèn)題求解的一般模式, 是人類認(rèn)知能力和智能思維的重要體現(xiàn), 這也為不確定性人工智能可解釋性問(wèn)題的解決提供了一種有效方法和可行途徑。
三支決策(three-way decision)是加拿大學(xué)者Yao Yiyu教授在近十年來(lái)提出并發(fā)展起來(lái)的一種處理不確定性決策的粒計(jì)算方法[1]。該方法主要采用“化一為三”“化整為零”和“化繁為簡(jiǎn)”的策略來(lái)簡(jiǎn)化復(fù)雜問(wèn)題,是一種符合人類認(rèn)知的“三分而治”理論。三支決策的核心思想是通過(guò)Trisecting-Acting-Outcome模型(簡(jiǎn)稱TAO模型,也稱“分治效”模型)將整體(論域)分為3個(gè)子集或3個(gè)部分,并對(duì)不同子集或部分采取不同的決策行為或分治策略,最后,對(duì)相應(yīng)的行為或策略得到的效果進(jìn)行評(píng)價(jià)和反饋[2]。進(jìn)一步地,由于三支決策借鑒了粒計(jì)算的結(jié)構(gòu)化哲學(xué)思維、結(jié)構(gòu)化問(wèn)題求解方法和結(jié)構(gòu)化信息計(jì)算模式去解決復(fù)雜決策問(wèn)題,能夠深度詮釋粒計(jì)算的內(nèi)涵和外延,且在處理不確定性問(wèn)題時(shí)表現(xiàn)出很好的有效性和可靠性,該方法已逐漸成為不確定人工智能研究領(lǐng)域的一種重要的研究方法。
基于上述分析,在對(duì)已有文獻(xiàn)進(jìn)行整理和分析的基礎(chǔ)上,本文嘗試從可解釋性研究視角來(lái)系統(tǒng)性研究三支決策理論和方法。首先,從粗糙集理論出發(fā),闡述三代粗糙集模型的演化過(guò)程和三支決策發(fā)展軌跡;其次,從粒計(jì)算理論出發(fā),通過(guò)引入時(shí)間和空間維度,介紹序貫三支決策(sequential three-way decision)和層次三支決策(hierarchical three-way decision)相關(guān)理論與方法;再次,從分類視角出發(fā),探討三支分類問(wèn)題,闡述三支決策在分類問(wèn)題中的有效性;最后,從認(rèn)知視角出發(fā),深入討論三支決策的哲學(xué)思想,并分析三支決策與可解釋性人工智能融合的思路與途徑。
三支決策的最早思想來(lái)源于粗糙集理論。眾所周知,粗糙集理論是波蘭數(shù)學(xué)家Pawlak于20世紀(jì)80年代提出的,它是狹義三支決策最經(jīng)典的模型。其核心思想是通過(guò)上近似集和下近似集將論域分為3個(gè)兩兩互不相交的子集,并分別命名為正域、邊界域和負(fù)域,其基本定義如下。
定義1假設(shè)U是一個(gè)有限非空子集,R?U×U為論域U上的等價(jià)關(guān)系。 記apr=(U,R)為一粗糙近似空間,U可以通過(guò)該等價(jià)關(guān)系R劃分成互不相交的子集,形成論域U上的一個(gè)劃分U/R={[x]R|x∈U}([x]R簡(jiǎn)記為[x])。?X?U,其正域POS(X),邊界域BND(X)和負(fù)域NEG(X)分別定義為
POS(X)={x∈U|[x]?X};
BND(X)={x∈U|[x]?X且[x]∩X≠
?};
NEG(X)={x∈U|[x]∩X=?}。
(1)
可以看到,Pawlak粗糙集是粗糙集理論最經(jīng)典的形式,而從3個(gè)區(qū)域推導(dǎo)的決策規(guī)則自然形成了三支決策的核心思想,即從正域里獲取的正規(guī)則用來(lái)接受某事物;從負(fù)域里獲取的負(fù)規(guī)則用來(lái)表示拒絕某事物;落在邊界域上的規(guī)則表示延遲決策。顯而易見(jiàn),Pawlak粗糙集存在一定的局限性,因?yàn)樗鼪](méi)有考慮決策規(guī)則的容錯(cuò)性。基于此,概率粗糙集隨之被提出來(lái)以改進(jìn)Pawlak粗糙集的缺陷,其主要通過(guò)兩個(gè)閾值α和β(0≤β<α≤1)重新定義3個(gè)決策區(qū)域。
定義2假設(shè)S=(U,R)為一信息系統(tǒng),?X?U,令0≤β<α≤1,則概率粗糙集的正域POS(α,β)(X),邊界域BND(α,β)(X)和負(fù)域NEG(α,β)(X)可分別定義為
POS(α,β)(X)={x∈U|Pr(X|[x])≥α};
BND(α,β)(X)={x∈U|β <α}; NEG(α,β)(X)={x∈U|Pr(X|[x])≤β}。 (1) 式中:Pr(X|[x])=|[x]∩X|/|[x]|表示條件概率;|·|表示集合的基數(shù)。顯然地,當(dāng)α=1,β=0時(shí),概率粗糙集退化成Pawlak粗糙集。進(jìn)一步,如果把Pawlak粗糙集視為第I代三支決策模型的話,概率粗糙集則為第II代三支決策模型。 然而,概率粗糙集僅對(duì)不確定性模型的語(yǔ)法進(jìn)行了描述,而沒(méi)有對(duì)模型的語(yǔ)義進(jìn)行解釋,這表現(xiàn)為兩個(gè)閾值α和β的取值都是人為事先給定的。為了更清晰地闡明粗糙集理論的可解釋性,Yao在20世紀(jì)90年代提出了決策粗糙集理論,該理論可以看成是第III代三支決策模型[3]。決策粗糙集主要通過(guò)引入貝葉斯決策過(guò)程,來(lái)實(shí)現(xiàn)閾值的自動(dòng)獲取,其基本思想如下。 考慮貝葉斯決策的一個(gè)特殊模型,它由2個(gè)狀態(tài)集和3個(gè)行動(dòng)集構(gòu)成。其中,狀態(tài)集Ω={X,?X}分別表示某事件屬于X和不屬于X,行動(dòng)集Α={aP,aB,aN}分別表示接受某事件、延遲決策和拒絕某事件3種行動(dòng)。 對(duì)于x∈U,考慮到采取不同行動(dòng)會(huì)產(chǎn)生不同的損失,記λPP、λBP、λNP分別表示當(dāng)x屬于X時(shí),采取行動(dòng)aP、aB和aN下的損失;類似地,記λPN、λBN、λNN分別表示當(dāng)x不屬于X時(shí),采取行動(dòng)aP、aB和aN下的損失。 根據(jù)貝葉斯決策理論,采取aP、aB和aN3種行動(dòng)下的期望損失可分別表示為 R(aP|[x])=λPPPr(X|[x])+λPNPr(?X| [x]); R(aB|[x])=λBPPr(X|[x])+λBNPr(?X| [x]); R(aN|[x])=λNPPr(X|[x])+λNNPr(?X| [x])。 (2) 根據(jù)貝葉斯決策準(zhǔn)則,需要選擇期望損失最小的行動(dòng)集作為最佳行動(dòng)方案,可以得到以下3條決策規(guī)則。 (P):若R(aP|[x])≤R(aB|[x])和 R(aP|[x])≤R(aN|[x])同時(shí)成立,則x∈POS(X); (B):若R(aB|[x])≤R(aP|[x])和 R(aB|[x])≤R(aN|[x])同時(shí)成立,則x∈BND(X); (N):若R(aN|[x])≤R(aP|[x])和 R(aN|[x])≤R(aB|[x])同時(shí)成立,則x∈NEG(X)。 由于Pr(X|[x])+Pr(?X|[x])=1,則上述3條規(guī)則只與條件概率和損失函數(shù)這兩個(gè)因素有關(guān)。此外,考慮到接受正確事物的損失不大于延遲接受正確事物的損失,且這兩者都小于拒絕正確事物的損失;拒絕錯(cuò)誤事物的損失不大于延遲拒絕錯(cuò)誤事物的損失,且這兩者都小于接受錯(cuò)誤事物的損失。有λPP≤λBP<λNP,λNN≤λBN<λPN。據(jù)此,通過(guò)聯(lián)立求解(P)-(N),可以得到如下結(jié)果。 (3) 顯然地,由規(guī)則(B)可知,不等式α>β成立,即 進(jìn)一步地,有 成立,即0≤β<γ<α≤1成立?;谏鲜龇治?可以重寫(xiě)(P)-(N)的決策規(guī)則形式如下。 (P1):如果Pr(X|[x])≥α,則x∈POS(X); (B1): 如果β (N1):如果Pr(X|[x])≤β,則x∈NEG(X)。 顯然地,規(guī)則(P1)-(N1)給出了論域中每個(gè)樣本x的數(shù)學(xué)判定條件,滿足規(guī)則(P1)的樣本劃分到X的正域中,同時(shí)做出立即執(zhí)行決策;滿足規(guī)則(N1)的樣本劃分到X的負(fù)域中,同時(shí)做出不執(zhí)行決策;滿足規(guī)則(B1)的樣本由于決策依據(jù)不足,暫緩做出決策??梢钥吹?決策粗糙集為三支決策提供了一種直觀的三劃分準(zhǔn)則。此外,決策粗糙集為三支決策的兩個(gè)閾值計(jì)算提供了一種具有可解釋性的計(jì)算方法,即α和β的取值不是人為主觀設(shè)定的,其閾值取值與決策損失函數(shù)密切相關(guān)。 正如文獻(xiàn)[4]所提到的觀點(diǎn):決策粗糙集是狹義三支決策的典型代表,它既是三支決策研究的原點(diǎn),也是從語(yǔ)義視角去詮釋三支決策可解釋性的一次成功嘗試??偠灾?從Pawlak粗糙集到概率粗糙集,再到?jīng)Q策粗糙集,粗糙集理論經(jīng)過(guò)三代演化,人們?cè)絹?lái)越意識(shí)到語(yǔ)義解釋對(duì)于理論模型的重要性,三支決策的可解釋性問(wèn)題也逐漸成為粒計(jì)算研究一個(gè)新的關(guān)注點(diǎn)。 為了進(jìn)一步闡明三支決策的過(guò)程和機(jī)理,Yao在2018年提出了一個(gè)三支決策的一般化模型——“分治效”模型(trisecting-acting-outcome模型,簡(jiǎn)稱TAO模型)[2]。 該模型首次跳出了傳統(tǒng)三支決策,只關(guān)注粗糙集的狹義研究模式,是廣義三支決策最具代表性的理論模型。 TAO模型的基本思想如圖1所示。 圖1 TAO模型的一般研究框架Fig.1 The research framework of TAO model 在圖1中,TAO模型中將決策過(guò)程分為3個(gè)階段:“三分”階段將論域U分為3個(gè)決策區(qū)域U1、U2和U3; “治略”階段針對(duì)不同的決策區(qū)域采取不同的策略S1、S2和S3;“效果”階段主要是對(duì)于不同的策略采取相應(yīng)的行動(dòng)a1、a2和a3,最終得到3種不同的評(píng)價(jià)結(jié)果O1、O2和O3。 在TAO模型中,“三分”是“治略”的前提,“治略”是“三分”的目的,而“效果”是“三分”和“治略”的監(jiān)督保障。 對(duì)于不同的決策背景,可以根據(jù)實(shí)際情況來(lái)確立對(duì)應(yīng)的劃分機(jī)理、執(zhí)行策略和評(píng)價(jià)效果[5]。 進(jìn)一步地,三支決策對(duì)于TAO模型決策機(jī)理的探索可分為兩個(gè)層面。一是關(guān)注決策過(guò)程的動(dòng)態(tài)性特征。例如:在論文審稿過(guò)程中,作者從投稿到接收可能會(huì)經(jīng)歷多次修改,而每次修訂提交后又可能面臨接收、繼續(xù)修改和拒絕三種結(jié)果,如此反復(fù)直至完全接收或拒絕,這體現(xiàn)了一種序貫三支決策思想。二是關(guān)注決策過(guò)程的粒結(jié)構(gòu)特征。例如:在疫情防控過(guò)程中,人們可以從宏觀搜集全國(guó)每日新增確診數(shù)據(jù),接著細(xì)化了解各省每日新增數(shù)據(jù),然后再細(xì)化獲知各市縣實(shí)時(shí)數(shù)據(jù),直至掌握所住街道/小區(qū)的詳細(xì)數(shù)據(jù)來(lái)判斷身邊所處疫情情況。如果僅以最粗粒度全國(guó)數(shù)據(jù)來(lái)決定某街道/小區(qū)的防疫措施,則難以作出微觀準(zhǔn)確有效的決策,反之亦然。上述兩個(gè)層面反映了三支決策的時(shí)間屬性和空間屬性。時(shí)間屬性注重動(dòng)態(tài)決策環(huán)境下的“時(shí)序性”分析;空間屬性則側(cè)重粒度變化情形下的“層次性”建模。進(jìn)一步地,在很多實(shí)際決策問(wèn)題中,時(shí)間和空間兩種屬性往往是相生相伴、相互依存的。比如論文從投稿到最終被接收或拒絕自然形成一種??臻g結(jié)構(gòu);而將每天不同粒層的疫情數(shù)據(jù)匯總起來(lái)自然形成一個(gè)時(shí)序序列。因此,研究三支決策的時(shí)空屬性自然成為了探索三支決策可解釋性的重要手段。 對(duì)于三支決策時(shí)空屬性的研究,粒計(jì)算是一種重要的理論和方法[6]。眾所周知,粒計(jì)算是當(dāng)前智能信息處理領(lǐng)域的一種新的計(jì)算范式,它模擬了人類對(duì)于世界的多粒度表示、多粒度處理和多粒度決策機(jī)制,可看作為一種新的廣義機(jī)器學(xué)習(xí)模型和方法。信息粒化是粒計(jì)算在處理復(fù)雜問(wèn)題的一種有效手段。通過(guò)粒化,人類可以從多個(gè)層次和多個(gè)視角去認(rèn)知、描述和理解客觀世界和主觀世界。進(jìn)一步地,從知識(shí)學(xué)習(xí)視角出發(fā),對(duì)某一事物而言,如果將其知識(shí)粒度不斷粗化,人們對(duì)該事物的認(rèn)識(shí)就越模糊;反之,如果將其知識(shí)粒度不斷細(xì)化,則人們對(duì)該事物的認(rèn)識(shí)也就越清晰。可以看到,事物自身知識(shí)粒度的動(dòng)態(tài)變化過(guò)程反映了人們對(duì)事物的認(rèn)知過(guò)程,這與現(xiàn)實(shí)世界的結(jié)構(gòu)、人們的漸進(jìn)式思維模式及行為方式是高度契合的。基于上述分析,可以從“面向粒計(jì)算的序貫三支決策”和“面向粒計(jì)算的層次三支決策”兩個(gè)方面來(lái)探討三支決策的時(shí)空性問(wèn)題。 可以得到序貫三支決策的規(guī)則判定條件。 (P2):如果Pr(X|x(t))≥α(t),則x(t)∈POS(t)(X); (B2):如果β(t) (N2):如果Pr(X|x(t))≤β(t),則x(t)∈NEG(t)(X)。 基于上述基本模型,國(guó)內(nèi)外眾多學(xué)者對(duì)序貫三支決策理論和方法作了大量研究。Yao和Deng最早討論了序貫三支決策問(wèn)題,他們針對(duì)延遲決策問(wèn)題,將靜態(tài)三支決策推廣到了一個(gè)動(dòng)態(tài)序列,并采用粒計(jì)算思想提出一種序貫三支決策模型[7]。Liu等考慮了不同損失函數(shù)變化情形下的動(dòng)態(tài)決策粗糙集模型[8]。 Gao和Yao構(gòu)建了一種考慮行動(dòng)策略的序貫三支決策模型[9]。Jiang等討論了一種基于移動(dòng)的三支決策模型,通過(guò)使用比例效用函數(shù)來(lái)度量三支決策的有效性[10]。Yang等從增量學(xué)習(xí)的視角探討了多粒度增量學(xué)習(xí)下的序貫三支決策統(tǒng)一模型[11]。Xu等提出了一個(gè)基于概率粗糙集的流計(jì)算三支決策模型,并將其應(yīng)用到上下近似集的動(dòng)態(tài)增量學(xué)習(xí)過(guò)程中[12]。Qian等提出了一個(gè)基于多粒度的序貫三支決策研究框架,詳細(xì)分析了5種多粒度序貫三支決策模型的聯(lián)系與區(qū)別[13]。 Fang等建立了一個(gè)粒度驅(qū)動(dòng)的序貫三支決策模型來(lái)處理動(dòng)態(tài)決策過(guò)程中的決策代價(jià)和決策成本問(wèn)題[14]。 Zhang等提出了一種使用序貫三支決策的成本敏感組合技術(shù)S3WC來(lái)解決情緒分類問(wèn)題[15]。Wu等設(shè)計(jì)了一種無(wú)重疊的三支序列模式挖掘方法,該方法不僅能夠挖掘出冗余信息,而且能夠高效提取對(duì)用戶有價(jià)值的信息[16]。進(jìn)一步地,Li等提出一種基于序貫三支決策的代價(jià)敏感人臉識(shí)別模型,來(lái)解決錯(cuò)分類代價(jià)不平衡和圖像信息不充分等問(wèn)題[17],并基于深度神經(jīng)網(wǎng)絡(luò)探討了圖像特征粒度提取與序貫識(shí)別問(wèn)題,取得了較好的實(shí)驗(yàn)效果[18]。Zhang等構(gòu)建了一種序貫三支增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)模型,用以提高分類精度和分類性能[19]。Savchenko將序貫三支決策的思想引入到卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)在神經(jīng)網(wǎng)絡(luò)的不同粒層上提取圖像的序貫特征,來(lái)實(shí)現(xiàn)圖像的表征和加速推理[20]。 可以得到相應(yīng)層次三支決策的規(guī)則判定條件。 (P3):如果Pr(X|x(s))≥α(s),則x(s)∈POS(s)(X); (B3):如果β(s) (N3):如果Pr(X|x(s))≤β(s),則x(s)∈NEG(s)(X)。 進(jìn)一步地,可認(rèn)為層次三支決策主要采用了多粒度計(jì)算和多尺度計(jì)算兩種方法。 對(duì)于多粒度三支決策,Qian等從信息融合視角出發(fā),提出了多粒度粗糙集模型,通過(guò)?;@得的信息粒集和多個(gè)粒結(jié)構(gòu)進(jìn)行數(shù)據(jù)分析,并從挖掘的知識(shí)中融合集成有效的決策知識(shí)[21]。苗奪謙等提出了粒度空間的三層模型概念,探討了覆蓋、基和粒結(jié)構(gòu)在不同粒度空間下的關(guān)系[22]。王國(guó)胤等從粒計(jì)算模型的角度詳細(xì)探討了模糊集、粗糙集、商空間理論模型及其他擴(kuò)展粒計(jì)算模型中知識(shí)的不確定性問(wèn)題[23]。Zhang和Miao從粗糙集正域、邊界域和負(fù)域三個(gè)層次出發(fā)對(duì)三支決策約簡(jiǎn)作了系統(tǒng)性研究[24]。Yue等討論了基于模糊粗糙變換的陰影鄰域三支分類問(wèn)題[25]。Chen等構(gòu)建了一種基于三支決策的自適應(yīng)分層特征表示模型來(lái)處理邊界域問(wèn)題,并通過(guò)自適應(yīng)學(xué)習(xí)方法來(lái)搜尋邊界域處理的最優(yōu)粒度空間[26]。Yang等人采用自頂向下的造粒方法構(gòu)建了多層次復(fù)合粒結(jié)構(gòu),并建立了一種基于不同粒度融合的三支決策研究框架,以解決粒計(jì)算中的數(shù)據(jù)融合問(wèn)題[27]。 對(duì)于多尺度三支決策,Wu和Leung提出多尺度決策表等概念,并從粒計(jì)算角度研究了多尺度決策表中最優(yōu)尺度的選擇問(wèn)題[28]。Li和Hu討論了多尺度問(wèn)題中最優(yōu)尺度的選擇問(wèn)題[29]。Hao等人提出了基于多尺度信息表的序貫三支決策模型,以解決動(dòng)態(tài)多尺度決策中的最優(yōu)尺度選擇問(wèn)題[30]。Huang等人構(gòu)建了從多尺度直覺(jué)模糊信息表中獲取信息的多粒度決策粗糙集方法,并進(jìn)一步探討了最優(yōu)尺度選擇和約簡(jiǎn)問(wèn)題[31]。Luo等通過(guò)對(duì)屬性值分類進(jìn)行細(xì)化和粗化,提出了在不完全多尺度信息系統(tǒng)中的決策規(guī)則增量更新方法,為增量三支決策提供了理論依據(jù)和語(yǔ)義解釋[32]。 Zhang等人建立了基于尺度空間的序貫三支決策模型,設(shè)計(jì)了結(jié)合三支決策和Hasse圖的最優(yōu)尺度組合選擇算法,用以提高多尺度決策系統(tǒng)的搜索效率[33]。Yu等探討了三支決策的聚類分析模型和聚類數(shù)的自動(dòng)學(xué)習(xí)算法[34]。Shen等研究了多層次分類視角下三支決策的分塊約簡(jiǎn)問(wèn)題[35]。She等討論了多尺度決策表的泛化約簡(jiǎn)方法[36]。Huang和Zhan從多尺度視角出發(fā),提出了一種基于后悔理論的三支決策模型,旨在解決肝病診斷中患者的分類和排序問(wèn)題[37]。 可以看到,國(guó)內(nèi)外眾多學(xué)者分別從不同的研究視角對(duì)三支決策理論和粒計(jì)算方法作了大量系統(tǒng)性研究,并在多個(gè)方面取得了一系列重要成果,這極大地推動(dòng)了可解釋性三支決策與粒計(jì)算研究領(lǐng)域的發(fā)展。 本小節(jié)在前面分析的基礎(chǔ)上,進(jìn)一步從分類視角來(lái)闡明三支決策的有效性。 首先,以決策粗糙集為研究對(duì)象,將二支決策模型作為參照基準(zhǔn),來(lái)驗(yàn)證三支決策的有效性。值得一提的是,二支決策是式(3)中當(dāng)β≥α成立時(shí)的情形。在二支決策中,參數(shù)γ成為劃分決策區(qū)域的關(guān)鍵因素,它將論域劃分為兩個(gè)區(qū)域。此時(shí),決策規(guī)則(P)-(N)的退化為 (P4):如果Pr(X|[x])≥γ,則x∈POS(X); (N4):如果Pr(X|[x])<γ,則x∈NEG(X)。 為了更清晰地說(shuō)明問(wèn)題,下面引入混淆矩陣的概念。最經(jīng)典的混淆矩陣用于解決二分類問(wèn)題,表1是一個(gè)2×2的混淆矩陣,其行代表預(yù)測(cè)類別,其列代表真實(shí)類別。 表1 混淆矩陣Tab.1 The confusion matrix 在表1中, TP(true positive, 真陽(yáng)性)表示樣本的真實(shí)類別是正例, 并且模型預(yù)測(cè)的結(jié)果也是正例的情形; TN (true negative, 真陰性)表示樣本的真實(shí)類別是負(fù)例, 并且模型將其預(yù)測(cè)為負(fù)例的情形; FP (false positive, 假陽(yáng)性)表示樣本的真實(shí)類別是負(fù)例, 而模型將其預(yù)測(cè)為正例的情形; FN(false negative, 假陰性)表示樣本的真實(shí)類別是正例, 而模型將其預(yù)測(cè)為負(fù)例的情形。 根據(jù)表1,可以定義評(píng)價(jià)分類模型優(yōu)劣的4個(gè)測(cè)度:準(zhǔn)確率(precision)、召回率(recall)、精度(accuracy)和F1值。 (4) 將表1中的混淆矩陣推廣到二支決策和三支決策中,可以分別定義它們?cè)诓煌袆?dòng)下的混淆矩陣,如表2所示。 表2 二支決策與三支決策的混淆矩陣 (5) 接下來(lái),分別定義二支決策和三支決策的損失函數(shù)矩陣,如表3所示。 表3 二支決策與三支決策的損失函數(shù)矩陣 根據(jù)表2和表3,可以分別計(jì)算二支決策和三支決策的總體損失為 (6) (7) (8) (9) 為了解決上述問(wèn)題,Liu討論了在兩種樣本分布情形下,三支決策在不同測(cè)度和總體損失優(yōu)于二支決策的判定條件,并通過(guò)大量實(shí)驗(yàn)驗(yàn)證了在不同數(shù)據(jù)集和不同損失函數(shù)設(shè)定情形下,三支決策在分類問(wèn)題中的有效性[38]。此外,Yao[39]和劉盾等[40]分別深入探討了在[0,β]、(β,γ)、[γ,α]和(α,1]4個(gè)決策區(qū)間產(chǎn)生誤分類損失(包括拒真錯(cuò)誤造成的損失和采偽錯(cuò)誤造成的損失)和延遲損失產(chǎn)生的原因,詳細(xì)分析了概率粗糙集(第II代三支決策模型)優(yōu)于Pawlak粗糙集(第I代三支決策模型)和γ-二支決策的數(shù)學(xué)機(jī)理,并給出了嚴(yán)格的數(shù)學(xué)證明。此外,Yin等基于概率論的視角,深刻闡述了三支決策優(yōu)于二支決策的內(nèi)在機(jī)理[41]。上述研究都嘗試從可解釋性的視角去探討三支決策在分類問(wèn)題中的優(yōu)勢(shì),這本身也推動(dòng)了三支決策在機(jī)器學(xué)習(xí)領(lǐng)域中的發(fā)展。 認(rèn)識(shí)的本質(zhì)是主體對(duì)客體的能動(dòng)反映,它是動(dòng)態(tài)的、可計(jì)算的,能夠依據(jù)實(shí)際任務(wù)知識(shí)化、智能化、自主化地呈現(xiàn)出“感知—分析—決策—執(zhí)行”的遞進(jìn)行為。 一般而言,人類的認(rèn)知規(guī)律主要體現(xiàn)在兩個(gè)方面:一是通過(guò)認(rèn)知將復(fù)雜事物簡(jiǎn)單化;二是人類處理信息的能力是有限的。為了更好地刻畫(huà)人類的認(rèn)知規(guī)律,Yao 系統(tǒng)地研究了基于認(rèn)知計(jì)算的三支決策理論,并指出認(rèn)知計(jì)算是研究可解釋性人工智能的關(guān)鍵技術(shù)和三支決策發(fā)展的重要方向[42]。 最早對(duì)三支決策與認(rèn)知計(jì)算融合的思考來(lái)源于粒計(jì)算的三元論[43]。該理論認(rèn)為粒計(jì)算的核心由粒子、粒層和粒結(jié)構(gòu)3部分組成。① 粒子是一個(gè)最基本的抽象概念,它可以通過(guò)分解/聚合得到一個(gè)?;?抽象的理解和描述,粒本身具有內(nèi)部、外部和環(huán)境依賴3個(gè)特征。② 粒層是由相同性質(zhì)或相同大小的粒子構(gòu)成,每一層次由多個(gè)相互影響、相互關(guān)聯(lián)的粒子構(gòu)成,不同粒層給出不同粒度或尺度的描述。 ③ 粒結(jié)構(gòu)將粒子和粒層有序地組織起來(lái),其形成的多層次結(jié)構(gòu)可以給定粒度的全局描述,它體現(xiàn)了粒計(jì)算所倡導(dǎo)的多粒度、多尺度、多層次、多視角的結(jié)構(gòu)化方法。基于此,粒計(jì)算的三元模型以粒結(jié)構(gòu)為基礎(chǔ),包括3個(gè)要素:結(jié)構(gòu)化哲學(xué)思維、結(jié)構(gòu)化問(wèn)題求解方法和結(jié)構(gòu)化信息計(jì)算模式,它們構(gòu)成了粒計(jì)算三角形。進(jìn)一步地,針對(duì)每一個(gè)要素,Yao給出了一些具體的思路和方法。他認(rèn)為結(jié)構(gòu)化思維可以從“還原論、系統(tǒng)論、層次論”3種理論去詮釋粒計(jì)算哲學(xué)思想;結(jié)構(gòu)化問(wèn)題求解可以從“自頂向下、自底向上、自中向外”3種策略去設(shè)計(jì)粒計(jì)算處理算法;結(jié)構(gòu)化信息處理可以從“Pandemonium架構(gòu)、漸進(jìn)式計(jì)算、序貫決策”3種方式去揭示粒計(jì)算運(yùn)行機(jī)制[43]。 粒計(jì)算三元論的核心思想如圖2所示。 圖2 粒計(jì)算的三元論Fig.2 The triarchic theory of granular computing 隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)科學(xué)和認(rèn)知科學(xué)已成為近年來(lái)快速增長(zhǎng)的研究熱點(diǎn)領(lǐng)域。三支決策與數(shù)據(jù)科學(xué)、認(rèn)知科學(xué)的融合也成為國(guó)內(nèi)外學(xué)者重點(diǎn)關(guān)注的研究方向?;诖?Yao在符號(hào)/形式、意義/內(nèi)容和價(jià)值/效用3個(gè)層面上給出了數(shù)據(jù)科學(xué)研究的三級(jí)框架,提出了SMV 空間(symbols-meaning-value space,“符號(hào)-意義-價(jià)值”空間)的概念[44]。該框架借助計(jì)算機(jī)模擬人類的感知、注意力和學(xué)習(xí)等思維過(guò)程,從信息科學(xué)、認(rèn)知科學(xué)和計(jì)算機(jī)科學(xué)不同視角出發(fā),實(shí)現(xiàn)對(duì)思考、記憶等人腦認(rèn)知過(guò)程的模擬,最終描述、理解和構(gòu)建了“我們感知什么和如何感知”“我們知道什么和如何知道”,以及“我們做什么和如何做”3個(gè)根本性問(wèn)題,并明確指出三支決策是一類有效的認(rèn)知學(xué)習(xí)啟發(fā)式方法,解釋了三支決策的3種處理模式,即“自下而上”的數(shù)據(jù)驅(qū)動(dòng),“自上而下”的決策驅(qū)動(dòng),以及“自中而外”的知識(shí)型方法。具體而言,SMV空間可從以下3個(gè)視角去理解、詮釋和分析。 從信息科學(xué)視角出發(fā),SMV空間主要體現(xiàn)為DIKW(data-information-knowledge-wisdom,數(shù)據(jù)-信息-知識(shí)-智慧)層級(jí)模型。該模型構(gòu)建了一個(gè)金字塔形的多層次知識(shí)結(jié)構(gòu)。其中,數(shù)據(jù)層是最基本的層次,它包含了最底層的知識(shí);信息層加入了內(nèi)容,人們可以分析數(shù)據(jù)間的關(guān)系來(lái)獲得信息;知識(shí)層需要思考“如何去使用”,在實(shí)際決策中使用信息產(chǎn)生了知識(shí);智慧層體現(xiàn)了“什么時(shí)候才用”,它包含了最高層的知識(shí)。Yao利用三支決策思想,將DIKW層級(jí)模型中的信息層和知識(shí)層合并提出了一種廣義的DKW層級(jí)模型[45]。在該模型中,數(shù)據(jù)是輸入層(最底層),是未經(jīng)處理的原材料;信息和知識(shí)被組合成一個(gè)單一的中間層,它們可以從分析數(shù)據(jù)中獲得;而智慧是輸出層(最高層),用于指導(dǎo)人們科學(xué)地使用知識(shí)。 從認(rèn)知科學(xué)視角出發(fā),Yao在DKW三層級(jí)模型的基礎(chǔ)上做了更進(jìn)一步的思考,認(rèn)為SMV空間體現(xiàn)為觀察、知悉和行動(dòng)(seeing, knowing and doing)3個(gè)步驟。從本質(zhì)而言,SMV空間和DKW層級(jí)模型可視為一個(gè)IPO (input-process-output,輸入-處理-輸出)三支決策框架,它實(shí)現(xiàn)了機(jī)器/系統(tǒng)與人的聯(lián)系與交互。一方面,從機(jī)器/系統(tǒng)視角,可以構(gòu)建一個(gè)基于CAD (collection-analysis-decision,采集-分析-決策)的三層次模型來(lái)整合數(shù)據(jù)的搜集、分析和決策。人們通過(guò)數(shù)據(jù)采集進(jìn)行輸入;借鑒數(shù)據(jù)分析產(chǎn)生信息和知識(shí);利用決策最終形成智慧。另一方面,從人的視角,DKW層級(jí)模型可以形成一個(gè)PCA(perception-cognition-action, 感知-認(rèn)知-行動(dòng))三層級(jí)結(jié)構(gòu),感知層關(guān)注信號(hào)(符號(hào)),負(fù)責(zé)數(shù)據(jù)的搜集和輸入;認(rèn)知層關(guān)注信息和知識(shí)(意義),負(fù)責(zé)將數(shù)據(jù)轉(zhuǎn)化為有用知識(shí);行動(dòng)層關(guān)注價(jià)值,負(fù)責(zé)結(jié)果的輸出。為了更加清晰地闡述上述思想,Yao構(gòu)建一個(gè)PCA模型的基本框架,如圖3所示。 圖3 感知-認(rèn)知-行動(dòng)模型Fig.3 Perception-cognition-action (PCA) model 從計(jì)算機(jī)科學(xué)視角出發(fā),SVM空間可看為是一個(gè)以數(shù)據(jù)為中心、以知識(shí)為基礎(chǔ)、以智慧為導(dǎo)向的計(jì)算機(jī)系統(tǒng)。它包含了“數(shù)據(jù)”“數(shù)據(jù)中蘊(yùn)涵的知識(shí)”,以及“從數(shù)據(jù)中獲得知識(shí)所產(chǎn)生的智慧”3個(gè)要素,它們分別對(duì)應(yīng)了DKW三層級(jí)結(jié)構(gòu)中的底層數(shù)據(jù)(無(wú)知識(shí))層次、中層知識(shí)層次和頂層智慧(更高級(jí)知識(shí))層次。 具體而言,在數(shù)據(jù)/符號(hào)級(jí)別,是以數(shù)據(jù)為中心的系統(tǒng)對(duì)原始數(shù)據(jù)進(jìn)行操作,其主要功能是收集、存儲(chǔ)和檢索數(shù)據(jù),而不去考慮數(shù)據(jù)的語(yǔ)義和含義;在知識(shí)/意義層面,是利用基于知識(shí)的系統(tǒng)處理不同類型的知識(shí);在智慧/價(jià)值層面,是以智慧為導(dǎo)向的系統(tǒng)去支持和幫助人們做出明智的決策并采取正確的行動(dòng)。 通過(guò)上述SVM三要素和DKW三層級(jí)結(jié)構(gòu),可以構(gòu)建一個(gè)以底層數(shù)據(jù)為基礎(chǔ)、以中層知識(shí)為支撐、以頂層智慧和價(jià)值為目標(biāo)的決策系統(tǒng),并形成一個(gè)3×3的數(shù)據(jù)科學(xué)概念框架,如表4所示。 表4 數(shù)據(jù)科學(xué)的3×3概念框架Tab.4 3×3 conceptual framework of data science 進(jìn)一步地,Yao近期思考了三支決策與可解釋性人工智能融合的可能性,指出三支決策可以利用SMV空間和WWH(why-what-how, 為什么-是什么-怎么做)法則相結(jié)合,去探討可解釋性人工智能相關(guān)問(wèn)題[46]。表5給出了一個(gè)SMV×WWH的三支決策研究框架。 此外,三支決策與形式概念分析和概念認(rèn)知等不確定性理論的深度融合也成為三支決策與認(rèn)知科學(xué)研究的一個(gè)重要研究方向,國(guó)內(nèi)外學(xué)者近年來(lái)也在這一領(lǐng)域取得了重大研究進(jìn)展。Li等從認(rèn)知計(jì)算的角度討論了基于粒計(jì)算的概念學(xué)習(xí),并將粒計(jì)算與認(rèn)知概念結(jié)構(gòu)相結(jié)合,提高概念學(xué)習(xí)效率[47]。進(jìn)一步地,Li等人基于概念學(xué)習(xí)和序貫三支決策的思想研究了多粒度的三支概念學(xué)習(xí),從認(rèn)知的角度揭示了三支概念學(xué)習(xí)在解決決策問(wèn)題時(shí)的核心思想,并系統(tǒng)總結(jié)了概念的漸進(jìn)式認(rèn)知理論與方法[48]。Xu等給出了一個(gè)新型認(rèn)知系統(tǒng)模型,并設(shè)計(jì)了信息粒度變換的算法[49]。Wang和Yao提出一種基于數(shù)學(xué)形態(tài)學(xué)的三支聚類方法[50]。Wu、 Leung和Mi研究了在形式背景下的粒度計(jì)算和知識(shí)約簡(jiǎn)問(wèn)題[51]。Zhi和Li針對(duì)不完備形式背景,提出了基于粒描述的決策規(guī)則獲取方法[52]。Qi等討論了三支決策與概念格的理論模型,這賦予了形式概念分析和概念格新的語(yǔ)義解釋[53]。Ren和Wei考慮了三支概念格的約簡(jiǎn)理論與方法[54]。值得一提的是,張鈸院士在《后深度學(xué)習(xí)時(shí)代的人工智能》的報(bào)告中提到“要解決當(dāng)前人工智能所面臨的挑戰(zhàn),可以考慮兩種解決辦法:其一,是把人工智能中‘知識(shí)驅(qū)動(dòng)’與‘?dāng)?shù)據(jù)驅(qū)動(dòng)’這兩個(gè)方法結(jié)合起來(lái);其二,是回到神經(jīng)網(wǎng)絡(luò)的本源,借助于人腦神經(jīng)的工作機(jī)制研究,進(jìn)一步推動(dòng)深度神經(jīng)網(wǎng)絡(luò)模型的深入發(fā)展?!盵55]?!爸R(shí)驅(qū)動(dòng)”跟語(yǔ)義掛鉤,是可理解的;“數(shù)據(jù)驅(qū)動(dòng)”是黑箱的方法,是不可理解的。如果能把兩種方法整合起來(lái),有可能推動(dòng)人工智能技術(shù)的發(fā)展與應(yīng)用。上述成果和觀點(diǎn)為未來(lái)三支決策可解釋性研究指明了明確的方向。 表5 SMV×WWH三支決策研究框架 人工智能的可解釋性問(wèn)題是當(dāng)前數(shù)據(jù)科學(xué)與信息技術(shù)關(guān)注的熱點(diǎn)課題和前沿方向。以三支決策與粒計(jì)算理論為代表的理論和方法通過(guò)模擬人類思維方式和行為模式,通過(guò)信息?;⒎謱舆f階等技術(shù)手段對(duì)復(fù)雜問(wèn)題本質(zhì)特征進(jìn)行剖析和分解,實(shí)現(xiàn)了對(duì)決策問(wèn)題的簡(jiǎn)化、增強(qiáng)了對(duì)決策結(jié)果的解釋,并已逐漸成為人工智能的一個(gè)重要研究方向。本文從粗糙集理論、粒計(jì)算方法、分類問(wèn)題和認(rèn)知計(jì)算4個(gè)層面出發(fā),來(lái)探討三支決策的可解釋性問(wèn)題,體現(xiàn)了三支決策在處理不確定性人工智能及復(fù)雜決策問(wèn)題的有用性和有效性,具有重要的理論意義和廣泛的應(yīng)用前景。雖然近十年來(lái),三支決策在理論、方法和應(yīng)用上取得了較大進(jìn)展,但其一般化理論還未完全構(gòu)建,很多課題還有待深入探究。2022年中國(guó)人工智能學(xué)會(huì)組織編纂的《中國(guó)人工智能系列白皮書(shū)——粒計(jì)算與知識(shí)發(fā)現(xiàn)》分冊(cè)中已明確把三支決策列為粒計(jì)算的主要研究方向[56],基于分類/聚類/社團(tuán)發(fā)現(xiàn)的三支決策方法、基于推薦系統(tǒng)的三支決策方法、基于自然語(yǔ)言處理和情感分析的三支決策方法、基于圖像識(shí)別的三支決策方法,以及基于多標(biāo)簽/多示例/多模態(tài)的三支決策方法也有望成為探究不確定性人工智能黑箱模型的重要途徑。可以預(yù)見(jiàn),三支決策與行為科學(xué)、三支決策與計(jì)算智能、三支決策與機(jī)器學(xué)習(xí)、三支決策與認(rèn)知計(jì)算等前沿研究領(lǐng)域,將成為未來(lái)三支決策可解釋性研究的重要問(wèn)題和熱點(diǎn)方向。2 三支決策與粒計(jì)算方法
2.1 面向粒計(jì)算的序貫三支決策理論與方法
2.2 面向粒計(jì)算的層次三支決策理論與方法
3 三支決策與三支分類
4 三支決策與認(rèn)知計(jì)算
4.1 基于信息科學(xué)視角下的SMV空間
4.2 基于認(rèn)知科學(xué)視角下的SMV空間
4.3 基于計(jì)算機(jī)科學(xué)視角下的SMV空間
5 結(jié)語(yǔ)