亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)環(huán)境下量子機(jī)器學(xué)習(xí)的研究進(jìn)展及發(fā)展趨勢

        2021-12-02 06:38:46張仕斌閆麗麗
        電子科技大學(xué)學(xué)報 2021年6期
        關(guān)鍵詞:模型研究

        張仕斌,黃 曦,昌 燕,閆麗麗,程 穩(wěn)

        (1. 成都信息工程大學(xué)網(wǎng)絡(luò)空間安全學(xué)院 成都 610225;2. 先進(jìn)密碼技術(shù)與系統(tǒng)安全四川省重點實驗室 成都 610225)

        信息技術(shù)的飛速發(fā)展催生了大數(shù)據(jù)時代的到來[1]。復(fù)雜性是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的根本所在,大數(shù)據(jù)的復(fù)雜性必然會帶來不確定性,大數(shù)據(jù)中的各種不確定性給處理大數(shù)據(jù)算法的準(zhǔn)確性、高效性、安全性、魯棒性帶來了巨大的挑戰(zhàn)[2]。因此,如何解決目前大數(shù)據(jù)存在的復(fù)雜性和不確定性問題已成為目前大數(shù)據(jù)領(lǐng)域研究的熱點之一。

        機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的重要分支,在高性能計算、云計算等領(lǐng)域都已取得了豐碩成果[3],如何將機(jī)器學(xué)習(xí)算法應(yīng)用于大數(shù)據(jù)分析并產(chǎn)生實際價值越來越受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,也已成為“大數(shù)據(jù)+人工智能”交叉融合研究領(lǐng)域的熱點[4]。

        由于量子計算具有超強(qiáng)的并行計算能力、指數(shù)級存儲容量等特征,被認(rèn)為是最有可能突破現(xiàn)有計算能力瓶頸的計算方式[5]。隨著量子計算的發(fā)展,基于量子計算的機(jī)器學(xué)習(xí)正在興起,量子計算會帶來機(jī)器學(xué)習(xí)對數(shù)據(jù)處理能力的提高。如何在“大數(shù)據(jù)+人工智能”時代,充分利用量子計算優(yōu)勢,提高機(jī)器學(xué)習(xí)對大數(shù)據(jù)的處理、分析和挖掘能力已成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點。

        本文在深入分析目前大數(shù)據(jù)環(huán)境下不確定性集合理論及大數(shù)據(jù)計算與分析方法、機(jī)器學(xué)習(xí)算法、量子計算及量子機(jī)器學(xué)習(xí)研究現(xiàn)狀及不足的基礎(chǔ)上,指出將“大數(shù)據(jù)+不確定性集合理論+機(jī)器學(xué)習(xí)算法+量子計算”交叉融合,進(jìn)行大數(shù)據(jù)環(huán)境下量子機(jī)器學(xué)習(xí)算法及其安全性應(yīng)用研究既有理論和現(xiàn)實意義,又有實用價值。

        1 不確定性集合理論及大數(shù)據(jù)計算與分析方法

        1.1 不確定性集合理論

        不確定性知識表達(dá)和處理是人工智能中重要的研究方向,如何有效地從不確定性信息和數(shù)據(jù)中獲取知識也是大數(shù)據(jù)領(lǐng)域的重要研究課題。不確定性主要表現(xiàn)為隨機(jī)性、模糊性和不完備性等,隨機(jī)性和模糊性作為兩種最基本的不確定性,在人類的認(rèn)知過程中起著重要的作用。目前處理不確定性問題的方法主要有模糊集[6]、Vague 集[7]、粗糙集[8]等理論。

        1.1.1 模糊集

        1) 模糊集合理論

        1965 年,文獻(xiàn)[6]創(chuàng)建了模糊集合理論,其定義為:給定一個非空集合X,從X到單位閉區(qū)間[0,1]的 一個映射μA(xi):X→[0,1]稱為X上的一個模糊集,對于每個x∈U, μA(x)叫 做元素x對模糊集A的隸屬度。模糊集合理論的貢獻(xiàn)在于引入了集合中元素對該集合的“隸屬度”,從而將經(jīng)典集合論里的特征函數(shù)取值范圍由二值 {0,1}推廣到區(qū)間[0,1],將經(jīng)典二值邏輯推廣至多值邏輯,使得模糊性可以用[ 0,1]上的區(qū)間值來度量。

        2) 直覺模糊集理論

        1983 年,文獻(xiàn)[9]提出了直覺模糊集理論,其定義為:設(shè)X={x1,x2,···,xn}為所研究問題的論域,xi(i=1,2,···,n)為 論域X中的第i個不確定性元素,X上的直覺模糊集定義為:

        式 中, μA(xi):X→[0,1]; υA(xi):X→[0,1],對 于?xi∈X, 有 0 ≤μA(xi)+υA(xi)≤1, μA(xi)和 υA(xi)稱xi對直覺模糊集A的隸屬度和非隸屬度;在直覺模糊集中, πA(xi)=1-μA(xi)-υA(xi)稱xi對集合A的猶豫度。

        作為Zadeh 模糊集合理論的一個推廣,由于直覺模糊集理論比Zadeh 模糊集合理論所反映的信息更為豐富,近年來不少學(xué)者利用直覺模糊集理論來刻畫不確定性問題具有的模糊性本質(zhì),并在很多領(lǐng)域得到了廣泛應(yīng)用[10-13]。

        1.1.2 Vague 集

        對 于 ?x∈X, πv(x)=1-tv(x)-fv(x) 稱 為x相 對于V集的Vague 度,它主要用于刻畫x相 對于V集的猶豫程度,表示既不支持又不反對x的證據(jù)所導(dǎo)出的既不肯定又不否定的隸屬度上界。將V集通過“投票模型”來解釋,則πv(x)表示棄權(quán)的比例。從對事物的可知程度而言,πv(x)則表示對事物的不可知程度。Vague 集理論的提出,為解決不確定性問題提供了新思路,目前已經(jīng)成功用于模糊控制、決策分析、專家系統(tǒng)和故障診斷等領(lǐng)域[14]。

        1.1.3 粗糙集

        1982 年,文獻(xiàn)[8]提出了粗糙集理論。在粗糙集中,無需主觀為元素指定一個隸屬度,隸屬關(guān)系是根據(jù)已有的分類知識客觀計算出來的。設(shè)X={x1,x2,···,xi}為 所 研 究 的 論 域,xi(i=1,2,···,n)為X中的第i個 元素,集合X的粗糙隸屬函數(shù)定義為:

        作為一種不完整、不確定性知識和數(shù)據(jù)的表達(dá)、學(xué)習(xí)、歸納的理論方法,一方面,粗糙集理論能夠有效地分析和處理不確定、不一致、不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律;另一方面,粗糙集理論能夠以不可分辨關(guān)系劃分所研究論域的知識,形成知識表達(dá)系統(tǒng)[14]。目前,學(xué)者們從不同角度對Pawlak 經(jīng)典粗糙集模型進(jìn)行拓展研究,提出了眾多擴(kuò)展粗糙集模型[15-24]。

        粗糙集和Vague 集理論都是作為模糊集理論的擴(kuò)展,都能處理模糊、不確定性的問題。一方面,Vague 集和模糊集具有一定的互補(bǔ)性,相比模糊集合理論,Vague 集能夠更準(zhǔn)確地描述不確定信息;另一方面,盡管三者分別使用模糊和不可分辨關(guān)系來處理不完全的數(shù)據(jù)集,Zadeh 模糊集和粗糙集能夠?qū)⑵鋬?yōu)點結(jié)合作為研究不完全數(shù)據(jù)集的有效方法,而Vague 集和粗糙集能夠結(jié)合起來用于處理某一類特定的邊界不確定性集合問題。

        1.2 大數(shù)據(jù)計算與分析方法

        隨著大數(shù)據(jù)的爆炸式增長,國內(nèi)外眾多學(xué)者在大數(shù)據(jù)計算以及分析方法方面展開了大量的理論研究和實踐探索[25-64]?;跈C(jī)器學(xué)習(xí)的大數(shù)據(jù)計算方法主要包括并行計算[25-32]、增量計算[33-37]和綠色計算[38-41],基于機(jī)器學(xué)習(xí)的大數(shù)據(jù)分析方法主要有聚類方法[42-46]、關(guān)聯(lián)分析方法[47-53]、分類方法[54-59]和預(yù)測方法[60-64]。

        1.2.1 大數(shù)據(jù)計算方法

        1) 并行計算

        目前串行計算研究主要集中在P 類問題上,即在多項式時間內(nèi)能夠求解的一類問題。然而在大數(shù)據(jù)時代,對大規(guī)模、復(fù)雜性和不確定性的問題的求解變成了不可解問題[25]。為了解決這些問題,學(xué)者們提出了針對大數(shù)據(jù)的并行處理方法[26-32]:谷歌公司提出一種適用于半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模數(shù)據(jù)處理模型(MapReduce)[26-27],文獻(xiàn)[28]提出了利用分布式并行計算實現(xiàn)復(fù)雜任務(wù)的調(diào)度方法;文獻(xiàn)[29]提出了一種能夠?qū)Υ笠?guī)模數(shù)據(jù)集進(jìn)行高效處理的機(jī)器學(xué)習(xí)算法,文獻(xiàn)[30-31]討論了如何在MapReduce 框架下設(shè)計高效的算法;文獻(xiàn)[32]提出了并行提升算法ADABOOST.PL 和LOGITBOO ST.PL 算法。這些并行處理方法雖然能夠處理大一定量級的大數(shù)據(jù),但是如何設(shè)計高效的并行處理大數(shù)據(jù)的計算方法仍然是當(dāng)前研究的熱點。

        2) 增量計算

        增量計算主要用于處理動態(tài)增長的數(shù)據(jù)集或離散數(shù)據(jù),主要有兩類[27]:第一類是通過增量數(shù)據(jù)進(jìn)行計算和推理,從而實現(xiàn)對高維大數(shù)據(jù)的全局處理;第二類是通過增量數(shù)據(jù)更新歷史數(shù)據(jù),并對更新后的數(shù)據(jù)進(jìn)行處理。目前,絕大多數(shù)研究主要集中在第一類。針對低維大數(shù)據(jù)的處理,文獻(xiàn)[33]提出了增量分解方法;針對高維大數(shù)據(jù)的處理,文獻(xiàn)[34]提出了基于投影的增量式高階奇異值分解方法、文獻(xiàn)[35]提出了基于Jacibo 旋轉(zhuǎn)實現(xiàn)增量式高階奇異值分解;針對大數(shù)據(jù)在時間上的延續(xù)性,文獻(xiàn)[36]提出了增量張量流的計算方法;針對增量大數(shù)據(jù)的管理,文獻(xiàn)[37]構(gòu)建了基于Hadoop 平臺的增量大數(shù)據(jù)處理框架。這些增量計算方法是各學(xué)者針對不同的問題提出的不同增量計算方法,但是如何減少增量處理時的運算量和提高增量處理的效率仍是當(dāng)前研究的重要方向。

        3) 綠色計算

        綠色計算是指實現(xiàn)云計算的可持續(xù)發(fā)展,減少云系統(tǒng)對環(huán)境的影響,其目標(biāo)不僅要提高計算資源的使用效率,還要實現(xiàn)對能量消耗的最小化[38]。為了解決大數(shù)據(jù)存在的高能耗問題以及實現(xiàn)可持續(xù)的綠色計算,有學(xué)者提出了節(jié)能的數(shù)據(jù)中心資源調(diào)度框架[39]、Hadoop 集群中計算機(jī)節(jié)點性能和能耗計算方法[40]及解決移動設(shè)備能耗問題的任務(wù)調(diào)度方法[41]。當(dāng)前,在解決大數(shù)據(jù)帶來巨大的能源消耗問題方面,綠色計算仍然是研究熱點。

        1.2.2 大數(shù)據(jù)分析方法

        1) 聚類方法

        聚類是大數(shù)據(jù)挖掘和模式識別常用技術(shù)之一,作為重要的大數(shù)據(jù)分析方法,在分析過程中結(jié)合機(jī)器學(xué)習(xí)、模式識別、概率統(tǒng)計、隨機(jī)過程、信息論等可實現(xiàn)不同功能。隨著大數(shù)據(jù)規(guī)模的不斷增長,傳統(tǒng)聚類方法在大數(shù)據(jù)處理中速度相對較慢,已經(jīng)不能適應(yīng)大數(shù)據(jù)發(fā)展的需要。為了實現(xiàn)傳統(tǒng)聚類算法的并行運算及解決海量數(shù)據(jù)分析的難題,文獻(xiàn)[42]提出了基于MapReduce 的K-means 算法,文獻(xiàn)[43]提出了能夠并行發(fā)現(xiàn)多個聚類的DBCURE-MR 算法,文獻(xiàn)[44]提出了一種新的MapReduce 并行聚類模型,文獻(xiàn)[45]提出了能減少時間和內(nèi)存開銷的、基于MapReduce 的EM 算法,文獻(xiàn)[46]提出了高效的K-means 集群優(yōu)化算法。這些聚類方法針對不同的問題在效率方面有一定優(yōu)勢,但面對日益龐大和復(fù)雜的數(shù)據(jù),如何采用并行方法以及改進(jìn)現(xiàn)有聚類算法,進(jìn)而提出新的聚類算法仍是當(dāng)前重要的研究方向。

        2) 關(guān)聯(lián)分析方法

        關(guān)聯(lián)分析起源于Apriori 算法[47],其目的是查找各種數(shù)據(jù)中項目集合和對象集合之間的關(guān)聯(lián)、相關(guān)性或者因果結(jié)構(gòu)[48],但Apriori 算法時間開銷大,導(dǎo)致在廣度和深度方面適應(yīng)性差。為了解決這一問題,文獻(xiàn)[49]提出了基于MapReduce 的并行Apriori 算法,文獻(xiàn)[50]提出了基于MapReduce 的改進(jìn)Apriori 算法。現(xiàn)階段解決大數(shù)據(jù)關(guān)聯(lián)分析主要集中在對已有算法進(jìn)行并行化和分布式處理,其基本思想是采用分治策略[51]。文獻(xiàn)[52]提出了基于MapReduce 的FP-Growth 改進(jìn)算法,文獻(xiàn)[53]提出了基于Spark 的并行FP-Growth 算法。這些關(guān)聯(lián)分析方法的并行化和分布式處理主要集中在MapReduce 和Spark 平臺,目前在大數(shù)據(jù)高效處理方面還不能完全滿足大數(shù)據(jù)日益增長的需要,因此研究并行化和分布式處理的關(guān)聯(lián)分析方法仍然是當(dāng)前研究的熱點。

        3) 分類方法

        對大數(shù)據(jù)進(jìn)行分類是普遍存在的,其在入侵檢測、醫(yī)療診斷、智能交通等領(lǐng)域有著廣泛應(yīng)用。為了解決非均衡數(shù)據(jù)的分類問題,文獻(xiàn)[54]在MapReduce平臺實現(xiàn)了隨機(jī)森林方法,文獻(xiàn)[55]利用Mahout的并行處理能力構(gòu)建基于決策樹模型的隨機(jī)森林,文獻(xiàn)[56]分析了在大數(shù)據(jù)分類下極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)具有良好的泛化能力,文獻(xiàn)[57]將KNN 分類器和大數(shù)據(jù)平臺MapReduce相結(jié)合實現(xiàn)了對9 000 萬對DNA 的分類;為了解決大規(guī)模圖像數(shù)據(jù)集分類性能低的問題,文獻(xiàn)[58]利用Hadoop 架構(gòu)實現(xiàn)了高效特征提取和分類,文獻(xiàn)[59]提出了面向分布式環(huán)境的高效決策樹分類器算法。這些分類方法大多數(shù)都是為了特定問題而對傳統(tǒng)分類法的改進(jìn),很難高效處理日益增長的大數(shù)據(jù),因此針對大數(shù)據(jù)領(lǐng)域的高效的分類方法仍然是重要的研究方向。

        4) 預(yù)測方法

        通過對歷史數(shù)據(jù)進(jìn)行分析,從而對未來進(jìn)行預(yù)測,是大數(shù)據(jù)分析的核心功能之一。進(jìn)行預(yù)測的關(guān)鍵是找出蘊含在歷史數(shù)據(jù)中的關(guān)聯(lián)關(guān)系。文獻(xiàn)[60]提出了適用于預(yù)測人類視覺注意力的基于卷積網(wǎng)絡(luò)的預(yù)測算法(DeepFix),文獻(xiàn)[61]提出了適用于預(yù)測工業(yè)故障的基于隱馬爾可夫模型的預(yù)測算法,文獻(xiàn)[62]提出了適用于金融領(lǐng)域的基于交易模型的實時價格預(yù)測方法,文獻(xiàn)[63]提出了基于支持向量機(jī)的網(wǎng)絡(luò)入侵預(yù)測方法,文獻(xiàn)[64]提出了適用于有效提升企業(yè)績效的工業(yè)大數(shù)據(jù)預(yù)測模型。隨著大數(shù)據(jù)日益發(fā)展,如何有效提升預(yù)測效率和準(zhǔn)確性仍然是大數(shù)據(jù)領(lǐng)域的研究熱點。

        綜上所述,國內(nèi)外眾多學(xué)者在大數(shù)據(jù)計算方法及大數(shù)據(jù)分析方法方面開展了廣泛研究,也取得了突破性進(jìn)展,但并未涉及如何高效、安全、準(zhǔn)確地處理大數(shù)據(jù)所具有的復(fù)雜性和不確定性問題。如何將“大數(shù)據(jù)+不確定性理論”進(jìn)行交叉融合成為亟待研究的重要課題。

        2 機(jī)器學(xué)習(xí)算法

        2.1 機(jī)器學(xué)習(xí)算法

        機(jī)器學(xué)習(xí)算法是人工智能和統(tǒng)計學(xué)領(lǐng)域的重要分支。在對數(shù)據(jù)進(jìn)行分類方面,常見的算法有K 近鄰(K-nearest neighbors, KNN)[65-66]、支持向量機(jī) (support vector machine, SVM)[67-68]、 決 策 樹(decision tree, DT)[69]、隨機(jī)森林(random forests, RF)算法[70]、樸素貝葉斯(Naive Bayes, NB)[71]等;在回歸方面,常見的算法有線性回歸算法(linear regression)[72]和邏輯回歸(logistic regression)[73]等;在聚類方面,常見的算法有K 均值算法(K-means algorithm)[74]和最大期望算法(expectation maximization algorithm,EM)[75];在數(shù)據(jù)可視化和降維方面,主要有主成分分析算法(principal component analysis, PCA)[76];由于篇幅限制,本小節(jié)簡要介紹K 近鄰、支持向量機(jī)、線性回歸算法、K-means 算法和主成分分析算法。

        1) K 近鄰算法

        K 近鄰算法原理是選取輸入樣本的K個臨近點,K個臨近點出現(xiàn)次數(shù)最多的類別作為該輸入樣本的類別,主要由距離度量、k值的選擇以及分類決策規(guī)則決定[77]。當(dāng)樣本量較大,特征屬性較多時,KNN 算法的分類效率會大大降低。為了解決這一難題,文獻(xiàn)[78]提出了基于哈希和MapReduce的大數(shù)據(jù)集K-近鄰算法,文獻(xiàn)[79]提出了一種基于Apache Spark 框架的大數(shù)據(jù)并行多標(biāo)簽K 最近鄰分類器設(shè)計方法,文獻(xiàn)[80]提出了一種用于處理大數(shù)據(jù)集的KNN 查找方法;文獻(xiàn)[81]提出一種基于聚類去噪和密度裁剪的改進(jìn)KNN 算法,文獻(xiàn)[82]提出了基于MapReduce 的并行KNN 算法,但這些算法只是一些優(yōu)化或改進(jìn),效率方面還有待進(jìn)一步研究。

        2) 支持向量機(jī)算法

        支持向量機(jī)算法原理是尋找一個最優(yōu)分類超平面,使得該超平面能夠?qū)颖緮?shù)據(jù)正確劃分。以二分類數(shù)據(jù)為例,將數(shù)據(jù)分為正類和負(fù)類。假設(shè)訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),···,(xN,yN)},xi∈Rn,yi∈{+1,-1},i=1,2,···,N,xi表 示第i個特征向量,最大分隔超平面記為wTx+b=0,為了使最大分隔超平面對所有數(shù)據(jù)進(jìn)行正確分類,最大分隔超平面需要滿足如下約束:yi(wTx+b)-1 ≥0,i=1,2,···,N。

        構(gòu)造最優(yōu)分類超平面等價于求解約束最優(yōu)化問題:

        式(5)可以采用Langrangian 方法進(jìn)行求解得到最優(yōu)分類決策函數(shù)為:

        對于非線性問題的處理,需要將非線性分類問題轉(zhuǎn)化為線性分類問題。通過非線性變換將數(shù)據(jù)由輸入空間(歐式空間Rn的子集或離散集合)映射到特征空間H(希爾伯特空間),映射函數(shù)為:

        式中,K(xi,x)=φ(xi)φ(x)為核函數(shù)。通過映射函數(shù)φ將輸入空間變換到一個新的特征空間進(jìn)行運算,輸入空間中的內(nèi)積xi·xj計算被轉(zhuǎn)換到特征空間中的內(nèi)積計算 φ (xi)φ(x),即可在新的特征空間里對支持向量機(jī)進(jìn)行訓(xùn)練。

        傳統(tǒng)的支持向量機(jī)算法存在無法高效處理大規(guī)模數(shù)據(jù)集以及無法預(yù)測魯棒和非參數(shù)的置信區(qū)間的擬合模型等難題。為了解決這些問題,文獻(xiàn)[83]提出了用于按順序處理輸入數(shù)據(jù)的在線學(xué)習(xí)算法,文獻(xiàn)[84]提出了一種增量支持向量機(jī)學(xué)習(xí)算法,但這些改進(jìn)算法在效率及安全方面有待進(jìn)一步研究。

        3) 線性回歸

        線性回歸算法通過構(gòu)造線性函數(shù)f(x)=wTx擬合給定的訓(xùn)練數(shù)據(jù) (xi,yi),使得每一個預(yù)測值f(xi)盡 可 能 接 近 真 實 值yi。其 中xi∈RM,yi∈R。w∈RM為擬合參數(shù)。線性回歸的目的是求出最優(yōu)擬合參數(shù)w,使得模型能夠預(yù)測新的數(shù)據(jù)。

        最優(yōu)擬合參數(shù)w經(jīng)常采用最小二乘法獲得:

        式中,y=(y1,y2,···,yN)T;X=(x1,x2,···,xN)為數(shù)據(jù)矩陣。

        線性回歸算法存在無法處理大數(shù)據(jù)所具有的海量樣本和高維度的難題。為了解決這一難題,文獻(xiàn)[85]提出了能夠適用于分布式和并行處理的基于MapReduce 的多元線性回歸模型,文獻(xiàn)[86]提出了能高效的處理大規(guī)模數(shù)據(jù)集的并行版本的多元線性回歸算法,文獻(xiàn)[87]提出了一種能有效提升時間和存儲性能的非線性的回歸預(yù)測模型,但這些改進(jìn)算法在效率和準(zhǔn)確性方面有待進(jìn)一步提升。

        4) K-means 算法

        K-means 算法的主要思想:用戶指定k個初始質(zhì)心作為聚類類別,重復(fù)迭代直至算法收斂。給定點x∈Rd和集合C?Rd,點x到集合C的距離定義為[88]:

        5) 主成分分析算法

        主成分分析算法是將高維數(shù)據(jù)投影到低維空間緩解維數(shù)災(zāi)難,通過尋找投影后低維空間中的r個新變量,以反映數(shù)據(jù)集的主要特征[76]。求給定矩陣X的主成分,其實就是計算協(xié)方差矩陣XXT的前r個特征值對應(yīng)的特征向量構(gòu)成的矩陣P,然后做變換Y=PTX,即達(dá)到降維的目的。

        由于大數(shù)據(jù)具有復(fù)雜、高維、多變等特性,如何采用主成分分析算法降低大數(shù)據(jù)處理難度成為迫切需要解決的難題。為此,文獻(xiàn)[92]提出了一種能夠有效提取非線性特征的大規(guī)模數(shù)據(jù)集求解核主成分的計算方法;文獻(xiàn)[93]提出了一個能夠以指數(shù)速度單調(diào)收斂到主方向精確值、與協(xié)方差無關(guān)的迭代主成分分析算法;文獻(xiàn)[94]提出了能解決大數(shù)據(jù)下大規(guī)模工業(yè)過程的建模和監(jiān)控問題的基于MapReduce 框架分布式并行的主成分分析方法,文獻(xiàn)[95]提出了能夠提供精確解決方案的基于按行掃描數(shù)據(jù)的主成分分析方法,但這些方法在效率方面還有待進(jìn)一步提升。

        2.2 深度學(xué)習(xí)算法

        深度學(xué)習(xí)起源于人工神經(jīng)網(wǎng)絡(luò),通過組合底層特征形成更加抽象的高層表示,以發(fā)現(xiàn)數(shù)據(jù)的分布式表示[96],主要有自動編碼器[97-102]、受限玻爾茲曼機(jī)[103-106]、卷積神經(jīng)網(wǎng)絡(luò)[107-111]、循環(huán)神經(jīng)網(wǎng)絡(luò)[112-113]、生成對抗網(wǎng)絡(luò)[114-118]等。

        1) 自動編碼器

        自動編碼器是將輸入信號映射到低維空間的編碼機(jī)和用隱含特征重構(gòu)初始輸入的解碼機(jī)構(gòu)成。假設(shè)輸入信號為x,編碼層將其線性映射為z,然后給予某種非線性變換,這一過程可以表示為:

        式中,f(·)為某種線性函數(shù),如sigmoid 函數(shù)。解碼層通過相似的操作,將隱含特征a重 構(gòu)信號x?。訓(xùn)練網(wǎng)絡(luò)時,其優(yōu)化目標(biāo)為最小化重構(gòu)信號與輸入信號的均方差:

        盡管自動編碼器通過編碼器和解碼器完成對輸入信號的訓(xùn)練,通過損失函數(shù)最小化求出網(wǎng)絡(luò)的參數(shù),但是不能用于分類。已有眾多研究者提出了不同類型的自動編碼器:文獻(xiàn)[97]提出了深自動編碼器,文獻(xiàn)[98]提出了堆疊自動編碼器,文獻(xiàn)[99]提出了稀疏自動編碼器,文獻(xiàn)[100-101]提出了降噪自動編碼器以及堆疊消噪自動編碼器,文獻(xiàn)[102]提出了稀疏堆疊自動編碼器,但是這些自動編碼器在隱藏層數(shù)量和神經(jīng)元數(shù)量增多的情況下會導(dǎo)致梯度稀釋。

        2) 受限玻爾茲曼機(jī)

        玻爾茲曼機(jī)(Boltzmann machine, BZ)[103]是一種隨機(jī)遞歸網(wǎng)絡(luò),能夠通過學(xué)習(xí)數(shù)據(jù)固有內(nèi)在表示,解決復(fù)雜數(shù)學(xué)問題。受限玻爾茲曼機(jī)(restricted Boltzmann machine, RBZ)是玻爾茲曼機(jī)的擴(kuò)展,容易求得玻爾茲曼機(jī)的概率分布,具有無監(jiān)督學(xué)習(xí)的能力,但是效率較低。受限玻爾茲曼機(jī)是一個雙向圖模型,主要由可視層v∈{0,1}Nv和 隱含層h∈{0,1}Nh組成。其中可視層和隱含層之間的聯(lián)合概率分布定義為:

        式中,Z是歸一化函數(shù);W∈RNv×Nh表示可視層之間的連接權(quán)重;bv∈RNv,bh∈RNh是偏置項。該模型的優(yōu)化目標(biāo)為:

        眾多的研究者在RBM 模型的基礎(chǔ)上提出了眾多擴(kuò)展的受限玻爾茲曼機(jī)模型,如mean-covariance RBM[104]、spike-slab RBM[105]和門限RBM[106]等,這些模型都定義了一個復(fù)雜的能量函數(shù),導(dǎo)致學(xué)習(xí)和推斷的效率下降。

        3) 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)[107]于1998 年提出,主要用于手寫字符圖像的識別,由輸入層、卷積層、下采樣層(池化層)和輸出層組成,其本質(zhì)是使原始輸入經(jīng)過多個層次的數(shù)據(jù)變換或者降維、映射為一個新的特征。輸入層輸入通常為原始圖像X。假設(shè)Hi表示卷積神經(jīng)網(wǎng)絡(luò)第i層的特征(H0=X),卷積層Hi可以表示為:

        式中,Wi表 示第i層 卷積核的權(quán)值向量;f(·)為非線性的激勵函數(shù);bi表 示偏置變量; ?表示卷積核與第i-1層圖像進(jìn)行卷積操作。

        下采樣層主要對特征圖進(jìn)行降維處理以及在一定程度上保持特征的尺度不變特性。假設(shè)Hi表示下采樣層,則Hi=subsampling(Hi-1)。經(jīng)過卷積層和下采樣層的交替處理,卷積神經(jīng)網(wǎng)絡(luò)根據(jù)全連接網(wǎng)絡(luò)對提取的特征進(jìn)行分類,得到基于輸入X的概率分布Y:

        式中,li表 示第i個標(biāo)簽類別。通過最小化網(wǎng)絡(luò)損失函數(shù),即可獲得最優(yōu)的模型。

        由于卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)層次比較復(fù)雜,卷積層、下采樣層都會存在過擬合問題。為了解決這些問題,研究者提出了眾多改進(jìn)方法。文獻(xiàn)[108]提出了能有效提高網(wǎng)絡(luò)泛化性能的“dropout”的技術(shù),文獻(xiàn)[109]提出了一種提升模型泛化能力的“Dropconnect”的方法,文獻(xiàn)[110]提出了作用于卷積層的Maxout 函數(shù),文獻(xiàn)[111]提出了一種隨機(jī)下采樣方法來減輕下采樣層出現(xiàn)的過擬合問題。這些方法針對過擬合問題提出來一些改進(jìn)方法,但是改善的程度和通用性還需要進(jìn)一步驗證和探索。

        4) 循環(huán)神經(jīng)網(wǎng)絡(luò)

        循環(huán)神經(jīng)網(wǎng)絡(luò)主要用于處理序列數(shù)據(jù),其最大的特點就是神經(jīng)元在某時刻的輸出可以在下一時間戳作為輸入直接作用到自身,進(jìn)而達(dá)到對時間序列建模的目的。為了適應(yīng)不同的應(yīng)用需求,一些學(xué)者對循環(huán)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了擴(kuò)展,以解決長時依賴的問題。文獻(xiàn)[112]提出了長短期記憶(long-short time memory, LSTM)模型,文獻(xiàn)[113]提出了雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(bidirectional recurrent neural networks,BRNN),但這些改進(jìn)或優(yōu)化模型在效率及準(zhǔn)確性方面有待進(jìn)一步研究。

        5) 生成對抗網(wǎng)絡(luò)

        生成對抗網(wǎng)絡(luò)(generative adversarial networks,GAN)是文獻(xiàn)[114]受博弈論中的二人零和博弈的啟發(fā)而提出的一種隱式生成模型,利用生成神經(jīng)網(wǎng)絡(luò)和判別神經(jīng)網(wǎng)絡(luò)相互競爭,來學(xué)習(xí)隱含在訓(xùn)練數(shù)據(jù)樣本里的隨機(jī)概率分布。GAN 由生成函數(shù)G和判別函數(shù)D組成,一般由深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)。GAN的目標(biāo)函數(shù)為:

        式中,nd是判別器的小批量樣本數(shù)。

        目前,眾多研究者提出了GAN 變體,如條件GAN[115]、WGAN[116]、最小二乘GAN[117]、BEGAN[118]等,但GAN 在訓(xùn)練過程中,仍然還存在判別器能否被合適地訓(xùn)練、梯度波動大、訓(xùn)練不穩(wěn)定、樣本缺乏多樣性、生成質(zhì)量差等問題。

        2.3 強(qiáng)化學(xué)習(xí)算法

        強(qiáng)化習(xí)目標(biāo)是通過學(xué)習(xí)一個行為策略π :S→A,使得agent 選擇的動作能夠獲得環(huán)境最大的獎賞。定義一個以狀態(tài)的值函數(shù)或狀態(tài)動作對的值函數(shù)表示的目標(biāo)函數(shù)確定Agent 最優(yōu)的動作,函數(shù)的表示形式[119]:

        強(qiáng)化學(xué)習(xí)的主要特征是只能利用不確定的環(huán)境獎賞來發(fā)現(xiàn)最優(yōu)行為策略。根據(jù)動作選擇方式可以將強(qiáng)化學(xué)習(xí)算法分為基于值函數(shù)的強(qiáng)化學(xué)習(xí)算法和基于直接策略搜索的強(qiáng)化學(xué)習(xí)算法兩類。基于值函數(shù)的強(qiáng)化學(xué)習(xí)算法主要通過評估值函數(shù)并根據(jù)函數(shù)值的大小來選擇動作,主要有動態(tài)規(guī)劃、蒙特卡洛、時間差分、值函數(shù)逼近4 種類型[120]:動態(tài)規(guī)劃模型主要用于處理模型已知的情況(在模型未知條件下,可以采用蒙特卡洛方法利用部分隨機(jī)樣本的期望值來獲取整體模型的期望值);蒙特卡洛方法雖然能夠處理模型未知的問題,但是其存在學(xué)習(xí)效率低下的難題;時間差分法采用自舉方法,用后繼狀態(tài)的值函數(shù)估計當(dāng)前值函數(shù),使智能體能夠?qū)崿F(xiàn)單步或者多步的更新,從而提高學(xué)習(xí)效率[121];當(dāng)狀態(tài)空間維數(shù)很大或者存在連續(xù)空間時,可以通過采用值函數(shù)逼近的方法來構(gòu)建強(qiáng)化學(xué)習(xí)策略。直接策略搜索算法主要是將策略參數(shù)化、通過優(yōu)化參數(shù)化使得策略的反饋期望值最大,該類算法主要有經(jīng)典策略梯度、置信閾策略優(yōu)化和確定性策略3 類[121]。目前,強(qiáng)化學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要研究熱點,目前已經(jīng)在工業(yè)制造、機(jī)器人控制、優(yōu)化與調(diào)度、游戲博弈等領(lǐng)域有重要的應(yīng)用價值[122]。

        綜上所述,機(jī)器學(xué)習(xí)是人工智能研究領(lǐng)域的一項重要分支,經(jīng)過多年的發(fā)展,已經(jīng)取得了眾多研究成果。面對即將來臨的“大數(shù)據(jù)+人工智能+量子計算”時代,如何利用機(jī)器學(xué)習(xí)算法對大數(shù)據(jù)所具有的復(fù)雜性和不確定性問題進(jìn)行高效、安全、準(zhǔn)確地處理,越來越受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,也已成為大數(shù)據(jù)和人工智能交叉融合研究領(lǐng)域的熱點問題。

        3 量子計算及量子機(jī)器學(xué)習(xí)

        量子計算是以量子力學(xué)為基礎(chǔ)的全新計算模型,并與信息科學(xué)、計算科學(xué)、光電技術(shù)等學(xué)科交叉融合而形成的一門新興學(xué)科。量子計算充分利用量子獨有特性(如量子疊加性、糾纏等)進(jìn)行運算和數(shù)據(jù)處理,具有超強(qiáng)的并行計算能力、指數(shù)級存儲容量、更好的有效性等特征,被認(rèn)為是最有可能突破現(xiàn)有計算物理平臺和計算能力瓶頸的一種計算方式。從量子力學(xué)原理出發(fā),量子計算目前主要有兩個方向:量子算法和量子衍生算法(量子衍生算法主要是量子信息學(xué)與人工智能等領(lǐng)域研究相結(jié)合而衍生出來的算法,如與機(jī)器學(xué)習(xí)算法結(jié)合衍生出的量子機(jī)器學(xué)習(xí)算法等)。

        3.1 量子計算

        早在1982 年,美國著名物理學(xué)家費曼(R.Feynman)首次提出“量子模擬”的概念,即如果利用經(jīng)典計算機(jī)模擬量子系統(tǒng),由于量子態(tài)的存在,模擬的復(fù)雜性隨粒子數(shù)的增加而呈現(xiàn)指數(shù)級別的增長[123]。隨后,Deutsch 和Jozsa 提出了第一個量子算法(Deutsch-Jozsa 算法)[124];Bernstein 和Vazirani[125]及Simon[126]均提出了以他們名字命名的量子算法;文獻(xiàn)[127-128]提出了求解大數(shù)分解難題的量子并行算法;文獻(xiàn)[129]提出了量子搜索算法;文獻(xiàn)[130]基于量子隨機(jī)漫步原理提出了量子線性系統(tǒng)求解算法HHL 算法;這些算法都表明在解決某些特定問題時量子計算機(jī)相對于經(jīng)典計算機(jī)具有優(yōu)勢;以及能夠突破傳統(tǒng)計算機(jī)的計算極限,解決傳統(tǒng)計算機(jī)無法解決的問題。

        3.1.1 量子信息的表示

        目前,量子信息有兩種表示方式:第一種是量子比特形式;第二種是密度算子形式。從物理角度而言,這兩種表示方式可以用原子的兩能級系統(tǒng)、電子的自旋系統(tǒng)、光子的偏振系統(tǒng)來實現(xiàn)。

        1) 量子比特

        一個任意的單量子比特可以表示為:

        3.1.2 量子邏輯門

        3.1.3 量子態(tài)編碼

        量子態(tài)編碼是通過量子特征映射,將經(jīng)典的數(shù)據(jù)集編碼到量子態(tài)上;量子特征映射將通過量子編碼線路實現(xiàn)。目前,量子態(tài)的編碼方式眾多,適用于處理不同的數(shù)據(jù)類型。

        1) 計算基編碼

        3.1.4 量子測量

        除此之外,文獻(xiàn)[132]指出可以通過控制交換門實現(xiàn)兩個量子量子態(tài)相似度的計算。

        3.2 量子機(jī)器學(xué)習(xí)算法

        量子機(jī)器學(xué)習(xí)旨在利用量子計算的高并行性來達(dá)到進(jìn)一步優(yōu)化傳統(tǒng)機(jī)器學(xué)習(xí)的目的。目前已有的量子機(jī)器學(xué)習(xí)主要分為3 類[133]:1) 將機(jī)器學(xué)習(xí)算法中復(fù)雜度較高的部分替換為對應(yīng)的量子版本進(jìn)行計算,從而降低算法的時間復(fù)雜度和空間復(fù)雜度;2) 尋找量子系統(tǒng)的力學(xué)效應(yīng)、動力學(xué)特性與傳統(tǒng)機(jī)器學(xué)習(xí)處理步驟的相似點,將物理過程應(yīng)用于傳統(tǒng)機(jī)器學(xué)習(xí)問題的求解,進(jìn)而產(chǎn)生出新的機(jī)器學(xué)習(xí)算法;3) 借助傳統(tǒng)機(jī)器學(xué)習(xí)強(qiáng)大的數(shù)據(jù)分析能力,幫助物理學(xué)家更好的研究量子系統(tǒng),更加有效的分析量子效應(yīng),作為物理學(xué)家對量子世界研究的有效輔助。目前,關(guān)于量子機(jī)器學(xué)習(xí)的研究主要集中于第一類研究,第二類研究比較少,該類算法代表性研究為文獻(xiàn)[134]提出的基于量子力學(xué)的聚類算法,其全部過程均可以在經(jīng)典計算機(jī)中實現(xiàn)。第三類研究主要集中于物理領(lǐng)域。該類算法代表性研究為文獻(xiàn)[135]提出的基于壓縮感知的量子斷層分析,將促進(jìn)我們對微觀世界的理解。

        3.2.1 量子最近鄰算法

        2014 年,文獻(xiàn)[136]提出了量子最近鄰算法(quantum nearest neighbor, QNN),該算法通過計算兩個量子態(tài)的內(nèi)積或者歐氏距離來判別該其分類結(jié)果。QNN 算法首先將訓(xùn)練樣本集vj(j=1,2,···,M)和待分類的樣本v0:=u通過概率幅編碼的方式加載到量子態(tài)上,即:

        盡管在文獻(xiàn)[136]也采用歐氏距離來計算量子態(tài)的歐式距離,但是實驗結(jié)果表明采用歐式距離計算的方法比內(nèi)積方法需要更多的迭代次數(shù)。

        3.2.2 量子支持向量機(jī)算法

        量子計算與支持向量機(jī)的結(jié)合最早是利用Grover 搜索算法的二次加速效果處理SVM 模型的優(yōu)化計算問題[137]。2014 年,文獻(xiàn)[138]提出了量子支持向量機(jī)算法(quantum support vector machine,QSVM),該算法利用利用量子計算的高并行性來改進(jìn)傳統(tǒng)支持向量機(jī)算法,進(jìn)而有效提高計算效率,降低計算復(fù)雜度。QSVM 算法首先將每一個數(shù)據(jù)樣本點xi=(xi1,xi2,···xij),j=1,2,···,m的j個特征向量通過概率幅編碼方式編碼到量子態(tài)上,即:

        關(guān)于量子支持向量機(jī)的驗證方面,文獻(xiàn)[139]在核磁平臺上利用4 個量子比特實現(xiàn)了對手寫數(shù)字6 和9 的識別,實現(xiàn)結(jié)果表明了QSVM 算法的可行性;隨后,文獻(xiàn)[140]受量子SVM 的啟發(fā),提出了一種使用快速采樣技術(shù)的SVM 量子啟發(fā)式經(jīng)典算法;文獻(xiàn)[141]提出了新的量子算法,以指數(shù)速度加快雙支持向量機(jī)的訓(xùn)練和預(yù)測過程;文獻(xiàn)[142]研究了量子增強(qiáng)最小二持向量機(jī),并提出了一種簡化的量子算法和稀疏解。

        3.2.3 量子線性回歸

        2012 年,文獻(xiàn)[143]首次提出了一個基于量子HHL 算法的量子線性回歸算法(quantum linear regression, QLR),該算法能夠?qū)崿F(xiàn)對經(jīng)典算法的指數(shù)級加速。量子線性回歸算法的目的是采用量子算法求解最優(yōu)擬合參數(shù)w:

        3.2.4 量子K-means 算法

        在量子K-means 算法的驗證方面,2015 年,文獻(xiàn)[148]在小型光量子計算機(jī)上實現(xiàn)并驗證了量子K-means 算法;隨后,文獻(xiàn)[149]通過采用量子比特來表示空間中的點,提出了高效的基于距離最小化原則的量子K-means 算法,該算法相比經(jīng)典的K-means 算法能夠?qū)崿F(xiàn)指數(shù)級加速;文獻(xiàn)[150]通過引入相位估計算法和最小值查找量子算法,提出了量子K-means 算法,該算法能夠極大降低整體計算復(fù)雜度。

        3.2.5 量子主成分分析

        2014 年,文獻(xiàn)[151]提出了量子主成分分析算法(quantum principal component analysis, QPCA),該算法使用未知密度矩陣的多個副本來構(gòu)造最大特征值(主成分)對應(yīng)的特征向量,可以應(yīng)用于量子態(tài)的判別和分配問題。對于密度矩陣ρ,在特征空間上對其分解可以表示為:

        最后,通過借助相位估計便可分解出密度算子ρ 的特征值和特征向量。

        綜上,采用基于量子計算的信息處理技術(shù)在處理分類、回歸、聚類、降維、評價、推理等任務(wù)時具有更高的效率。經(jīng)過近四十年發(fā)展,量子計算與量子機(jī)器學(xué)習(xí)已取得一些階段性成果。量子計算帶來機(jī)器學(xué)習(xí)對數(shù)據(jù)處理能力的提高,給眾多的研究者帶來了無限的希望和憧憬。如何在已經(jīng)來臨的“大數(shù)據(jù)+人工智能+量子計算”時代,充分利用量子計算的優(yōu)勢(比如高并行性等),提高機(jī)器學(xué)習(xí)的學(xué)習(xí)效率,以及對大數(shù)據(jù)的處理、分析和挖掘能力,已經(jīng)成為量子機(jī)器學(xué)習(xí)的研究熱點。

        4 發(fā)展動態(tài)分析

        隨著“大數(shù)據(jù)+人工智能+量子計算”時代來臨,為了高效、安全、準(zhǔn)確地處理復(fù)雜的大數(shù)據(jù)所具有的諸多不確定性問題,“大數(shù)據(jù)+人工智能”“大數(shù)據(jù)+量子計算”“大數(shù)據(jù)+不確定性集合理論”等的交叉融合已經(jīng)成為不可阻擋的時代潮流。而當(dāng)今大數(shù)據(jù)處理的主要困難在于如何精確地對復(fù)雜大數(shù)據(jù)所具有的不確定性問題進(jìn)行高效、安全、準(zhǔn)確地處理(比如定量、準(zhǔn)確的描述)。因此,研究(能高效、安全、準(zhǔn)確處理復(fù)雜的和具有不確定性的大數(shù)據(jù))量子模糊機(jī)器學(xué)習(xí)算法及其應(yīng)用必將成為“大數(shù)據(jù)+人工智能+量子計算”時代的重點研究方向之一。但是從現(xiàn)有研究成果來看,雖然國內(nèi)外關(guān)于機(jī)器學(xué)習(xí)算法、量子計算和直覺模糊集理論的研究取得了不少研究成果,也有學(xué)者已經(jīng)在關(guān)注量子機(jī)器學(xué)習(xí)及模糊機(jī)器學(xué)習(xí)方面的研究,但是將“直覺模糊集理論+量子計算+機(jī)器學(xué)習(xí)算法”交叉融合,研究量子模糊機(jī)器學(xué)習(xí)算法及應(yīng)用的相關(guān)成果不多,還處于起步階段。目前,已有的研究成果主要涉及經(jīng)典信息量子化(構(gòu)建量子信息模型)[136,138,147]、機(jī)器學(xué)習(xí)[65-122]及量子機(jī)器學(xué)習(xí)算法[123-151]等方面的研究。

        4.1 經(jīng)典信息量子化(構(gòu)建量子信息模型)

        量子機(jī)器學(xué)習(xí)算法的基本原理是將經(jīng)典機(jī)器學(xué)習(xí)算法中的信息映射成量子態(tài),然后對量子態(tài)進(jìn)行酉演化操作,進(jìn)而達(dá)到計算的目的。也就是說,量子機(jī)器學(xué)習(xí)算法的基本流程是:量子機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)必須以某種量子計算機(jī)能識別的格式載入,經(jīng)過量子機(jī)器學(xué)習(xí)算法處理以后形成輸出(此時的輸出結(jié)果是量子格式的),再經(jīng)過測量讀出所需要的最終結(jié)果(經(jīng)典數(shù)據(jù)),如圖1 所示。

        圖1 量子機(jī)器學(xué)習(xí)算法的基本流程[152]

        關(guān)于經(jīng)典信息的量子化(即構(gòu)建量子信息模型)的問題,目前研究成果不多。文獻(xiàn)[138]提出的QSVM(quantum support vector machine)模 型,首次將量子系統(tǒng)密度矩陣應(yīng)用到支持向量機(jī)中核矩陣的表示上,將量子態(tài)的疊加性應(yīng)用到經(jīng)典向量的表示上,提出量子K-means 算法[147-150];文獻(xiàn)[151]提出的QPCA(quantum principal component analysis)模型。但這些算法都是基于現(xiàn)有經(jīng)典機(jī)器學(xué)習(xí)算法基礎(chǔ)上,將復(fù)雜度較高的部分替換為量子計算進(jìn)行計算,從而提高其運算效率,并沒有考慮如何利用量子計算來處理大數(shù)據(jù)所具有的復(fù)雜性、不確定性問題。在即將來臨的“大數(shù)據(jù)+人工智能+量子計算”時代,大數(shù)據(jù)的復(fù)雜性帶來的不確定性問題(如數(shù)據(jù)本身的不確定性、數(shù)據(jù)結(jié)構(gòu)(模型)的不確定性和學(xué)習(xí)的不確定性),這些不確定性主要表現(xiàn)在高維、多變和強(qiáng)隨機(jī)性等特性方面,而這些特性主要表現(xiàn)模糊性,而對這些模糊性進(jìn)行研究的主要困難在于如何對其進(jìn)行定量、準(zhǔn)確地描述。

        因此,如何將“大數(shù)據(jù)+不確定性集合理論+量子計算”交叉融合,對大數(shù)據(jù)所具有的不確定性問題進(jìn)行定量、準(zhǔn)確描述(不確定信息模糊化,模糊信息量子化,建立量子模糊信息模型)將成為不確定環(huán)境下大數(shù)據(jù)領(lǐng)域研究的熱點之一。

        4.2 量子機(jī)器學(xué)習(xí)算法的研究

        目前,針對量子機(jī)器學(xué)習(xí)算法的研究成果不多,已有的量子機(jī)器學(xué)習(xí)算法主要分為3 類:1) 將機(jī)器學(xué)習(xí)中復(fù)雜度較高的部分替換為量子計算進(jìn)行計算,從而提高算法的效率(該類算法沿用經(jīng)典機(jī)器學(xué)習(xí)算法的框架,不同之處在于將復(fù)雜計算轉(zhuǎn)換成量子計算運行在量子計算機(jī)上),主要有QPCA[151]、QSVM[138]、量子最近鄰算法[136]等;2) 尋求量子系統(tǒng)的動力學(xué)特性和力學(xué)效應(yīng)與傳統(tǒng)機(jī)器學(xué)習(xí)算法處理步驟的相似之處,將這些物理過程應(yīng)用于經(jīng)典機(jī)器學(xué)習(xí)算法上,提出新的量子機(jī)器學(xué)習(xí)算法(與第一類算法不同之處在于全部過程均可以在經(jīng)典計算機(jī)上實現(xiàn)),如基于量子力學(xué)的聚類算法[153]、量子退火算法[154]、量子蟻群算法[155]、量子遺傳算法[156]等;3) 借助于經(jīng)典機(jī)器學(xué)習(xí)算法強(qiáng)大的數(shù)據(jù)分析能力,作為物理學(xué)家對量子世界研究的有效輔助,幫助物理學(xué)家更好的研究量子系統(tǒng),更加地效的分析量子效應(yīng)(該類算法的研究將促進(jìn)我們對微觀世界進(jìn)一步的了解,并解釋量子世界的奇特現(xiàn)象),主要研究成果有基于量子斷層分析算法[135]。目前,第二類量子機(jī)器學(xué)習(xí)算法研究較少,第三類主要在物理領(lǐng)域研究較多,研究最多的是第一類。盡管第一類量子機(jī)器學(xué)習(xí)算法在處理效率上表現(xiàn)出一些優(yōu)勢,但并沒有考慮如何利用量子機(jī)器學(xué)習(xí)算法來處理大數(shù)據(jù)所具有的復(fù)雜性、不確定性問題。

        因此,在即將來臨的“大數(shù)據(jù)+人工智能+量子計算”時代,如何利用量子計算能并行高效處理大數(shù)據(jù)所具有的復(fù)雜性問題的優(yōu)勢,將“大數(shù)據(jù)+不確定性集合理論+機(jī)器學(xué)習(xí)+量子計算”進(jìn)行交叉融合研究,提高機(jī)器學(xué)習(xí)對大數(shù)據(jù)的處理、分析和挖掘能力,必將成為量子機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點。

        5 結(jié) 束 語

        本文對大數(shù)據(jù)環(huán)境下不確定性集合理論、大數(shù)據(jù)計算與分析方法、機(jī)器學(xué)習(xí)及安全性、量子計算及量子機(jī)器學(xué)習(xí)算法的現(xiàn)狀展開了分析與研究,分析了在即將到來的“大數(shù)據(jù)+人工智能+量子計算”時代,我們正面臨前所未有的諸多機(jī)遇與挑戰(zhàn):如何將“大數(shù)據(jù)+不確定性集合理論+量子計算”交叉融合,對大數(shù)據(jù)所具有的不確定性問題進(jìn)行定量、準(zhǔn)確地描述;在即將來臨的“大數(shù)據(jù)+人工智能+量子計算”時代,如何利用量子計算能并行高效處理的優(yōu)勢,對大數(shù)據(jù)所具有的復(fù)雜性問題進(jìn)行高效地處理;如何有效提升量子機(jī)器學(xué)習(xí)算法的安全性和魯棒性。這些機(jī)遇和挑戰(zhàn)都將成為“大數(shù)據(jù)+人工智能+量子計算”時代亟待解決的重要問題,也必將成為智慧化時代大數(shù)據(jù)領(lǐng)域的研究熱點。

        猜你喜歡
        模型研究
        一半模型
        FMS與YBT相關(guān)性的實證研究
        2020年國內(nèi)翻譯研究述評
        遼代千人邑研究述論
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        視錯覺在平面設(shè)計中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側(cè)面碰撞假人損傷研究
        3D打印中的模型分割與打包
        777精品久无码人妻蜜桃| 美女福利视频网址导航| 区一区二区三免费观看视频| 国产精品视频永久免费播放| 国产亚洲精品aaaa片小说| 国产a级网站| 国产高清一区二区三区视频| 久久精品国产亚洲av影院毛片| 国产乱码卡二卡三卡老狼| 久久人人97超碰超国产| 超碰性爱| 日本精品一区二区三区在线观看 | 在线免费欧美| 日本一二三区在线视频观看| 第一次处破女18分钟高清| 国产va免费精品高清在线| 亚洲精品一区网站在线观看 | 上海熟女av黑人在线播放| 朝鲜女人大白屁股ass| 96精品在线| 最新国内视频免费自拍一区| 久久综合99re88久久爱| 8ⅹ8x擦拨擦拨成人免费视频| 亚洲一区区| 国产三区三区三区看三区| 在线看片免费人成视频电影| 狠狠色狠狠色综合| 琪琪av一区二区三区| 手机在线看片| 精品久久久久久中文字幕| 国产成人久久精品流白浆| 成人久久久精品乱码一区二区三区| 欧美午夜刺激影院| 国产精品久久无码不卡黑寡妇| 一区二区黄色素人黄色 | 久亚洲一线产区二线产区三线麻豆| 亚洲乱码中文字幕久久孕妇黑人| 国产日产高清欧美一区| 毛片av中文字幕一区二区| 亚洲 另类 小说 国产精品| 丰满人妻被黑人中出849|