亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于云計(jì)算的多重查詢優(yōu)化系統(tǒng)

        2014-06-06 10:46:47徐常亮
        計(jì)算機(jī)工程 2014年9期
        關(guān)鍵詞:特征優(yōu)化系統(tǒng)

        葛 星,沈 耀,徐常亮

        (1.上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系,上海200240;2.阿里云計(jì)算有限公司,杭州310099)

        基于云計(jì)算的多重查詢優(yōu)化系統(tǒng)

        葛 星1,沈 耀1,徐常亮2

        (1.上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系,上海200240;2.阿里云計(jì)算有限公司,杭州310099)

        在常規(guī)海量數(shù)據(jù)分析作業(yè)中,CPU/IO密集型的查詢語句通常復(fù)雜、耗時(shí)并存在大量可復(fù)用的公共部分。如何檢測(cè)、共享和復(fù)用回歸查詢集中語句間的公共部分成為亟需解決的問題。為此,提出特征值索引方法,并構(gòu)建適用于云計(jì)算場(chǎng)景的LSShare多重查詢優(yōu)化系統(tǒng)?;诓樵冋Z句的抽象語法樹將語句劃分為不同的查詢層次,針對(duì)每個(gè)查詢層次抽取特征向量并計(jì)算特征值。建立簡(jiǎn)單高效的特征值索引表以識(shí)別多重查詢語句間的公共部分,并結(jié)合SQL重寫技術(shù)來復(fù)用其中的公共部分。隨著運(yùn)行迭代次數(shù)的增加,LSShare系統(tǒng)將逐步優(yōu)化云計(jì)算場(chǎng)景中的回歸查詢集。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)在運(yùn)行效率上優(yōu)于傳統(tǒng)查詢語句系統(tǒng),可節(jié)約近1/3的執(zhí)行時(shí)間。

        云計(jì)算;多重查詢優(yōu)化;查詢處理;子表達(dá)式識(shí)別;海量數(shù)據(jù)處理;回歸查詢集

        1 概述

        多重查詢優(yōu)化(Multiple Query Optimization, MQO)是數(shù)據(jù)庫領(lǐng)域的典型問題,它描述了如何高效地利用公共任務(wù)來優(yōu)化多個(gè)查詢語句從而產(chǎn)生執(zhí)行結(jié)果。給定一個(gè)查詢語句集,每個(gè)查詢語句都將產(chǎn)生一個(gè)包含若干執(zhí)行計(jì)劃的候選集合。其中,每個(gè)執(zhí)行計(jì)劃又有一個(gè)包含若干任務(wù)的候選集合。MQO問題旨在為每個(gè)查詢語句選擇適當(dāng)?shù)膱?zhí)行計(jì)劃,從而通過高效復(fù)用各執(zhí)行計(jì)劃間的公共任務(wù)(一次執(zhí)行)來最小化整個(gè)語句集合的執(zhí)行時(shí)間。對(duì)MQO問題的研究可以追溯到20世紀(jì)80年代, Sellis[1]首次系統(tǒng)地定義了該問題,同時(shí)也證明了該問題是一個(gè) NP-Hard問題[2]。此后,大量啟發(fā)式[3-5]和基于遺傳算法[6]的近優(yōu)解法被提出。

        MQO問題在關(guān)系數(shù)據(jù)庫領(lǐng)域已經(jīng)得到了廣泛深入的研究[7-9],但近期基于云計(jì)算海量數(shù)據(jù)處理中的MQO問題逐漸成為熱點(diǎn)[10-11]。隨著云計(jì)算的出現(xiàn),網(wǎng)絡(luò)點(diǎn)擊流、網(wǎng)絡(luò)爬蟲、服務(wù)日志等應(yīng)用每天持續(xù)不斷地產(chǎn)生海量數(shù)據(jù)[12]。云計(jì)算應(yīng)用通常維護(hù)一個(gè)數(shù)量巨大且持續(xù)增長(zhǎng)的查詢語句集來處理每天例行性的數(shù)據(jù)作業(yè)。傳統(tǒng)MQO問題的解決方案通過構(gòu)建每個(gè)語句的執(zhí)行計(jì)劃候選集來共享少量語句之間的公共任務(wù),而針對(duì)大量語句將造成冗雜龐大的候選集和極其耗時(shí)的檢測(cè)代價(jià)。同時(shí),這些解法通常要求查詢集以批處理方式進(jìn)行,因而無法統(tǒng)一處理不定期加入到集合中的語句。針對(duì)關(guān)系數(shù)據(jù)庫系統(tǒng),僅在一個(gè)很小的范圍內(nèi)(不超過10條)近似最優(yōu)算法[13]才能產(chǎn)生高效的全局計(jì)劃。文獻(xiàn)[14]針對(duì)類似的多重查詢腳本場(chǎng)景,通過收集本地歷史數(shù)據(jù)進(jìn)行研究?jī)?yōu)化。然而,如何在云計(jì)算中解決回歸查詢集場(chǎng)景下的MQO問題依然十分具有挑戰(zhàn)性。云場(chǎng)景中的查詢語句集包含如下特征:(1)該集合包含大量結(jié)構(gòu)相近、操作相似的語句;(2)該集合是參數(shù)化的;(3)該集合是回歸化的;(4)該集合是動(dòng)態(tài)增長(zhǎng)的。稱包含上述4種特征的集合為回歸查詢集。以Alibaba云計(jì)算系統(tǒng)數(shù)據(jù)存儲(chǔ)與分析平臺(tái)開放數(shù)據(jù)處理服務(wù)(Open Data Processing Service,ODPS)的日?;貧w查詢集為例:該集合包含超過2 000條結(jié)構(gòu)相近的查詢語句;依據(jù)簡(jiǎn)單的字符串規(guī)則定期修改其中的時(shí)間字段或地域字段;通常按時(shí)或天為單位周期性運(yùn)行以支持關(guān)鍵性的應(yīng)用決策;根據(jù)不斷變化的業(yè)務(wù)需求,將不定期有新的查詢語句加入其中。ODPS平臺(tái)每天處理該回歸查詢集以產(chǎn)生相關(guān)部門的日常數(shù)據(jù)報(bào)表。

        現(xiàn)代企業(yè)通常使用回歸查詢集以支持PB級(jí)的海量數(shù)據(jù)處理應(yīng)用。傳統(tǒng)數(shù)據(jù)庫中的MQO問題已經(jīng)有了大量的近優(yōu)解法,但并不適用于云計(jì)算場(chǎng)景。在云計(jì)算場(chǎng)景中,如何定義、檢測(cè)和復(fù)用回歸查詢集中語句間的公共部分成為研究的關(guān)鍵。本文針對(duì)云場(chǎng)景下的多重查詢優(yōu)化問題,詳細(xì)介紹了該問題的基本概念、查詢語句間特征值抽取與特征值計(jì)算、LSShare系統(tǒng)的實(shí)現(xiàn)。

        2 基于云計(jì)算的特征值索引方法

        本文基于云計(jì)算場(chǎng)景的MQO問題,提出了特征值索引方法并構(gòu)建了LSShare多重查詢優(yōu)化系統(tǒng)。首先,基于查詢語句的抽象語法樹(Abstract Syntax Tree,AST)將語句劃分為不同的查詢層次,針對(duì)每個(gè)查詢層次抽取特征向量并計(jì)算特征值。然后,建立簡(jiǎn)單高效的特征值索引表以識(shí)別多重查詢語句間的公共部分。最后,結(jié)合SQL重寫技術(shù)來復(fù)用其中的公共部分。通過迭加運(yùn)行次數(shù),本文系統(tǒng)將隨時(shí)間逐步優(yōu)化云計(jì)算場(chǎng)景中的回歸查詢集。

        2.1 基本概念

        本文以SQL語句Q1為例說明本文方法中的基本定義。每個(gè)SQL語句都可以處理為一棵抽象語法樹AST,該抽象語法樹描述了SQL語句的語法結(jié)構(gòu)。一個(gè)SQL語句依據(jù)其AST樹結(jié)構(gòu),可以劃分為不同的查詢層次。查詢層次描述了一顆抽象語法樹或抽象語法子樹。

        (select*from src)a where id>10 group by id

        如圖1所示,Q1包含2個(gè)查詢層次:Q1外層L1和Q1的子句L2,并且邏輯上前者包含后者。一個(gè)查詢層次描述了其查詢參數(shù)在該查詢對(duì)象上的計(jì)算、操作和抽取的結(jié)果。Q1外層 L1中“from (select*from src)a where id>10 group by id”為其查詢對(duì)象,“id,sum(value)as cnt”則是該查詢層次的查詢參數(shù)。查詢參數(shù)描述了針對(duì)查詢對(duì)象的列抽取和列計(jì)算操作,而查詢對(duì)象則包含了完整的特征值抽取的信息。更詳細(xì)地,“where id>1”和“group by id”組成了該查詢對(duì)象的過濾特征,而“select*from src”則描述了該查詢對(duì)象的流特征。

        圖1 Q1語句結(jié)構(gòu)分析

        過濾特征描述了一個(gè)查詢中所有行相關(guān)的過濾操作。通過定義過濾特征來保證行信息在數(shù)據(jù)流過程中的完整性。過濾特征包含了許多SQL的操作。比如語法“WHERE”描述了行的刪除操作,語法“ORDER BY”描述了行的排序操作,語法“LIMIT”描述了行的排序和刪除操作。這些都作為數(shù)據(jù)流的過濾特征信息進(jìn)行保存。

        流特征則描述了數(shù)據(jù)的分支來源結(jié)構(gòu)。查詢語句可以根據(jù)其數(shù)據(jù)源的流特征分為如下類型: (1)TABREF類型,描述了數(shù)據(jù)來源于物理表; (2)SUBQUERY類型,描述了數(shù)據(jù)來源于一個(gè)子查詢,又可分為一般的 SUBQUERY和 UNION_ SUBQUERY;(3)JOIN類型,描述了數(shù)據(jù)源于兩表或多表JOIN操作。

        2.2 特征向量抽取

        特征向量是一個(gè)查詢層次邏輯結(jié)構(gòu)的抽象定義。它包含了完整的數(shù)據(jù)流向和過濾操作信息,因此,可以作為公共部分的特征標(biāo)識(shí)。

        圖2詳細(xì)描述了特征值索引算法針對(duì)一個(gè)查詢層次的特征值定義。首先,將查詢層次中的表達(dá)式進(jìn)行標(biāo)準(zhǔn)化處理。然后,將查詢層次的AST樹拍平為包含完整信息的SqlData對(duì)象。遞歸遍歷該對(duì)象并根據(jù)需要進(jìn)行必要的信息提取和擴(kuò)展。SqlData對(duì)象包含了一個(gè)查詢對(duì)象所應(yīng)具備的流特征和過濾特征。過濾特征由諸如“ORDER BY”和“WHERE”等條件構(gòu)成。流特征則由不同的數(shù)據(jù)流結(jié)構(gòu)諸如“SUBQUERY”和“UNION_SUBQUERY”構(gòu)成。其中,“SUBQUERY”和“UNION_SUBQUERY”遞歸地使用其子查詢的特征值結(jié)果。如圖2所示,本文將一個(gè)查詢層次的查詢對(duì)象抽取為一個(gè)特征向量。

        圖2 特征向量定義

        在具體實(shí)現(xiàn)上,選擇開源工具 ANTLR來對(duì)SQL語句進(jìn)行詞法分析和語法分析,生成一顆AST樹。針對(duì)每個(gè)查詢層次依據(jù)其查詢對(duì)象信息來遞歸構(gòu)造特征向量。該特征向量使用JSON格式字符串存儲(chǔ)。例如對(duì)于查詢語句Q1,根據(jù)其AST樹可以劃分為2個(gè)QUERY層次,通過算法處理可以抽取出如下2個(gè)特征向量(由JSON串來表示):

        此為內(nèi)層SUBQUERY(即圖1中的L2層次)的特征向量,通過MD5算法計(jì)算得特征值Sig1為: e960c2b5a542fca4feb4c0e549caf6ff。

        此為外層QUERY(即圖1中的L1層次)的特征向量,通過特征值計(jì)算其值Sig2為e960c2b5a 542fca4feb4c0e549caf6ff。需要注意的是,特征向量Vector_2中使用了 Vector_1的特征值 Sig1作為sourceValue。

        2.3 特征值計(jì)算

        特征值是特征向量計(jì)算后的固定長(zhǎng)度的數(shù)值結(jié)果。最終以特征值為標(biāo)準(zhǔn)來比較和識(shí)別單個(gè)SQL語句內(nèi)不同查詢層次間的公共部分,以及不同SQL語句間的不同查詢層次間的公共部分。

        在實(shí)現(xiàn)上使用實(shí)際應(yīng)用廣泛的MD5算法將JSON格式定義的特征向量計(jì)算為特征值。然后,將這些特征值用 Hibernate持久化為特征值索引表。對(duì)于新加入的語句,計(jì)算其特征值并查找索引表,如果命中,則說明兩者包含公共部分,結(jié)合SQL語句重寫技術(shù)來復(fù)用兩者之間的公共部分。

        3 系統(tǒng)實(shí)現(xiàn)

        針對(duì)云計(jì)算中的回歸查詢集場(chǎng)景實(shí)現(xiàn)了一個(gè)高效的多重查詢優(yōu)化系統(tǒng),如圖3所示,該系統(tǒng)可以方便地集成和擴(kuò)展到其他分布式系統(tǒng)中。

        圖3 多重查詢優(yōu)化系統(tǒng)架構(gòu)

        使用標(biāo)準(zhǔn)查詢語句集模擬了真實(shí)生產(chǎn)集群上的日常作業(yè)行為。該語句集包含大量結(jié)構(gòu)復(fù)雜的查詢語句,這些語句每天都會(huì)被自動(dòng)化替換其中的日期或地點(diǎn)參數(shù)。每天不定期會(huì)有一些新的查詢語句加入到該固有查詢集中。本文系統(tǒng)使用特征值索引方法來初始化該查詢語句集并依此生成特征值索引表。運(yùn)行時(shí)它處理不定期新加入的查詢語句并計(jì)算該單個(gè)語句的特征值。如果該語句的特征值命中特征值索引表中某一項(xiàng),即說明新加入的查詢語句與原有的查詢語句集有公共部分可以復(fù)用。基于該特征值的重復(fù)頻度與復(fù)用深度的權(quán)衡,為用戶提供可選的SQL重寫語句。將改寫后的語句加入該日?;貧w查詢集并同時(shí)優(yōu)化該集合中的剩余部分。

        4 實(shí)驗(yàn)結(jié)果與分析

        本文原型系統(tǒng)LSShare基于Alibaba云平臺(tái)的離線數(shù)據(jù)處理服務(wù)ODPS實(shí)現(xiàn)。使用MapReduce框架針對(duì)每個(gè)查詢語句的不同查詢層次進(jìn)行特征向量抽取和特征值計(jì)算,并據(jù)此建立特征值索引表。實(shí)驗(yàn)集群包含 114個(gè)服務(wù)器節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)配置2.40 GHz CPU和24 GB內(nèi)存。特征索引表方法的具體算法基于Java語言實(shí)現(xiàn)。

        使用基于TPC-H測(cè)試標(biāo)準(zhǔn)2種典型的查詢語句集:阿里金融離線數(shù)據(jù)測(cè)試機(jī)和淘寶離線數(shù)據(jù)測(cè)試集。每個(gè)查詢集包含近10 000條復(fù)雜耗時(shí)的類SQL語句。為縱向?qū)Ρ炔煌?guī)模的查詢集之間的效率差異,實(shí)驗(yàn)從規(guī)模較大的語句集中隨機(jī)抽取小規(guī)模數(shù)量的查詢語句并構(gòu)建成一個(gè)新的語句集合。

        4.1 覆蓋率分析

        覆蓋率分析目的在于分析回歸查詢集中公共部分所占的百分比。圖4橫向比較顯示,相同類型的回歸查詢集有大致相同的公共部分覆蓋率??v向比較顯示,不同規(guī)模的查詢集均有近30%的公共部分可以復(fù)用,并且隨著語句數(shù)量的增長(zhǎng),本文系統(tǒng)在一定限度內(nèi)能檢測(cè)到更高的公共部分覆蓋率。

        圖4 覆蓋率分析

        以圖4中包含2 000條SQL語句的查詢集為例,經(jīng)過特征值索引方法,這些語句被拆分為7 515個(gè)查詢層次,每個(gè)查詢層次抽取為一個(gè)特征向量并依此計(jì)算為特征值。即一個(gè)查詢語句平均包含4個(gè)查詢層次,這說明這些查詢語句通常比較復(fù)雜和耗時(shí)。實(shí)驗(yàn)數(shù)據(jù)顯示,該集合在索引表中有2 631個(gè)重復(fù)特征值,即說明公共部分的覆蓋率在31.24%。其中,單個(gè)索引重復(fù)的最大次數(shù)為72次。結(jié)果表明,該特征值索引方法針對(duì)回歸查詢集的公共部分檢測(cè)具有極高的效率。

        4.2 可擴(kuò)展性分析

        可擴(kuò)展性分析的目的在于分析本文系統(tǒng)在查詢語句集不斷增長(zhǎng)的情況下的性能。通過特征值索引表的初始化時(shí)間來度量本文系統(tǒng)的可擴(kuò)展性。本文系統(tǒng)利用MapReduce框架并行處理上萬條查詢語句,重復(fù)進(jìn)行實(shí)驗(yàn)并記錄不同規(guī)模的語句集耗費(fèi)的平均時(shí)間。

        圖5表明不同規(guī)模的查詢語句集構(gòu)建特征值索引表的時(shí)間緩慢增長(zhǎng)。其主要原因是隨著語句集規(guī)模的增加,查詢語句長(zhǎng)尾的出現(xiàn)概率不斷增加,從而導(dǎo)致執(zhí)行時(shí)間緩慢增長(zhǎng)。剔除個(gè)別查詢語句的長(zhǎng)尾現(xiàn)象,結(jié)果表明本文系統(tǒng)隨查詢語句集規(guī)模的增長(zhǎng)有著良好的可擴(kuò)展性。

        圖5 可擴(kuò)展性分析

        4.3 優(yōu)化性能分析

        優(yōu)化性能分析的目的在于度量本文系統(tǒng)在時(shí)間維度上的優(yōu)化效益。此外,將本文系統(tǒng)與傳統(tǒng)的Hive系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn),并著重探討了不同語句類型的加速比。

        為模擬回歸查詢集場(chǎng)景,實(shí)驗(yàn)中使用一個(gè)包含5 000條語句的查詢語句集,每次都新加入近1%的查詢語句。實(shí)驗(yàn)重復(fù)進(jìn)行100次,對(duì)本文系統(tǒng)和Hive系統(tǒng)的執(zhí)行時(shí)間進(jìn)行比較,如圖6所示。

        圖6 LSShare與Hadoop/Hive系統(tǒng)優(yōu)化性能對(duì)比

        從圖6中可以得到以下結(jié)論:(1)隨著運(yùn)行迭代次數(shù)的增加,本文系統(tǒng)針對(duì)固定查詢語句集的查詢速度將逐漸加快。而Hive系統(tǒng)的運(yùn)行時(shí)間則隨迭代次數(shù)的增加基本恒定。這意味著基于反饋機(jī)制的系統(tǒng)優(yōu)化效益將隨著迭代次數(shù)的增加逐漸均攤到整個(gè)查詢集上。(2)當(dāng)?shù)螖?shù)較少時(shí),本文系統(tǒng)的執(zhí)行時(shí)間較高。反之,當(dāng)?shù)螖?shù)較多時(shí)本文系統(tǒng)的執(zhí)行效率將遠(yuǎn)超Hive。實(shí)驗(yàn)結(jié)果表明,在均攤分析意義上LSShare性能優(yōu)于Hive。

        圖7針對(duì)不同類型的查詢語句進(jìn)行對(duì)比,發(fā)現(xiàn)查詢語句中最有優(yōu)化價(jià)值的是包含“UNION”或“JOIN”結(jié)構(gòu)的復(fù)雜子查詢。本文系統(tǒng)通過復(fù)用其中的公共部分能夠節(jié)約大概20% ~50%的執(zhí)行時(shí)間。

        圖7 不同類型的查詢語句優(yōu)化性能對(duì)比

        5 結(jié)束語

        本文提出了特征值索引方法來解決回歸查詢集中的 MQO問題。結(jié)合 SQL語句重寫技術(shù),在Alibaba的云計(jì)算平臺(tái)上實(shí)現(xiàn)了該優(yōu)化系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,該優(yōu)化系統(tǒng)簡(jiǎn)單高效。今后將通過改進(jìn)特征值定義以識(shí)別更多的公共部分,使得該優(yōu)化系統(tǒng)更智能化和自動(dòng)化,并將其擴(kuò)展應(yīng)用到其他分布式系統(tǒng)中。

        [1] Sellis T K.Multiple-query Optimization[J].ACM Trans.on Database System,1988,13(1):23-52.

        [2] Sellis T K,Ghosh S.On the Multiple-query Optimization Problem[J].IEEE Trans.on Knowledge and Data Engineering,1990,2(2):262-266.

        [3] Shim K,Sellis T K,Nau D.Improvements on a Heuristic Algorithm for Multiple-query Optimization[J].Data and Knowledge Engineering,1994,12(2):197-222.

        [4] Roy P,Seshadri S,Sudarshan S,et al.Efficient and Extensible Algorithms for Multi Query Optimization [J].ACM SIGMOD Record,2000,29(2):249-260.

        [5] Cosar A,Lim E P,Srivastava J.Multiple Query Optimization with Depth-firstBranch-and-bound and Dynamic Query Ordering[C]//Proceedings of the 2nd International Conference on Information and Knowledge Management.New York,USA:ACM Press,1993:433-438.

        [6] Bayir M A,Toroslu I H,Cosar A.Genetic Algorithm for the Multiple-query Optimization Problem[J].IEEE Trans.on Systems,Man,and Cybernetics,2007,37(1): 147-153.

        [7] Nykiel T,Potamias M,MishraC,etal.MRShare: Sharing Across Multiple Queries in MapReduce[J]. Proceedings of the VLDB Endowment,2010,3(1/2): 494-505.

        [8] Elghandour I,Aboulnaga A.Restore:Reusing Results of MapReduce Jobs[J].Proceedings of the VLDB Endowment,2012,5(6):586-597.

        [9] Herodotou H,Lim H,Luo G,et al.Starfish:A Selftuning System for Big Data Analytics[C]//Proceedings of the 5th Biennial Conference on Innovative Data Systems Research.Asilomar,USA:[s.n.],2011: 261-272.

        [10] Bruno N,Agarwal S,Kandula S,et al.Recurring Job Optimization in Scope[C]//Proceedings of 2012 ACM SIGMOD International Conference on Management of Data.New York,USA:ACM Press,2012:805-806.

        [11] Lee R,Luo T,Huai Y,et al.YSmart:Yet Another SQL-to-MapReduce Translator[C]//Proceedings of the 31st InternationalConference on Distributed Computing Systems.Washington D.C.,USA:IEEE Computer Society,2011:25-36.

        [12] Dean J,Ghemawat S.MapReduce:Simplified Data Processing on Large Clusters[J].Communications of the ACM,2008,51(1):107-113.

        [13] Kalnis P,Papadias D.Multi-query Optimization for Online Analytical Processing[J].Information Systems, 2003,28(5):457-473.

        [14] Bruno N,Agarwal S,Kandula S,et al.Recurring Job Optimization in Scope[C]//Proceedings of 2012 ACM SIGMOD International Conference on Management of Data.New York,USA:ACM Press,2012:805-806.

        編輯 陸燕菲

        Multiple Query Optimization System Based on Cloud Computing

        GE Xing1,SHEN Yao1,XU Chang-liang2
        (1.Department of Computer Science and Engineering,Shanghai Jiaotong University,Shanghai 200240,China;
        2.Alibaba Cloud Computing Co.,Ltd.,Hangzhou 310099,China)

        In routine massive data analysis queries,the CPU/IO intensive analysis queries are complex and timeconsuming,but share common components.It is challenging to detect,share and reuse the common components among thousands of SQL-like queries.Aiming at these problems,this paper proposes the signature-index approach and implements the LSShare system to solve the Multiple Query Optimization(MQO)problem in the cloud with a recurring query set.It generates signatures for each query based on Abstract Syntax Tree(AST).Then it makes a simple but efficient index for further identifying and sharing common components of multiple queries combined with SQL-rewriting techniques.LSShare system gradually optimizes regression query set in the cloud computing scene as the superposition of run number.Experimental results demonstrate,the system is superior to the traditional query optimization in share equally,and it can save nearly a third of the execution time.

        cloud computing;Multiple Query Optimization(MQO);query processing;subexpression identification; massive data processing;recurring query set

        1000-3428(2014)09-0046-05

        A

        TP311.13

        10.3969/j.issn.1000-3428.2014.09.010

        國家“863”計(jì)劃基金資助重大項(xiàng)目“以支撐電子商務(wù)為主的網(wǎng)絡(luò)操作系統(tǒng)研制”(2011AA01A202)。

        葛 星(1987-),男,碩士研究生,主研方向:云計(jì)算,分布式計(jì)算;沈 耀(通訊作者),副教授;徐常亮,博士。

        2013-09-25

        2013-11-11E-mail:gexing111@126.com

        猜你喜歡
        特征優(yōu)化系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
        民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
        關(guān)于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        WJ-700無人機(jī)系統(tǒng)
        ZC系列無人機(jī)遙感系統(tǒng)
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        在线观看国产一区二区av| 欧美色欧美亚洲另类二区不卡| 男女好痛好深好爽视频一区| 白色白色在线视频播放平台| av免费播放网站在线| 日本黄网站三级三级三级| 亚洲美腿丝袜综合一区| 国产香蕉一区二区三区| 亚洲av毛片在线免费看| 亚洲图片日本视频免费| 亚洲欧美日韩高清专区一区| 精品亚洲不卡一区二区| 成人麻豆视频免费观看| 999国内精品永久免费观看| 97se在线观看| 日韩国产有码精品一区二在线| 日韩av一区二区三区激情在线| 国产精品久久人妻无码| 亚洲人成电影在线无码| 一本大道久久东京热无码av| 中文字幕人妻中文| 少妇呻吟一区二区三区| 免费无码专区毛片高潮喷水| 欧洲极品少妇| 亚欧免费视频一区二区三区| 亚洲啪啪色婷婷一区二区| 中国美女a级毛片| 人人妻人人玩人人澡人人爽 | 欧美又粗又长又爽做受| 中国精学生妹品射精久久| 蜜桃av观看亚洲一区二区| 视频一区二区三区黄色| 免费a级作爱片免费观看美国| 澳门精品无码一区二区三区| 久久亚洲春色中文字幕久久久综合 | 无码天堂在线视频| 熟女一区二区中文字幕| 精品欧洲av无码一区二区| 亚洲无码a∨在线视频| 97中文乱码字幕在线| 少妇人妻中文字幕hd|