亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-means的SAMP系統(tǒng)數(shù)據(jù)庫查詢性能優(yōu)化策略①

        2019-07-23 02:07:42王喆峰尹震宇王春曉李明時(shí)廉夢(mèng)佳
        關(guān)鍵詞:聚類儀器數(shù)據(jù)庫

        馬 躍,王喆峰,尹震宇,王春曉,李明時(shí),廉夢(mèng)佳

        1(中國科學(xué)院大學(xué) 計(jì)算機(jī)與控制學(xué)院,北京 100049)

        2(中國科學(xué)院 沈陽計(jì)算技術(shù)研究所,沈陽 110168)

        目前SAMP 系統(tǒng)以劃分的14 個(gè)區(qū)域中心為邏輯層級(jí)結(jié)構(gòu),在物理結(jié)構(gòu)設(shè)計(jì)上采用集中的單系統(tǒng)架構(gòu),這使得系統(tǒng)的架構(gòu)層次變得簡潔.同時(shí)隨著系統(tǒng)間與模塊間的交互變得可控,也減輕了系統(tǒng)交換層的壓力.但由于SAMP 系統(tǒng)已在全院114 個(gè)所運(yùn)行,8000 臺(tái)設(shè)備在線,因此這種架構(gòu)設(shè)計(jì)在應(yīng)對(duì)每天千級(jí)以上的并發(fā)訪問及百萬級(jí)以上數(shù)據(jù)存儲(chǔ)問題時(shí),系統(tǒng)整體性能有待提高.

        1 SAMP 系統(tǒng)性能瓶頸分析

        1.1 SAMP 系統(tǒng)實(shí)體關(guān)系概念模型

        系統(tǒng)中存在著兩個(gè)核心的實(shí)體,分別為用戶和儀器.系統(tǒng)中的其他實(shí)體,如研究所、儀器管理員、委托單、耗材、實(shí)驗(yàn)標(biāo)準(zhǔn)等均是在用戶與儀器的基礎(chǔ)上抽象衍生出來的.

        在實(shí)體之間還存在著多種關(guān)系,這種關(guān)系可能是實(shí)體間的包含關(guān)系,也可能是實(shí)體間的操作關(guān)系.例如研究所和儀器之間具有"屬于"的包含關(guān)系,用戶和儀器之間具有包括"使用"、"預(yù)約"、"查看"或者"收藏"等多種操作關(guān)系.根據(jù)上面的描述,SAMP 系統(tǒng)實(shí)體關(guān)系核心概念模型如圖1所示.

        圖1 SAMP 系統(tǒng)實(shí)體關(guān)系核心概念模型圖

        1.2 SAMP 系統(tǒng)性能潛在瓶頸

        SAMP 系統(tǒng)的核心業(yè)務(wù)之一為用戶對(duì)儀器的預(yù)約.由于用戶對(duì)儀器的預(yù)約操作關(guān)系在SAMP 系統(tǒng)實(shí)體關(guān)系概念模型中是一個(gè)多對(duì)多的關(guān)系,因此在數(shù)據(jù)庫中需要單獨(dú)建表處理該關(guān)系,即創(chuàng)建預(yù)約表.該表中記錄了用戶的全部預(yù)約儀器記錄,這樣導(dǎo)致了以下兩個(gè)問題:

        (1)隨著請(qǐng)求并發(fā)量的提高,由于系統(tǒng)在處理預(yù)約操作的時(shí)需要對(duì)數(shù)據(jù)庫進(jìn)行并發(fā)場景下的讀寫操作,千級(jí)并發(fā)量導(dǎo)致系統(tǒng)整體性能明顯下降.

        (2)當(dāng)預(yù)約表數(shù)據(jù)量達(dá)到百萬級(jí)別時(shí),對(duì)預(yù)約表進(jìn)行查詢操作將消耗大量系統(tǒng)資源與時(shí)間.

        由此可見,用戶對(duì)儀器的預(yù)約操作以及后續(xù)對(duì)該預(yù)約委托單狀態(tài)的維護(hù)將使應(yīng)用服務(wù)器與數(shù)據(jù)庫之間發(fā)生頻繁的讀寫操作,因此用戶對(duì)儀器的預(yù)約操作使得系統(tǒng)整體性能受到影響.

        1.3 待解決的核心問題

        從數(shù)據(jù)庫層面去考慮處理高并發(fā)與海量數(shù)據(jù)存儲(chǔ)問題的基本的解決方案[1],國內(nèi)外現(xiàn)有的研究普遍從如下數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)與數(shù)據(jù)查詢性能兩個(gè)方面出發(fā)提出一系列解決方案.例如文獻(xiàn)[2]中作者提出了一種基于哈希算法的數(shù)據(jù)庫切分(sharding)策略,并試圖從數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)方面解決海量數(shù)據(jù)存儲(chǔ)問題并減少數(shù)據(jù)庫的負(fù)擔(dān),縮短大數(shù)據(jù)量表的查詢時(shí)間,從而達(dá)到提升系統(tǒng)整體性能的目的.文獻(xiàn)[3]中作者提出了通過在MySQL數(shù)據(jù)庫中合理地設(shè)置索引與游標(biāo)的方式達(dá)到提高數(shù)據(jù)表的查詢效率.而在這之前,還需要解決如下問題[4-7]:

        (1)確定切分規(guī)則,即采用何種策略能夠?qū)?shù)據(jù)合理的切分開,使得在后續(xù)從不同維度對(duì)預(yù)約表進(jìn)行查詢時(shí)都能保證查詢性能.預(yù)約表與用戶表和儀器表之間存在主外鍵關(guān)系,因此預(yù)約表中的主鍵為自動(dòng)遞增的整數(shù),并沒有實(shí)際意義.現(xiàn)有研究中通常采用的Hash 取模切分算法將不再適用,必須根據(jù)預(yù)約表的特點(diǎn)制定合理的切分規(guī)則[8-11].

        (2)對(duì)數(shù)據(jù)庫進(jìn)行切分后,處理查詢請(qǐng)求時(shí)必須準(zhǔn)確定位該請(qǐng)求需要查詢的子庫或子表.

        (3)當(dāng)各個(gè)子庫和子表的容量達(dá)到閾值時(shí)采取何種策略進(jìn)行擴(kuò)容.

        根據(jù)目前SAMP 系統(tǒng)中對(duì)區(qū)域中心的定義和劃分以及系統(tǒng)架構(gòu)中的各個(gè)所級(jí)服務(wù)器與中心服務(wù)器之間的關(guān)系,可以看出用戶對(duì)儀器的預(yù)約操作存在一定的聚集性.因此,核心問題被定義為:選取合適的特征變量對(duì)預(yù)約記錄進(jìn)行聚類分析,并根據(jù)聚類結(jié)果選取合理的切分規(guī)則對(duì)數(shù)據(jù)庫進(jìn)行水平切分,使得切分后的數(shù)據(jù)庫能夠提升預(yù)約表的查詢性能,從而提高整體系統(tǒng)的性能[12-15].

        2 基于聚類的數(shù)據(jù)庫分表

        根據(jù)SAMP 系統(tǒng)實(shí)體關(guān)系概念模型可知,對(duì)預(yù)約表進(jìn)行聚類分表時(shí)特征變量的選擇需要結(jié)合用戶表與儀器表共同分析.用戶表、儀器表以及預(yù)約表的核心表結(jié)構(gòu)如表1、表2和表3所示.

        表1 用戶表核心表結(jié)構(gòu)

        表2 儀器表核心表結(jié)構(gòu)

        表3 預(yù)約表核心表結(jié)構(gòu)

        根據(jù)上面對(duì)用戶表、儀器表和預(yù)約表的核心表字段結(jié)構(gòu)的分析,根據(jù)聚類劃分標(biāo)準(zhǔn)的不同,可以分為按照所屬研究所劃分或按照所屬區(qū)域中心劃分.但是無論采用哪種方法進(jìn)行聚類分析,特征變量均包含以下兩個(gè)方面.

        (1)能夠標(biāo)識(shí)用戶,例如用戶所屬研究院ID 和用戶所屬區(qū)域中心ID.

        (2)能夠標(biāo)識(shí)儀器,例如儀器所屬研究院ID 和儀器所屬區(qū)域中心ID.

        同時(shí),在聚類時(shí)不僅需要選取合理的特征變量,而且還需要在數(shù)據(jù)清洗和數(shù)據(jù)預(yù)處理階段保證數(shù)據(jù)的正確性.例如,需要保證用戶具有預(yù)約權(quán)限、儀器能夠被預(yù)約、預(yù)約的時(shí)間段有效等.

        2.1 聚類分析分表

        根據(jù)選取的特征變量可以將預(yù)約表中的每一條數(shù)據(jù)使用一個(gè)二維向量表示.根據(jù)SAMP 系統(tǒng)實(shí)際業(yè)務(wù)架構(gòu)可知,預(yù)約用戶與被預(yù)約的儀器均以區(qū)域中心為基準(zhǔn)呈現(xiàn)一定的聚集性,因此本文采用K-means 聚類算法按照區(qū)域中心對(duì)預(yù)約數(shù)據(jù)進(jìn)行聚類.

        K-means 聚類算法通過迭代計(jì)算各個(gè)點(diǎn)與質(zhì)點(diǎn)之間歐氏距離的平均值,將數(shù)據(jù)集D 中的數(shù)據(jù)劃分到K個(gè)簇C1,…,Ck中,使得對(duì)于1≤i,j≤k,Ci?D且Ci∩Cj=Φ.這樣的劃分結(jié)果使得每一個(gè)簇內(nèi)的對(duì)象相互相似,而簇與簇之間對(duì)象存在差異得到最終分類結(jié)果.K-means 聚類算法是一種基于形心的劃分算法,在得到最終K個(gè)類的同時(shí)也得到K個(gè)形心Ci,數(shù)據(jù)對(duì)象P∈Ci與該簇的代表Ci之差用dist(P,Ci)度量,其中dist(x,y)是兩個(gè)點(diǎn)x和y之間的歐式距離,因此聚類目標(biāo)是使得各類的聚類平方和最小,即最小化公式如下:

        K-means 聚類算法的時(shí)間復(fù)雜度與預(yù)約表中的數(shù)據(jù)總量N,聚類后的簇?cái)?shù)K,以及程序的迭代次數(shù)t具有線性關(guān)系.結(jié)合實(shí)際應(yīng)用場景中的數(shù)據(jù)規(guī)??芍?K和t為常數(shù)級(jí)別且均遠(yuǎn)小于N.因此當(dāng)預(yù)約數(shù)據(jù)總量N逐漸變大時(shí),K-means 聚類算法相對(duì)可伸縮且有效[13].

        根據(jù)聚類結(jié)果將預(yù)約表數(shù)據(jù)依次劃分到各個(gè)分表中.為保證預(yù)約表數(shù)據(jù)讀寫請(qǐng)求能夠準(zhǔn)確定位到各個(gè)分表,需要在劃分的過程中動(dòng)態(tài)構(gòu)建分類映射和分類路由.分類映射由分類結(jié)果表和分表結(jié)果表構(gòu)成.其中分類結(jié)果表的數(shù)據(jù)在聚類完成后填充的,記錄了聚類結(jié)果的類標(biāo)號(hào)、核心點(diǎn)坐標(biāo)以及聚集類的規(guī)模.分表結(jié)果表是在聚類的過程中動(dòng)態(tài)填充的,主要記錄了子表標(biāo)號(hào)、子表表名、分類標(biāo)號(hào)以及子表規(guī)模.而分類結(jié)果表中的類標(biāo)號(hào)與分表結(jié)果表中的類標(biāo)號(hào)具有主外鍵關(guān)系.分類結(jié)果表和分表結(jié)果表的表結(jié)構(gòu)如表4、表5所示.

        由于分表的策略是根據(jù)區(qū)域中心ID 進(jìn)行聚類劃分,因此無論從何種實(shí)體角度對(duì)預(yù)約表進(jìn)行查詢最終都會(huì)將查詢對(duì)象按照其所屬的區(qū)域中心轉(zhuǎn)換成去相應(yīng)分表中查詢的方式.因此分表路由表保存了每一個(gè)區(qū)域中心被哪些簇所包含,分表路由表結(jié)構(gòu)如表6所示.

        表4 分類結(jié)果表表結(jié)構(gòu)

        表5 分表結(jié)果表表結(jié)構(gòu)

        表6 分表路由表表結(jié)構(gòu)

        當(dāng)預(yù)約表中插入新數(shù)據(jù)時(shí),要對(duì)新插入的數(shù)據(jù)利用聚類模型進(jìn)行聚類,步驟如下:

        (1)獲取新數(shù)據(jù)的聚類二維特征點(diǎn)P(x,y).

        (2)計(jì)算P與聚類模型中各個(gè)形心C1,…,Ck的歐式距離d1,…,dk,將P劃分到與各個(gè)形心歐式距離最小的簇Cp中,并更新Cp的形心坐標(biāo).

        (3)更新分類映射和分表路由數(shù)據(jù).如果該條預(yù)約記錄中涉及到的區(qū)域中心ID 與簇Cp的映射在分表路由表中不存在,則將映射關(guān)系添加到分表路由表中.

        (4)更新分類結(jié)果中簇Cp的形心坐標(biāo)(xp,yp)和該簇的聚類規(guī)模Mp如下:

        2.2 分表后的擴(kuò)容策略

        即使將預(yù)約表進(jìn)行分表處理后,每一張子表的數(shù)據(jù)量也會(huì)隨著時(shí)間增加而增加,當(dāng)子表的數(shù)據(jù)量增加到一定的數(shù)量級(jí)后,子表的查詢性能仍然會(huì)下降.因此在分表的同時(shí)也需要為子表制定合理的擴(kuò)容策略來解決由于子表數(shù)據(jù)量的增加而導(dǎo)致的查詢性能下降問題.

        評(píng)判分表擴(kuò)容策略的標(biāo)準(zhǔn)是擴(kuò)容過程中的數(shù)據(jù)遷移量.在分表的過程中,維護(hù)了分類映射和分表路由,并且設(shè)置子表的負(fù)載因子f,若每一張子表的數(shù)據(jù)規(guī)模為M,則子表的閾值S與負(fù)載因子f和數(shù)據(jù)規(guī)模M具有如下關(guān)系:

        假設(shè)當(dāng)前存在預(yù)約子表T,T所屬的類標(biāo)號(hào)為C,當(dāng)T的數(shù)據(jù)容量達(dá)到閾值N后需要對(duì)T進(jìn)行擴(kuò)容處理.系統(tǒng)的擴(kuò)容策略為:新建預(yù)約子表T’,將其添加到子表結(jié)果表中,設(shè)置T’—所屬的類標(biāo)號(hào)為C,重置T’的數(shù)據(jù)容量為零,并將T在分表結(jié)果表中的數(shù)據(jù)添加標(biāo)志位置零,表示不再向T中添加數(shù)據(jù).這樣當(dāng)再有類標(biāo)號(hào)為C的預(yù)約數(shù)據(jù)插入時(shí),會(huì)直接分配到T’中,而T中的原始數(shù)據(jù)仍然保存在T中,從而達(dá)到了原始數(shù)據(jù)零遷移的分表擴(kuò)容目的.

        而當(dāng)出現(xiàn)新的分類標(biāo)號(hào)導(dǎo)致分表需要增加時(shí),首先將分類結(jié)果添加到分類結(jié)果表中,創(chuàng)建與之映射的子表,再將子表記錄添加到分表結(jié)果表,并更新分表路由,最后將涉及到的區(qū)域中心ID 與分類結(jié)果ID 添加到分表路由表中,同樣也能實(shí)現(xiàn)零數(shù)據(jù)遷移擴(kuò)容.

        3 實(shí)驗(yàn)分析

        本實(shí)驗(yàn)使用SAMP 系統(tǒng)開發(fā)環(huán)境中仿真鏡像數(shù)據(jù)庫中存儲(chǔ)的預(yù)約記錄、用戶信息及儀器信息.服務(wù)器系統(tǒng)為CentOS7,數(shù)據(jù)庫使用MySQL 5.5,默認(rèn)存儲(chǔ)引擎InnoDB.

        3.1 實(shí)驗(yàn)數(shù)據(jù)說明與處理

        數(shù)據(jù)分為兩部分使用,部分?jǐn)?shù)據(jù)用于構(gòu)建最小訓(xùn)練樣本數(shù)據(jù)集,對(duì)預(yù)約記錄進(jìn)行聚類分析;剩余數(shù)據(jù)用于測試基于區(qū)域中心的聚類分表策略對(duì)系統(tǒng)查詢性能的提升效果.經(jīng)過實(shí)驗(yàn)測試發(fā)現(xiàn)當(dāng)預(yù)約記錄的數(shù)據(jù)達(dá)到四萬條即可對(duì)預(yù)約數(shù)據(jù)集進(jìn)行有效劃分,因此用于構(gòu)建最小訓(xùn)練樣本數(shù)據(jù)集的數(shù)據(jù)量N的值為:

        實(shí)驗(yàn)對(duì)用戶表、儀器表和預(yù)約表進(jìn)行聚類分析時(shí),重點(diǎn)采集了包括用戶ID、用戶所屬區(qū)域中心ID、用戶權(quán)限標(biāo)志位、儀器ID、儀器所屬區(qū)域中心ID、儀器狀態(tài)標(biāo)志位、預(yù)約單開始時(shí)間、預(yù)約單結(jié)束時(shí)間和預(yù)約記錄ID 在內(nèi)的九維特征屬性共同對(duì)訓(xùn)練樣本數(shù)據(jù)集進(jìn)行處理和分析,并分析得出這些特征屬性具有以下特點(diǎn):

        (1)區(qū)域中心ID 為一個(gè)取值在[10,24]內(nèi)的整數(shù),其中處于[10,23]區(qū)間內(nèi)的整數(shù)表示現(xiàn)有的14 個(gè)區(qū)域中心ID,區(qū)域中心ID 值為24 表示院外單位.

        (2)用戶ID 號(hào)是一個(gè)八位整數(shù),其中前兩位是用戶所屬的區(qū)域中心ID,中間兩位是用戶所屬的研究院ID,后四位是遞增的數(shù)字.

        (3)儀器ID 同樣是一個(gè)八位整數(shù),不同于用戶ID,儀器ID 的前兩位是儀器所屬區(qū)域中心ID 乘以四,后六位表示的含義與用戶ID 號(hào)相同.

        在聚類前需要對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與預(yù)處理確保數(shù)據(jù)的正確性,具體過程如下:

        (1)去除用戶權(quán)限標(biāo)志位為0 的預(yù)約記錄,即去除無預(yù)約權(quán)限用戶的預(yù)約記錄.

        (2)去除儀器狀態(tài)標(biāo)志位為0 的預(yù)約記錄,即去除預(yù)約無效儀器的預(yù)約記錄.

        (3)根據(jù)每一條預(yù)約記錄的開始時(shí)間和結(jié)束時(shí)間,去除預(yù)約時(shí)間少于0.5 小時(shí)的預(yù)約記錄.

        最終每一條預(yù)約記錄由一個(gè)三維向量(預(yù)約記錄ID,用戶ID,儀器ID)唯一表示,并使用其中的后兩維屬性進(jìn)行聚類.

        3.2 實(shí)驗(yàn)方法設(shè)計(jì)

        本實(shí)驗(yàn)對(duì)訓(xùn)練樣本集使用K-means 算法根據(jù)用戶所屬區(qū)域中心ID 和儀器所屬區(qū)域中心ID 進(jìn)行聚類分析并根據(jù)聚類結(jié)果將數(shù)據(jù)庫中的預(yù)約表進(jìn)行水平切分.實(shí)驗(yàn)構(gòu)建的訓(xùn)練樣本集數(shù)據(jù)量為669010.同時(shí)根據(jù)每一條預(yù)約記錄的預(yù)約ID 在聚類的過程中動(dòng)態(tài)構(gòu)建分類結(jié)果表和分表結(jié)果表,并在完成聚類后構(gòu)建分表路由表.其初始聚類結(jié)果如圖2所示.

        圖2 初始聚類結(jié)果圖

        完成聚類模型的構(gòu)建后,配合分類映射與分類路由以及分表擴(kuò)容策略對(duì)全部預(yù)約數(shù)據(jù)表進(jìn)行分表.為了測試分表對(duì)整體數(shù)據(jù)表查詢性能的提升,實(shí)驗(yàn)定義三組查詢測試語句分別從用戶、儀器以及并發(fā)預(yù)約查詢?nèi)矫孢M(jìn)行測試.設(shè)計(jì)實(shí)驗(yàn)測試如下.

        分表前,查詢事件在預(yù)約總表中查詢,獲取查詢結(jié)果,記錄查詢時(shí)間.分表后,查詢事件通過以下幾步獲取查詢結(jié)果,記錄查詢時(shí)間:

        (1)獲取查詢對(duì)象所屬區(qū)域中心ID.

        (2)在分類路由中查詢包含此區(qū)域中心ID 的子表ID.

        (3)在各子表中進(jìn)行查詢.

        在同等實(shí)驗(yàn)條件前提下,通過對(duì)三組查詢測試語句執(zhí)行時(shí)間的比較來分析聚類分表對(duì)查詢性能的提升效果,設(shè)分表前查詢平均執(zhí)行時(shí)間為t1,分表后查詢平均執(zhí)行時(shí)間為t2,則分表查詢提升效率f為:

        本實(shí)驗(yàn)對(duì)查詢時(shí)間及查詢性能的測試均忽悠數(shù)據(jù)庫對(duì)相同查詢結(jié)果的緩存影響,即在MySQL 數(shù)據(jù)庫中對(duì)查詢語句添加“sql_no_cache”關(guān)鍵字來禁用查詢緩存,從而多次實(shí)驗(yàn)取平均執(zhí)行時(shí)間.

        3.3 實(shí)驗(yàn)結(jié)果分析

        實(shí)驗(yàn)從用戶角度進(jìn)行查詢測試,選取查詢事件:查詢用戶ID 為userID 的用戶預(yù)約的所有儀器.分表前實(shí)驗(yàn)設(shè)置在禁用查詢緩存的條件下執(zhí)行該查詢100 次,平均查詢時(shí)間0.364 秒,具體查詢時(shí)間分布如圖3所示.

        圖3 分表前用戶預(yù)約記錄查詢時(shí)間分布圖

        將預(yù)約表進(jìn)行分表處理后,在同等實(shí)驗(yàn)條件下設(shè)置執(zhí)行該查詢100 次,平均查詢時(shí)間0.111 秒,具體查詢時(shí)間分布如圖4所示.

        實(shí)驗(yàn)從儀器角度進(jìn)行查詢測試,選取查詢事件:查詢儀器ID 為apparatusID 的儀器所有被預(yù)約記錄.分表前實(shí)驗(yàn)設(shè)置在禁用查詢緩存的條件下執(zhí)行該查詢100 次,平均查詢時(shí)間0.355 秒,具體查詢時(shí)間分布如圖5所示.

        圖4 分表后用戶預(yù)約記錄查詢時(shí)間分布圖

        圖5 分表前儀器被預(yù)約記錄查詢時(shí)間分布圖

        將預(yù)約表進(jìn)行分表處理后,在同等實(shí)驗(yàn)條件下設(shè)置執(zhí)行該查詢100 次,平均查詢時(shí)間0.075 秒,具體查詢時(shí)間分布如圖6所示.

        圖6 分表后儀器被預(yù)約記錄查詢時(shí)間分布圖

        實(shí)驗(yàn)選取并發(fā)查詢事件為:并發(fā)查詢儀器ID 為apparatusID 的儀器被預(yù)約的記錄.實(shí)驗(yàn)使用Apache JMeter 工具模擬多用戶同時(shí)預(yù)約的并發(fā)場景,設(shè)置所有線程數(shù)在一秒內(nèi)全部啟動(dòng),設(shè)置數(shù)據(jù)庫連接池的最大連接數(shù)為50,最大等待連接時(shí)間為120 秒,并配置數(shù)據(jù)庫驅(qū)動(dòng)與JDBC 連接參數(shù).根據(jù)實(shí)際SAMP 系統(tǒng)運(yùn)行經(jīng)驗(yàn),設(shè)置線程并發(fā)數(shù)為1000,即設(shè)置了在同一時(shí)間段中的最大并發(fā)量為1000.則分表前后對(duì)并發(fā)查詢事件的查詢性能統(tǒng)計(jì)如表7所示.

        表7 分表前后對(duì)并發(fā)查詢事件的查詢性能統(tǒng)計(jì)

        表7中各個(gè)字段的含義如下:

        (1)Average:查詢的平均響應(yīng)時(shí)間.

        (2)Median:響應(yīng)時(shí)間的中間值,即在全部請(qǐng)求中一半請(qǐng)求的響應(yīng)時(shí)間低于該值,一半請(qǐng)求的響應(yīng)時(shí)間高于該值.

        (3)Min:請(qǐng)求的最短響應(yīng)時(shí)間.

        (4)Max:請(qǐng)求的最長響應(yīng)時(shí)間.

        (5)Throughput:吞吐量,即每秒處理的請(qǐng)求數(shù).

        由上述實(shí)驗(yàn)可知,根據(jù)SAMP 系統(tǒng)實(shí)際區(qū)域中心ID 進(jìn)行聚類分析并按照聚類結(jié)果對(duì)預(yù)約表進(jìn)行分表處理后,從預(yù)約用戶角度對(duì)預(yù)約表進(jìn)行查詢操作的查詢性能提升率為69.5%;從被預(yù)約的儀器設(shè)備角度對(duì)預(yù)約表進(jìn)行查詢操作的查詢性能提升率為78.9%;從并發(fā)查詢角度對(duì)預(yù)約表進(jìn)行查詢操作的查詢性能提升率為88.9%.

        4 結(jié)論與展望

        在SAMP 系統(tǒng)開發(fā)環(huán)境仿真數(shù)據(jù)庫中應(yīng)用基于K-means 聚類的數(shù)據(jù)庫分表策略,其中包含的的聚類策略以及分表擴(kuò)容策略均在SAMP 系統(tǒng)的應(yīng)用中具有實(shí)際意義,因此彌補(bǔ)了當(dāng)前主流數(shù)據(jù)庫分表策略(例如Hash 取模分表策略)在切分預(yù)約表時(shí)的不足,對(duì)預(yù)約表數(shù)據(jù)的查詢性能提升了70%,達(dá)到了優(yōu)化數(shù)據(jù)庫查詢性能的目的,解決了SAMP 系統(tǒng)整體系統(tǒng)性能不高的問題.由于現(xiàn)運(yùn)行的SAMP 系統(tǒng)每天所處理的并發(fā)請(qǐng)求以及對(duì)數(shù)據(jù)的讀寫操作較仿真系統(tǒng)而言規(guī)模更加龐大復(fù)雜,因此將該分表策略應(yīng)用于現(xiàn)運(yùn)行的SAMP 系統(tǒng)時(shí)對(duì)系統(tǒng)性能的提升率要通過系統(tǒng)運(yùn)行狀態(tài)做進(jìn)一步分析.

        猜你喜歡
        聚類儀器數(shù)據(jù)庫
        《現(xiàn)代儀器與醫(yī)療》2022年征訂回執(zhí)
        《現(xiàn)代儀器與醫(yī)療》2022年征訂回執(zhí)
        我國古代的天文儀器
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        日本岛国一区二区三区| 成年无码av片完整版| 亚洲日本va中文字幕久久| 中文字幕亚洲无线码a| 国产激情小视频在线观看| 午夜性刺激免费看视频| 久久亚洲精品11p| av无码天一区二区一三区| 日韩色久悠悠婷婷综合| 国产一区二区视频免费在| 午夜精品久久久久久99热 | 国产亚洲精久久久久久无码苍井空| 亚洲成人激情在线影院| 国产熟女露脸91麻豆| 18禁无遮拦无码国产在线播放 | 熟女少妇丰满一区二区| 日本av亚洲中文字幕| 色综合视频一区中文字幕| 国产免费专区| 日本高清在线一区二区| 99视频在线精品免费观看6| 成 人 免费 黄 色 视频| 无码一区东京热| 精品国产亚洲av高清日韩专区| 成人免费无码大片a毛片| 爽爽午夜影视窝窝看片| 国产亚洲日韩AV在线播放不卡| 国产女优一区在线观看| 亚欧色一区w666天堂| 国产高级黄区18勿进一区二区| 国产成年女人特黄特色毛片免| 激情综合五月开心婷婷| 日韩亚洲av无码一区二区三区| 91久久精品无码人妻系列| 久久精品天堂一区二区| 内射夜晚在线观看| 国产一区二区三区av在线无码观看| 亚洲天堂无码AV一二三四区| 国产精品国产av一区二区三区| 美女无遮挡免费视频网站| 亚洲国产另类久久久精品小说 |