摘要:當(dāng)SQL Server數(shù)據(jù)庫處理10萬條以上的數(shù)據(jù)記錄并且并發(fā)用戶超過100人時,其執(zhí)行速度迅速下降。文章以學(xué)校成績錄入與管理系統(tǒng)為例介紹了幾種提高數(shù)據(jù)庫訪問速度的方法。
關(guān)鍵詞:SQL Server;訪問速度;數(shù)據(jù)庫
引言
SQL Server數(shù)據(jù)庫作為微軟在Windows平臺上開發(fā)的數(shù)據(jù)庫,已經(jīng)過多次的功能改進,出現(xiàn)了SQL Server2000版本,雖然SQL Server2000還無法和Oracle、Informix等大型數(shù)據(jù)庫相比,但它在市場上的占有率足以說明了其先進性。很多程序員只注重程序算法的編寫,并不對SQL Server2000數(shù)據(jù)庫處理進行深入的考慮,從而導(dǎo)致數(shù)據(jù)庫數(shù)據(jù)或并發(fā)用戶增多時,系統(tǒng)執(zhí)行速度越來越慢,甚至導(dǎo)致死機。本文根據(jù)我校在開發(fā)成績錄入與管理系統(tǒng)過程中出現(xiàn)的問題,對如何提高SQL Server數(shù)據(jù)庫訪問速度進行研究。
我校成績錄入與管理系統(tǒng)中主要包含的數(shù)據(jù)表為:學(xué)生表,成績表,課程表,專業(yè)表,學(xué)院表。各個學(xué)期成績表等如圖1所示(部分表以及表結(jié)構(gòu)已經(jīng)省略)。
1 合理使用視圖和分區(qū)視圖
視圖可以看成是虛擬表或存儲查詢,可以通過select對視圖中的數(shù)據(jù)進行查詢,但是無法插入、更新、刪除視圖中的數(shù)據(jù)信息。很多程序員在編程過程中只使用數(shù)據(jù)表,而其它的一些操作全部利用程序來完成。過去我校的成績錄入與管理系統(tǒng)中,所有的數(shù)據(jù)操作都利用表來完成,大部分數(shù)據(jù)交換和數(shù)據(jù)調(diào)用都通過函數(shù)來實現(xiàn),因此隨著數(shù)據(jù)量的增大整個系統(tǒng)的執(zhí)行速度越來越慢。系統(tǒng)經(jīng)過改進,把需要利用多個select查詢的數(shù)據(jù)創(chuàng)建成視圖,系統(tǒng)速度有了很大的提高。
以圖2所示的數(shù)據(jù)表為例,在一個頁面中想要完成學(xué)生的成績查詢,并且要知道學(xué)生的姓名和課程名稱,如果通過程序?qū)崿F(xiàn),必須利用三次select語句才能把圖2所示三個表中所需要的字段顯示出來。這種方法大大影響了數(shù)據(jù)庫訪問的速度。若利用視圖,則只需進行一次select查詢就可以得到想要的數(shù)據(jù),其效率遠遠大于程序?qū)崿F(xiàn)的效率。
視圖是不保存任何記錄的,它存儲的是查詢語句,所顯示的記錄來自于數(shù)據(jù)表(可以為多個數(shù)據(jù)表)??梢砸罁?jù)各種查詢需要創(chuàng)建不同的數(shù)據(jù)表,不會因此增加數(shù)據(jù)庫的數(shù)據(jù)量。
再舉一個例子:我校每個學(xué)期都會有20萬條的成績數(shù)據(jù),迄今為止成績錄入與管理系統(tǒng)已經(jīng)運行了5個學(xué)期,各學(xué)期總成績就有100萬條數(shù)據(jù),對于如此大量的數(shù)據(jù),如何來管理,就每個程序員來說都是非常頭疼的問題。
對此可以引入分區(qū)視圖來解決。分區(qū)視圖是指將一個或多個服務(wù)器上的數(shù)據(jù)表數(shù)據(jù)合并,通過定義check約束,將搜索范圍限制到這些表上。分區(qū)視圖的關(guān)鍵是check約束,如果不定義check約束,查詢分析器必須搜索所有的表。具體到我校的成績錄入與管理系統(tǒng)的處理上,我們?yōu)槊總€學(xué)期單獨創(chuàng)建一個表,表名為成績[學(xué)期][學(xué)年]例如:表名為成績20061??梢岳肧QL中設(shè)計視圖功能創(chuàng)建各個學(xué)期表。
在成績表中需要注意,一定要建立學(xué)年、學(xué)期列的check約束。接著定義一個視圖把以前所有學(xué)期的數(shù)據(jù)使用union all連接起來作為單個的結(jié)果集。別出此語句中的搜索條件,將其搜索范圍限制在這個表上。這種方法的使用可以大大提高SQL Server數(shù)據(jù)庫的訪問速度。
2 使用存儲過程提高數(shù)據(jù)處理速度
存儲過程最大的優(yōu)點是將存儲處理翻譯成可執(zhí)行碼保存在系統(tǒng)表內(nèi),當(dāng)作數(shù)據(jù)庫的對象之一。由于存儲過程已事先被翻譯成可執(zhí)行碼,可以直接執(zhí)行,所以其執(zhí)行速度會很快。對一些功能固定的需求,把它寫成存儲過程可提高SQL Server數(shù)據(jù)處理的速度。以我校成績錄入與管理系統(tǒng)為例:我校每學(xué)期成績表中數(shù)據(jù)都在20萬條以上,而且把各個學(xué)期的數(shù)據(jù)連接到一起形成了總成績視圖,數(shù)據(jù)量超過100萬條,要操作這樣龐大的數(shù)據(jù)庫,如果使用方法不當(dāng),就會嚴重地降低執(zhí)行速度。我們考慮將經(jīng)常使用的功能全部寫成存儲過程來提高數(shù)據(jù)庫訪問的速度,如:學(xué)期數(shù)據(jù)導(dǎo)入、成績數(shù)據(jù)備份、總成績查詢等。結(jié)果表明執(zhí)行速度有很大的提高。
對于學(xué)期成績數(shù)據(jù)導(dǎo)入功能說明如下:在每學(xué)期成績庫中有20多萬條數(shù)據(jù),每學(xué)期成績錄入結(jié)束以后都要進行學(xué)期成績數(shù)據(jù)導(dǎo)入。以前使用insert語句進行程序?qū)耄瑘?zhí)行速度很慢,甚至有時慢得無法執(zhí)行,后來通過一個簡單的存儲過程很快地解決了問題,20萬條數(shù)據(jù)導(dǎo)入,執(zhí)行時間在10秒左右。
我校教務(wù)教學(xué)管理中使用學(xué)分制,通過學(xué)分績的高低來反映一個學(xué)生學(xué)習(xí)成績的好壞。計算學(xué)分績的公式是((學(xué)生成績—50)/10)*課程的學(xué)分。在學(xué)分和學(xué)分績插入操作種需要進行判斷:考試成績不及格,則學(xué)分和學(xué)分績都為0;考試成績在60分以上,則計算出相應(yīng)的學(xué)分和學(xué)分績。最后通過“delete from成績表”清空成績表中的成績數(shù)據(jù),以便下學(xué)期正常進行成績錄入工作。合理地建立存儲過程可以有效地提高數(shù)據(jù)庫訪問速度;還可以把一些程序算法封裝到存儲過程中來提高軟件產(chǎn)品的可維護性,即使是條件發(fā)生改變時,也不需要修改客戶端的應(yīng)用程序,只要對數(shù)據(jù)庫端編寫的存儲過程進行修改即可。
3 索引設(shè)計與優(yōu)化
目前很多軟件為方便使用者學(xué)習(xí)也在幫助文檔中添加索引功能,微軟的MSDN是最典型的例子之一。在MSDN中專門有一項索引服務(wù),很多程序員可能熟悉而且經(jīng)常使用這個功能。通過索引查詢信息不但方便而且能大大縮短查找信息的時間。在SQL Server數(shù)據(jù)庫設(shè)計中也采用了這種概念,為了加快數(shù)據(jù)庫訪問的速度,可以對某些常用的查詢條件創(chuàng)建索引。
在我校成績錄入與管理系統(tǒng)開發(fā)的過程中,解決數(shù)據(jù)庫訪問速度是一個關(guān)鍵問題。以往,期末考試結(jié)束以后,很多教師集中進行學(xué)生成績錄入,并行用戶往往都在100人以上,而且對數(shù)據(jù)庫反復(fù)進行插入、更新、刪除數(shù)據(jù)等操作,在這種情況下,程序執(zhí)行速度非常慢,錄入一條成績數(shù)據(jù)往往需要1分多鐘,而且有時還出現(xiàn)一些莫名其妙的錯誤,這使開發(fā)人員十分困惑。經(jīng)過對數(shù)據(jù)庫各個表的仔細核查,并對每個表相應(yīng)的字段建立索引后,問題完全得到解決,經(jīng)過測試在線用戶100人時,錄入一條成績數(shù)據(jù)大約2~3秒,系統(tǒng)處理速度得到很大提高。下面是建立索引的一個具體例子:在學(xué)生表中經(jīng)常用到的字段只有一個:學(xué)號,我們可以對學(xué)號建立索引,建立方法如下create index sid on學(xué)生表(學(xué)號)。
提高數(shù)據(jù)庫訪問速度,不但要使用索引,而且還要優(yōu)化索引;但是不能盲目使用索引,更不能對所有的字段都加上索引,這樣不但不會提高速度,反而會因為過多的索引導(dǎo)致表掃描增多,增大查詢造成的I/O開銷。常用的索引主要分為兩種:聚集索引、非聚集索引。在建立索引過程中要根據(jù)具體情況來選擇不同的索引。聚集索引是表中存儲的數(shù)據(jù)按照索引的順序存儲,檢索效率比普通索引要高,但對數(shù)據(jù)新增、修改、刪除的影響比較大。這就是說聚集索引適合固定表,如學(xué)生表、專業(yè)表、課程表、學(xué)院表,而不適合要不斷新增、修改、刪除成績信息的成績表。非聚集索引和聚集索引相反,不影響表中的數(shù)據(jù)存儲順序,檢索效率比聚集索引低,但是對新增、修改、刪除的影響很小,在成績表中就必須建立非聚集索引了。
4 結(jié)束語
在SQL Server數(shù)據(jù)庫中合理有效地利用以上提到方法固然能夠提高訪問速度,但是在具體的程序、數(shù)據(jù)庫開發(fā)過程中還要不斷的改進這些方法,并且還要注意在實際項目中的靈活應(yīng)用。提高SQL Server數(shù)據(jù)庫訪問速度的方法還有很多。在具體數(shù)據(jù)庫開發(fā)過程中需要程序員們不斷地優(yōu)化數(shù)據(jù)庫的操作,提升其性能,使得SQL Server數(shù)據(jù)庫潛能得到全部發(fā)揮。希望本文能夠起到拋磚引玉的作用,并讓更多的程序員來關(guān)心數(shù)據(jù)庫操作的效率問題。