豆利
摘要:隨著網(wǎng)絡(luò)數(shù)據(jù)量的增大,用戶對(duì)數(shù)據(jù)庫查詢的要求也越來越高,普通的查詢有時(shí)很難滿足要求,迫切需要對(duì)于MySQL語句實(shí)現(xiàn)優(yōu)化,以提高查詢效率。其中最常用的是創(chuàng)建索引。本文介紹了常用的SQL語句優(yōu)化查詢方式。
關(guān)鍵詞:查詢;優(yōu)化;索引;SQL語句
中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)15-0035-02
1查詢速度慢的原因
數(shù)據(jù)庫查詢的首先是客戶端發(fā)出查詢請(qǐng)求,服務(wù)端接受請(qǐng)求,服務(wù)端處理后相關(guān)數(shù)據(jù),再把結(jié)果返回給客戶端,從而完成查詢的過程。在整個(gè)查詢過程中,涉及很多相關(guān)的參數(shù),比如網(wǎng)絡(luò)速度、內(nèi)存容量、I/O吞吐率等等。其中查詢的數(shù)據(jù)量比較大,查詢語句沒有設(shè)計(jì)好,查詢語句沒有優(yōu)化好,返回不必要的行和列,產(chǎn)生死鎖等,也常常是查詢慢的原因。
2優(yōu)化查詢速度
對(duì)于MySQL查詢優(yōu)化最主要的是需要建立高性能的索引。索引對(duì)于查詢達(dá)到良好的性能起到關(guān)鍵的作用,尤其是當(dāng)數(shù)據(jù)表中的數(shù)據(jù)量越來越大,越來越多的時(shí)候,索引的作用就尤其重要,當(dāng)然在數(shù)據(jù)量比較小的時(shí)候,不恰當(dāng)?shù)乃饕龑?duì)于查詢性能還不明顯,當(dāng)數(shù)據(jù)量增大的時(shí)候,性能就會(huì)急劇下降,效果較為顯著。所以,就利用了索引,數(shù)據(jù)庫的索引有助于加快查詢速度。
為了對(duì)數(shù)據(jù)庫索引速度進(jìn)行驗(yàn)證,需要數(shù)據(jù)庫及相應(yīng)的數(shù)據(jù)表。
首先創(chuàng)建數(shù)據(jù)庫educ,在educ數(shù)據(jù)庫中創(chuàng)建表student,其創(chuàng)建代碼如下:
CREATE DATABASE educ;--創(chuàng)建數(shù)據(jù)庫
CREATE TABLE student(sid int, sname char(8),gender char(8),email varchar(56),depid char(10));--創(chuàng)建數(shù)據(jù)表student
CREATE TABLE department(depid char(10),depName varchar(40),num int);--創(chuàng)建數(shù)據(jù)表department
創(chuàng)建存儲(chǔ)過程,實(shí)現(xiàn)批量數(shù)據(jù)的插入,代碼如下:
DELIMITER $$? ? ? ? ?--聲明存儲(chǔ)過程的結(jié)束符為$$
CREATE PROCEDURE proc1()? ? --創(chuàng)建存儲(chǔ)過程
BEGIN
DECLARE i INT DEFAULT 1;
WHILE(i<=100000) DO
INSERT INTO student VALUES(i,Sophie,female,CONCAT(‘Sophie,i,@hffe.cn));
SET i=i+1;
END WHILE;
END$$
DELIMITER;? ?---重新聲明MySQL的結(jié)束符為;
查看存儲(chǔ)過程:SHOW CREATE PROCEDURE proc1;
調(diào)用存儲(chǔ)過程:CALL proc1;可以實(shí)現(xiàn)批量插入數(shù)據(jù)。
(1)使用聚合函數(shù)查詢出相應(yīng)的結(jié)果,添加索引后驗(yàn)證執(zhí)行效率
未創(chuàng)建索引時(shí):SELECT MAX(sid) FROM student;
結(jié)果耗時(shí)為:1 row in set <0.02 sec>。
創(chuàng)建索引后 CREATE INDEX index_sid cON? student(sid)后,先使用命令SET QUERY CACHE清除緩存信息,重新執(zhí)行SQL命令,結(jié)果耗時(shí)為:1 row in set <0.00 sec>。以下執(zhí)行語句之前,首先用SET QUERY CACHE清除緩存信息,再重新執(zhí)行命令。
(2)在分組(GROUP BY)、排序(ORDER BY)之后的字段進(jìn)行添加索引。
未創(chuàng)建索引時(shí):SELECT sid,COUNT(*) FROM student? GROUP BY sid;
結(jié)果耗時(shí):5 row in set <0.03 sec>。
創(chuàng)建索引后:CREATE INDEX index_sid ON student(sid);重新執(zhí)行SQL命令,結(jié)果耗時(shí):
5 row in set <0.02 sec>。
(3)多表連接優(yōu)化
對(duì)于多表連接查詢,不管幾張表實(shí)現(xiàn)查詢,都需要在連接字段上建立索引,以加快查詢速度。
未創(chuàng)建索引時(shí):SELECT sid,sname,gender,depname from student inner join department on stuent.depid=department.depid;
結(jié)果耗時(shí):51 row in set <0.02 sec>。
創(chuàng)建索引后: 51 row in set <0.00 sec>。
對(duì)于子查詢中的IN子查詢會(huì)掃描整張表,需使用EXISTS子查詢代替使用,當(dāng)然不是所有的索引都對(duì)查詢起顯著效果,MySQL是根據(jù)數(shù)據(jù)表中的數(shù)據(jù)進(jìn)行優(yōu)化的,當(dāng)索引中有大量重復(fù)數(shù)據(jù)時(shí),索引就失去了其顯著的作用,假設(shè)在gender字段中值為male和female各占一半的時(shí)候,即使在gender上建立索引也不起作用。當(dāng)然索引并不是越多越好,索引在加速查詢的同時(shí),也有其弊端。索引是以文件的形式存儲(chǔ)的,索引文件需要占有磁盤空間。
若數(shù)據(jù)表中的索引很多的時(shí)候,查詢會(huì)很浪費(fèi)時(shí)間,索引會(huì)降低增加、刪除、修改等相關(guān)數(shù)據(jù)操作,數(shù)據(jù)表中索引越多,索引更新的時(shí)間會(huì)越長。應(yīng)盡量避免更新聚集索引數(shù)據(jù)列,因?yàn)榫奂饕龜?shù)據(jù)列的順序和表的物理記錄保持一致,一旦聚集索引的數(shù)據(jù)進(jìn)行更新,將導(dǎo)致整張表的列值的改變,會(huì)增加很大的系統(tǒng)開銷。復(fù)合索引在使用的時(shí)候,一般以索引的第一個(gè)列值作為條件查詢,如果值相等,接著選擇第二個(gè)字段列值進(jìn)行排序,以此類推,否則建立的復(fù)合索引將不起作用。
如果索引定義的列值過長,這樣會(huì)讓索引變得很慢。通常以字段列值開始的部分的字符作為索引,可以大大節(jié)約索引空間,提高索引效率。其中前綴索引指的是把字段值的一部分作為索引,對(duì)于BLOB、TEXT、VARCHAR等類型必須使用前綴索引,畢竟索引需要存儲(chǔ)空間,索引太長,維護(hù)起來也相對(duì)困難。
對(duì)于MySQL語句中WHERE中的子查詢IN(),如希望搜索某個(gè)員工的工資情況,可以按照下面的方式實(shí)現(xiàn)查詢:
msql>SELECT *FROM? employees
->WHERE? 員工編號(hào) IN(
->SELECT 員工編號(hào) FROM salary WHERE 員工編號(hào)=2020002);
對(duì)于IN子查詢,我們一般認(rèn)為,存儲(chǔ)引擎是先執(zhí)行里面的子查詢,把查詢的結(jié)果返回,作為外查詢的條件,即外層查詢后執(zhí)行。但是實(shí)際情況不是這樣的,MySQL會(huì)把外層表直接壓入子查詢中,MySQL認(rèn)為這樣執(zhí)行的效率會(huì)更高,也就是說MySQL實(shí)際把查詢改寫了這樣的形式:
mysql->SELECT *FROM employees
->WHERE EXISTS(
->SELECT *FROM salary WHERE 員工編號(hào)=2020002
->AND employees.員工編號(hào)=salary.員工編號(hào));
這時(shí)子查詢需要根據(jù)員工編號(hào)來關(guān)聯(lián)外部表employees。通過explain 可以看出來,MySQL對(duì)employees表進(jìn)行全表掃描,然后根據(jù)返回的員工編號(hào)逐一執(zhí)行子查詢。
如果外部表是個(gè)很小的表,結(jié)果可能不會(huì)引起注意,但是如果外層的表是一個(gè)非常大的表,那么這個(gè)in子查的性能就會(huì)比較糟糕。
當(dāng)然我們還可以用下面的查詢重新改寫這個(gè)查詢:
mysql->SELECT *FROM employees
->INNER JOIN salary USING(員工編號(hào))
->WHERE 員工編號(hào)=‘2020002;
另一個(gè)優(yōu)化辦法是通過連接函數(shù)GROUP_CONCAT()在IN()子查詢語句中構(gòu)造一個(gè)由逗號(hào)分隔開來的列表序列,當(dāng)然有的時(shí)候比使用關(guān)聯(lián)寫的效率更好些。一般情況下,不建議使用IN子查詢,畢竟執(zhí)行效率相對(duì)低些,建議使用EXISTS()子查詢獲取更高的執(zhí)行效率。下面是對(duì)于IN子查詢改寫的情況:
mysql->SELECT *FROM employees
->WHERE EXISTS(
->SELECT *FROM salary WHERE 員工編號(hào)=2020002
->AND employees.員工編號(hào)=salary.員工編號(hào));
(4)需要在經(jīng)常搜索的條件WHERE中涉及查詢的字段中添加索引
在查詢的時(shí)候,盡量避免使用SELECT *FROM? abc;這樣的語句,盡量不要使用*,需要使用具體的字段來顯示結(jié)果,這樣可以提高查詢效率。在查詢語句中,盡量避免在WHERE中使用空值進(jìn)行判斷,比如SELECT *FROM abc WHERE 備注 IS NULL,如果執(zhí)行這個(gè)查詢,就需要搜索abc整張表,可以修改為:把備注的空值利用默認(rèn)值(DEFAULT)修改為0,即查詢語句為:SELECT *FROM abc WHERE 備注=0。
在WHERE條件中避免使用!=或<>等操作符,否則的話,就會(huì)導(dǎo)致存儲(chǔ)引擎掃描整張數(shù)據(jù)表。在WHERE子句中盡量避免使用OR進(jìn)行連接條件,否則,也會(huì)導(dǎo)致存儲(chǔ)引擎掃描整張數(shù)據(jù)表。例如:SELECT *FROM employees WHERE 姓名=章三 OR 姓名=張宏,可以使用UNION聯(lián)合查詢,改進(jìn)代碼如下:SELECT *FROM employees WHERE 姓名=章三UNION? SELECT
*FROM? employees WHERE 姓名=張宏。
在WHERE 條件查詢中,對(duì)于模糊查找,會(huì)導(dǎo)致掃描整張數(shù)據(jù)表,例如:SELECT id? FROM employees WHERE 姓名 LIKE‘%adb%,若要考慮提高效率,可以用全文索引實(shí)現(xiàn)。
在SQL語句中也要避免局部變量的使用,會(huì)掃描整張數(shù)據(jù)表。因?yàn)榫植孔兞康慕馕鍪窃诓樵兊臅r(shí)候才進(jìn)行的。例如:SELECT num FROM? a WHERE name=@name 就可以進(jìn)行轉(zhuǎn)換為:SELECT num FROM a WITH(index(索引名字)) WHERE name=@name。
在查詢中,避免在WHERE條件中使用函數(shù),函數(shù)的使用也會(huì)掃描整張數(shù)據(jù)表,例如:SELECT sid FROM a WHERE SUBSTRING(名稱,1,4)=abdc,字段名稱的列值以abdc開頭的sid應(yīng)改寫為:SELECT sid FROM a WHERE 名稱 LIKE ‘a(chǎn)bdc%,執(zhí)行這樣的操作,查詢效率會(huì)相對(duì)提高些。
對(duì)于查詢優(yōu)化,最根本的是表的結(jié)構(gòu)設(shè)計(jì)要合理,在設(shè)計(jì)表中字段時(shí),若某些字段能使用數(shù)值型的話,就盡量避免使用字符類型,若該字段的列值中只含有數(shù)字信息,該字段的數(shù)據(jù)類型就不要設(shè)計(jì)為字符型,這樣會(huì)降低查詢和連接的性能,增加開銷成本,這是因?yàn)榇鎯?chǔ)引擎在處理查詢連接時(shí),會(huì)逐個(gè)字符進(jìn)行比較,而對(duì)于數(shù)字型的,比較一次就足夠了。
3結(jié)束語
索引是加快查詢的重要方法,如果數(shù)據(jù)量很小,索引的作用不大,當(dāng)數(shù)據(jù)量很大的時(shí)候,尤其涉及多個(gè)表連接時(shí),索引的作用更大。當(dāng)然索引也有弊端,就是占用磁盤空間,但這些弊端并不妨礙索引的應(yīng)用,索引在數(shù)據(jù)庫中通常是必不可少的。
參考文獻(xiàn):
[1] 周德偉,覃國蓉.MySQL數(shù)據(jù)庫技術(shù)[M].2版.北京:高等教育出版社,2019.
[2] Baron Scbwartz,Peter Zaitsev,Vadim Tkacbenko,等.高性能MySQL[M]. 北京:電子工業(yè)出版社,2013.
[3]韓兵,王照清,廖聯(lián)軍,等.基于MySQL多表分頁查詢優(yōu)化技術(shù)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(8):171-175.
[4] 武洪萍,馬桂婷,等.MySQL數(shù)據(jù)庫原理及應(yīng)用[M].北京:人民郵電出版社,2014.
[5] 張士軍,陸海倫,等. 索引在MySQL查詢優(yōu)化中的應(yīng)用[J]. 計(jì)算機(jī)與數(shù)字工程,2007,35(1):37-39,8.
[6] 王珊,薩師煊.數(shù)據(jù)庫系統(tǒng)概論[M].4版.北京:高等教育出版社,2006.
【通聯(lián)編輯:王力】