這篇文章主要介紹了詳細(xì)講述MySQL中的子查詢(xún)操作,文中也給出了具體的代碼實(shí)例講解,需要的朋友可以參考下
繼續(xù)做以下的前期準(zhǔn)備工作:
新建一個(gè)測(cè)試數(shù)據(jù)庫(kù)TestDB;
- create database TestDB;
創(chuàng)建測(cè)試表table1和table2;
- CREATE TABLE table1
- (
- customer_id VARCHAR(10) NOT NULL,
- city VARCHAR(10) NOT NULL,
- PRIMARY KEY(customer_id)
- )ENGINE=INNODB DEFAULT CHARSET=UTF8;
- CREATE TABLE table2
- (
- order_id INT NOT NULL auto_increment,
- customer_id VARCHAR(10),
- PRIMARY KEY(order_id)
- )ENGINE=INNODB DEFAULT CHARSET=UTF8;
插入測(cè)試數(shù)據(jù);
- INSERT INTO table1(customer_id,city) VALUES('163','hangzhou');
- INSERT INTO table1(customer_id,city) VALUES('9you','shanghai');
- INSERT INTO table1(customer_id,city) VALUES('tx','hangzhou');
- INSERT INTO table1(customer_id,city) VALUES('baidu','hangzhou');
- INSERT INTO table2(customer_id) VALUES('163');
- INSERT INTO table2(customer_id) VALUES('163');
- INSERT INTO table2(customer_id) VALUES('9you');
- INSERT INTO table2(customer_id) VALUES('9you');
- INSERT INTO table2(customer_id) VALUES('9you');
- INSERT INTO table2(customer_id) VALUES('tx');
準(zhǔn)備工作做完以后,table1和table2看起來(lái)應(yīng)該像下面這樣:
- mysql> select * from table1;
- +-------------+----------+
- | customer_id | city |
- +-------------+----------+
- | 163 | hangzhou |
- | 9you | shanghai |
- | baidu | hangzhou |
- | tx | hangzhou |
- +-------------+----------+
- 4 rows in set (0.00 sec)
- mysql> select * from table2;
- +----------+-------------+
- | order_id | customer_id |
- +----------+-------------+
- | 1 | 163 |
- | 2 | 163 |
- | 3 | 9you |
- | 4 | 9you |
- | 5 | 9you |
- | 6 | tx |
- +----------+-------------+
- 7 rows in set (0.00 sec)
準(zhǔn)備工作做的差不多了,開(kāi)始今天的總結(jié)吧。
一個(gè)問(wèn)題
現(xiàn)在需要查詢(xún)所有杭州用戶(hù)的所有訂單號(hào),這個(gè)SQL語(yǔ)句怎么寫(xiě)?首先,你可以這么寫(xiě):
- select table2.customer_id, table2.order_id from table2 join table1 on table1.customer_id=table2.customer_id where table1.city='hangzhou';
能實(shí)現(xiàn)我們需要的結(jié)果。但是,我們也可以這么寫(xiě):
- select customer_id, order_id from table2 where customer_id in (select customer_id from table1 where city='hangzhou');
呃?在()括號(hào)中的的select語(yǔ)句是什么?問(wèn)題來(lái)了,這到底是什么語(yǔ)法,怎么也可以完成任務(wù),那么這篇博文就圍繞著這個(gè)問(wèn)題開(kāi)始展開(kāi)。
啥是子查詢(xún)
簡(jiǎn)單的說(shuō),子查詢(xún)就是:
如上圖所示,子查詢(xún),有叫內(nèi)部查詢(xún),相對(duì)于內(nèi)部查詢(xún),包含內(nèi)部查詢(xún)的就稱(chēng)為外部查詢(xún)。子查詢(xún)可以包含普通select可以包括的任何子句,比如:distinct、group by、order by、limit、join和union等;但是對(duì)應(yīng)的外部查詢(xún)必須是以下語(yǔ)句之一:select、insert、update、delete、set或者do。
我們可以在where和having子句中使用子查詢(xún),將子查詢(xún)得到的結(jié)果作為判斷的條件。
使用比較進(jìn)行子查詢(xún)
一個(gè)子查詢(xún)會(huì)返回一個(gè)標(biāo)量(就一個(gè)值)、一個(gè)行、一個(gè)列或一個(gè)表,這些子查詢(xún)稱(chēng)之為標(biāo)量、行、列和表子查詢(xún)。
當(dāng)一個(gè)子查詢(xún)返回一個(gè)標(biāo)量時(shí),我們就可以在where或者h(yuǎn)aving子句中使用比較符與子查詢(xún)得到的結(jié)果進(jìn)行直接判斷。比如,我現(xiàn)在要得到比用戶(hù)tx訂單數(shù)多的customer_id、city和訂單數(shù),這個(gè)sql語(yǔ)句怎么寫(xiě)。
先來(lái)說(shuō)說(shuō),我寫(xiě)sql的一般步驟:
讀懂需求;
得到比用戶(hù)tx訂單數(shù)多的customer_id、city和對(duì)應(yīng)的訂單數(shù)。
看看最終需要得到哪些字段信息;
最終需要得到customer_id、city和訂單數(shù)信息。
分析這些字段信息涉及到哪幾個(gè)表;
涉及到表table1和表table2。
這幾個(gè)表是如何關(guān)聯(lián)的;
表table1和表table2的關(guān)聯(lián)就在于customer_id字段。
分解需求,得到一個(gè)個(gè)小的需求;
需要得到tx用戶(hù)的訂單數(shù);
需要得到其它用戶(hù)的訂單數(shù);
比較訂單數(shù)。
確認(rèn)每一個(gè)小需求的過(guò)濾條件;
得到每個(gè)小需求的結(jié)果,進(jìn)行組裝,得到最終結(jié)果。
最終,我會(huì)寫(xiě)出一下的sql語(yǔ)句:
- select table1.customer_id,city,count(order_id)
- from table1 join table2
- on table1.customer_id=table2.customer_id
- where table1.customer_id <> 'tx'
- group by customer_id
- having count(order_id) >
- (select count(order_id)
- from table2
- where customer_id='tx'
- group by customer_id);
上面的查詢(xún)中使用了子查詢(xún),外部查詢(xún)與子查詢(xún)得到的結(jié)果進(jìn)行了比較判斷。如果子查詢(xún)返回一個(gè)標(biāo)量值(就一個(gè)值),那么外部查詢(xún)就可以使用:=、>、<、>=、<=和<>符號(hào)進(jìn)行比較判斷;如果子查詢(xún)返回的不是一個(gè)標(biāo)量值,而外部查詢(xún)使用了比較符和子查詢(xún)的結(jié)果進(jìn)行了比較,那么就會(huì)拋出異常。
使用ANY進(jìn)行子查詢(xún)
上面使用比較符進(jìn)行子查詢(xún),規(guī)定了子查詢(xún)只能返回一個(gè)標(biāo)量值;但是,如果子查詢(xún)返回的是一個(gè)集合,怎么辦?
沒(méi)問(wèn)題,我們可以使用:any、in、some或者all來(lái)和子查詢(xún)的返回結(jié)果進(jìn)行條件判斷。這里先總結(jié)使用any進(jìn)行子查詢(xún)。
any關(guān)鍵詞必須與上面總結(jié)的比較操作符一起使用;any關(guān)鍵詞的意思是“對(duì)于子查詢(xún)返回的列中的任何一個(gè)數(shù)值,如果比較結(jié)果為T(mén)RUE,就返回TRUE”。
好比“10 >any(11, 20, 2, 30)”,由于10>2,所以,該該判斷會(huì)返回TRUE;只要10與集合中的任意一個(gè)進(jìn)行比較,得到TRUE時(shí),就會(huì)返回TRUE。
比如,我現(xiàn)在要查詢(xún)比customer_id為tx或者9you的訂單數(shù)量多的用戶(hù)的id、城市和訂單數(shù)量。
我可以得到以下的sql語(yǔ)句來(lái)完成需求。
- select table1.customer_id,city,count(order_id)
- from table1 join table2
- on table1.customer_id=table2.customer_id
- where table1.customer_id<>'tx' and table1.customer_id<>'9you'
- group by customer_id
- having count(order_id) >
- any (
- select count(order_id)
- from table2
- where customer_id='tx' or customer_id='9you'
- group by customer_id);
any的意思比較好明白,直譯就是任意一個(gè),只要條件滿足任意的一個(gè),就返回TRUE。
使用IN進(jìn)行子查詢(xún)
使用in進(jìn)行子查詢(xún),這個(gè)我們?cè)谌粘?xiě)sql的時(shí)候是經(jīng)常遇到的。in的意思就是指定的一個(gè)值是否在這個(gè)集合中,如何在就返回TRUE;否則就返回FALSE了。
in是“=any”的別名,在使用“=any”的地方,我們都可以使用“in”來(lái)進(jìn)行替換。這里就不舉例了,盡情的發(fā)揮想象,自行發(fā)揮吧。
有了in,肯定就有了not in;not in并不是和<>any是同樣的意思,not in和<>all是一個(gè)意思,關(guān)于all,下面馬上就要總結(jié)了。
使用SOME進(jìn)行子查詢(xún)
some是any的別名,用的比較少。只需要理解any的意思就好了,這里就不做過(guò)多的總結(jié)。具體請(qǐng)參考上面的any部分的總結(jié)。
使用ALL進(jìn)行子查詢(xún)
all必須與比較操作符一起使用。all的意思是“對(duì)于子查詢(xún)返回的列中的所有值,如果比較結(jié)果為T(mén)RUE,則返回TRUE”。
好比“10 >all(2, 4, 5, 1)”,由于10大于集合中的所有值,所以這條判斷就返回TRUE;而如果為“10 >all(20, 3, 2, 1, 4)”,這樣的話,由于10小于20,所以該判斷就會(huì)返回FALSE。
<>all的同義詞是not in,表示不等于集合中的所有值,這個(gè)很容易和<>any搞混,平時(shí)多留點(diǎn)心就好了。
標(biāo)量子查詢(xún)
根據(jù)子查詢(xún)返回值的數(shù)量,將子查詢(xún)可以分為標(biāo)量子查詢(xún)和多值子查詢(xún)。在使用比較符進(jìn)行子查詢(xún)時(shí),就要求必須是標(biāo)量子查詢(xún);如果是多值子查詢(xún)時(shí),使用比較符,就會(huì)拋出異常。
多值子查詢(xún)
與標(biāo)量子查詢(xún)對(duì)應(yīng)的就是多值子查詢(xún)了,多值子查詢(xún)會(huì)返回一列、一行或者一個(gè)表,它們組成一個(gè)集合。我們一般使用的any、in、all和some等詞,將外部查詢(xún)與子查詢(xún)的結(jié)果進(jìn)行判斷。如果將any、in、all和some等詞與標(biāo)量子查詢(xún),就會(huì)得到空的結(jié)果。
獨(dú)立子查詢(xún)
獨(dú)立子查詢(xún)是不依賴(lài)外部查詢(xún)而運(yùn)行的子查詢(xún)。什么叫依賴(lài)外部查詢(xún)?先看下面兩個(gè)sql語(yǔ)句。
sql語(yǔ)句1:獲得所有hangzhou顧客的訂單號(hào)。
- select order_id
- from table2
- where customer_id in
- (select customer_id
- from table1
- where city='hangzhou');
sql語(yǔ)句2:獲得城市為hangzhou,并且存在訂單的用戶(hù)。
- select *
- from table1
- where city='hangzhou' and exists
- (select *
- from table2
- where table1.customer_id=table2.customer_id);
上面的兩條sql語(yǔ)句,雖然例子舉的有點(diǎn)不是很恰當(dāng),但是足以說(shuō)明這里的問(wèn)題了。
對(duì)于sql語(yǔ)句1,我們將子查詢(xún)單獨(dú)復(fù)制出來(lái),也是可以單獨(dú)執(zhí)行的,就是子查詢(xún)與外部查詢(xún)沒(méi)有任何關(guān)系。
對(duì)于sql語(yǔ)句2,我們將子查詢(xún)單獨(dú)復(fù)制出來(lái),就無(wú)法單獨(dú)執(zhí)行了,由于sql語(yǔ)句2的子查詢(xún)依賴(lài)外部查詢(xún)的某些字段,這就導(dǎo)致子查詢(xún)就依賴(lài)外部查詢(xún),就產(chǎn)生了相關(guān)性。
對(duì)于子查詢(xún),很多時(shí)候都會(huì)考慮到效率的問(wèn)題。當(dāng)我們執(zhí)行一個(gè)select語(yǔ)句時(shí),可以加上explain關(guān)鍵字,用來(lái)查看查詢(xún)類(lèi)型,查詢(xún)時(shí)使用的索引以及其它等等信息。比如這么用:
- explain select order_id
- from table2
- where customer_id in
- (select customer_id
- from table1
- where city='hangzhou');
使用獨(dú)立子查詢(xún),如果子查詢(xún)部分對(duì)集合的最大遍歷次數(shù)為n,外部查詢(xún)的最大遍歷次數(shù)為m時(shí),我們可以記為:O(m+n)。而如果使用相關(guān)子查詢(xún),它的遍歷次數(shù)可能會(huì)達(dá)到O(m+m*n)。可以看到,效率就會(huì)成倍的下降;所以,大伙在使用子查詢(xún)時(shí),一定要考慮到子查詢(xún)的相關(guān)性。
關(guān)于explain的更多解釋?zhuān)?qǐng)參考這里。
相關(guān)子查詢(xún)
相關(guān)子查詢(xún)是指引用了外部查詢(xún)列的子查詢(xún),即子查詢(xún)會(huì)對(duì)外部查詢(xún)的每行進(jìn)行一次計(jì)算。但是在MySQL的內(nèi)部,會(huì)進(jìn)行動(dòng)態(tài)優(yōu)化,會(huì)隨著情況的不同會(huì)有所不同。使用相關(guān)子查詢(xún)是最容易出現(xiàn)性能的地方。而關(guān)于sql語(yǔ)句的優(yōu)化,這又是一個(gè)非常大的話題了,只能通過(guò)實(shí)際的經(jīng)驗(yàn)積累,才能更好的去理解如何進(jìn)行優(yōu)化。
關(guān)于sql的性能,我這里不能說(shuō)什么,如果只是閱讀其它人的文章來(lái)考慮性能問(wèn)題,其實(shí)是沒(méi)有任何感覺(jué)的,我們需要實(shí)際的項(xiàng)目中才能更好的理解。
EXISTS謂詞
EXISTS是一個(gè)非常牛叉的謂詞,它允許數(shù)據(jù)庫(kù)高效地檢查指定查詢(xún)是否產(chǎn)生某些行。根據(jù)子查詢(xún)是否返回行,該謂詞返回TRUE或FALSE。與其它謂詞和邏輯表達(dá)式不同的是,無(wú)論輸入子查詢(xún)是否返回行,EXISTS都不會(huì)返回UNKNOWN,對(duì)于EXISTS來(lái)說(shuō),UNKNOWN就是FALSE。還是上面的語(yǔ)句,獲得城市為hangzhou,并且存在訂單的用戶(hù)。
- select *
- from table1
- where city='hangzhou' and exists
- (select *
- from table2
- where table1.customer_id=table2.customer_id);
使用explain查看一下,就會(huì)得到以下內(nèi)容:
我們可以很明顯的看到,存在一個(gè)相關(guān)的子查詢(xún)(DEPENDENT SUBQUERY)??梢钥吹紼XISTS和IN是非常相似的,那么它們之間的區(qū)別是什么呢?
關(guān)于IN和EXISTS的主要區(qū)別在于三值邏輯的判斷上。EXISTS總是返回TRUE或FALSE,而對(duì)于IN,除了TRUE、FALSE值外,還有可能對(duì)NULL值返回UNKNOWN。但是在過(guò)濾器中,UNKNOWN的處理方式與FALSE相同,因此使用IN與使用EXISTS一樣,SQL優(yōu)化器會(huì)選擇相同的執(zhí)行計(jì)劃。
說(shuō)到了IN和EXISTS幾乎是一樣的,但是,就不得不說(shuō)到NOT IN和NOT EXISTS,對(duì)于輸入列表中包含NULL值時(shí),NOT EXISTS和NOT IN之間的差異就表現(xiàn)的非常大了。輸入列表包含NULL值時(shí),IN總是返回TRUE和UNKNOWN,因此NOT IN就會(huì)得到NOT TRUE和NOT UNKNOWN,即FALSE和UNKNOWN。
- mysql> select 'c' NOT IN ('a', 'b', NULL)/G;
執(zhí)行一下上述代碼,看看結(jié)果。你就會(huì)感到驚訝。
派生表
上面也說(shuō)到了,在子查詢(xún)返回的值中,也可能返回一個(gè)表,如果將子查詢(xún)返回的虛擬表再次作為FROM子句的輸入時(shí),這就子查詢(xún)的虛擬表就成為了一個(gè)派生表。語(yǔ)法結(jié)構(gòu)如下:
- FROM (subquery expression) AS derived_table_alias
由于派生表是完全的虛擬表,并沒(méi)有也不可能被物理地具體化。
總結(jié)
總算總結(jié)的差不多了,當(dāng)然了子查詢(xún)的東西還是有很多的,不可能一篇文章就能總結(jié)的完的,這里只是把一些基本的概念,常用的知識(shí)點(diǎn)進(jìn)行了總結(jié),關(guān)于將子查詢(xún)使用到update、delete和insert語(yǔ)句中的用法,我這里并沒(méi)有涉及,大體上都是大同小異的。知識(shí)這個(gè)東西,展開(kāi)了,就沒(méi)有頭了,還是需要適可而止,適當(dāng)?shù)倪M(jìn)行深度的挖掘,但是深度最好不要超過(guò)2,關(guān)于這個(gè)2如何定義,自行把握。好了,這篇文章就到此為止了,我們下一篇見(jiàn)。
新聞熱點(diǎn)
疑難解答
圖片精選