2024-03-18碼農

SQL 寫不好加班少不了日常工作中SQL 是必不可少的一項技術但是很多人不會過多的去關註SQL問題一是數據量小二是沒有意識到索引的重要性本文主要是整理 SQL失效場景如果裏面的細節你都知道那你一定是學習能力比較好的人膜拜

寫完這篇文章我感覺自己之前知道的真的是「目錄」沒有明白其中的內容如果你能跟著節奏看完文章一定會有收獲至少我寫完感覺思維通透很多以後百分之九十的 SQl索引問題和面試這方面問題都能拿

索引失效整理

基礎數據準備

準備一個數據表作為數據演示這裏面一共建立了三個索引

聯合索引 sname , s_code , address

主鍵索引 id

普通索引 height

SETNAMES utf8mb4; SET FOREIGN_KEY_CHECKS = 0; -- ---------------------------- -- Table structure for student -- ---------------------------- DROPTABLEIFEXISTS`student`; CREATETABLE`student` ( `id`int(11) NOTNULL AUTO_INCREMENT, `sname`varchar(20) CHARACTERSET utf8 COLLATE utf8_general_ci NOTNULL, `s_code`int(100) NULLDEFAULTNULL, `address`varchar(100) CHARACTERSET utf8 COLLATE utf8_general_ci NULLDEFAULTNULL, `height`doubleNULLDEFAULTNULL, ` classid`int(11) NULLDEFAULTNULL, `create_time` datetime(0) NOTNULLONUPDATECURRENT_TIMESTAMP(0), PRIMARY KEY (`id`) USING BTREE, INDEX`普通索引`(`height`) USING BTREE, INDEX`聯合索引`(`sname`, `s_code`, `address`) USING BTREE ) ENGINE = InnoDB AUTO_INCREMENT = 5CHARACTERSET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic; -- ---------------------------- -- Records of student -- ---------------------------- INSERTINTO`student`VALUES (1, '學生1', 1, '上海', 170, 1, '2022-11-02 20:44:14'); INSERTINTO`student`VALUES (2, '學生2', 2, '北京', 180, 2, '2022-11-02 20:44:16'); INSERTINTO`student`VALUES (3, '變成派大星', 3, '京東', 185, 3, '2022-11-02 20:44:19'); INSERTINTO`student`VALUES (4, '學生4', 4, '聯通', 190, 4, '2022-11-02 20:44:25');

問題思考

上面的SQL 我們已經建立好基本的數據在驗證之前先帶著幾個問題

我們先從上往下進行驗證

最左匹配原則

寫在前面：我很早之前就聽說過資料庫的最左匹配原則，當時是透過各大部落格論壇了解的，但是這些部落格的局限性在於它們對最左匹配原則的描述就像一些數學定義一樣，往往都是列出123點，滿足這123點就能匹配上索引，否則就不能。

最左匹配原則就是指在聯合索引中，如果你的 SQL 語句中用到了聯合索引中的最左邊的索引，那麽這條 SQL 語句就可以利用這個聯合索引去進行匹配，我們上面建立了聯合索引可以用來測試最左匹配原則 sname , s_code , address

請看下面SQL語句進行思考是否會走索引

-- 聯合索引 sname,s_code,address 1、select create_time from student where sname = "變成派大星"-- 會走索引嗎？ 2、select create_time from student where s_code = 1-- 會走索引嗎？ 3、select create_time from student where address = "上海"-- 會走索引嗎？ 4、select create_time from student where address = "上海"and s_code = 1-- 會走索引嗎？ 5、select create_time from student where address = "上海"and sname = "變成派大星"-- 會走索引嗎？ 6、select create_time from student where sname = "變成派大星"and address = "上海"-- 會走索引嗎？ 7、select create_time from student where sname = "變成派大星"and s_code = 1and address = "上海"-- 會走索引嗎？

憑你的經驗哪些會使用到索引呢？可以先思考一下在心中記下數位

走索引例子

EXPLAINselect create_time from student where sname = "變成派大星"-- 會走索引嗎？

未走索引例子

EXPLAINselect create_time from student where address = "上海"and s_code = 1-- 會走索引嗎？

走的全表掃描 rows = 4

如果不知道 EXPLAIN 是什麽的或者看不懂分析出來的數據的話建議去看看另一篇文章分析命令EXPLAIN超詳解 ^[1]

如果你內心的答案沒有全部說對就接著往下看

最左匹配原則顧名思義：最左優先，以最左邊的為起點任何連續的索引都能匹配上。 同時遇到範圍查詢(>、<、between、like)就會停止匹配 。

例如：s_code = 2 如果建立( sname , s_code )順序的索引，是匹配不到( sname , s_code )索引的;

但是如果查詢條件是sname = "變成派大星" and s_code = 2或者a=1(又或者是s_code = 2 and sname = "變成派大星" )就可以， 因為最佳化器會自動調整 sname , s_code 的順序 。再比如sname = "變成派大星" and s_code > 1 and address = "上海" address是用不到索引的 ，因為s_code欄位是一個範圍查詢，它之後的欄位會停止匹配。

不帶範圍查詢索引使用型別

帶範圍使用型別

根據上一篇文章的講解可以明白 ref 和range的含義級別還是相差很多的

思考

為什麽左連結一定要遵循最左綴原則呢？

驗證

看過一個比較好玩的回答

你可以認為聯合索引是闖關遊戲的設計
例如你這個聯合索引是state/city/zipCode
那麽state就是第一關 city是第二關， zipCode就是第三關
你必須匹配了第一關，才能匹配第二關，匹配了第一關和第二關，才能匹配第三關

這樣描述不算完全準確但是確實是這種思想

要想理解聯合索引的最左匹配原則，先來理解下索引的底層原理。索引的底層是一顆B+樹，那麽聯合索引的底層也就是一顆B+樹，只不過聯合索引的B+樹節點中儲存的是鍵值。由於構建一棵B+樹只能根據一個值來確定索引關系，所以資料庫依賴聯合索引最左的欄位來構建文字比較抽象我們看一下

加入我們建立 A,B 聯合索引他們在底層儲存是什麽樣子呢？

橙色代表欄位 A

淺綠色代表欄位B

圖解：

我們可以看出幾個特點

A 是有順序的 1，1，2，2，3，4

B 是沒有順序的 1，2，1，4，1，2 這個是雜湊的

如果A是等值的時候 B是有序的例如（1，1），（1，2）這裏的B有序的（2，1）,(2,4) B 也是有序的

這裏應該就能看出如果沒有A的支持 B的索引是雜湊的不是連續的

再細致一點我們重新建立一個表

DROPTABLEIFEXISTS`leftaffix`; CREATETABLE`leftaffix` ( `a`int(11) NOTNULL AUTO_INCREMENT, `b`int(11) NULLDEFAULTNULL, `c`int(11) NULLDEFAULTNULL, `d`int(11) NULLDEFAULTNULL, `e`varchar(11) CHARACTERSET utf8 COLLATE utf8_general_ci NULLDEFAULTNULL, PRIMARY KEY (`a`) USING BTREE, INDEX`聯合索引`(`b`, `c`, `d`) USING BTREE ) ENGINE = InnoDB AUTO_INCREMENT = 8CHARACTERSET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic; -- ---------------------------- -- Records of leftaffix -- ---------------------------- INSERTINTO`leftaffix`VALUES (1, 1, 1, 1, '1'); INSERTINTO`leftaffix`VALUES (2, 2, 2, 2, '2'); INSERTINTO`leftaffix`VALUES (3, 3, 2, 2, '3'); INSERTINTO`leftaffix`VALUES (4, 3, 1, 1, '4'); INSERTINTO`leftaffix`VALUES (5, 2, 3, 5, '5'); INSERTINTO`leftaffix`VALUES (6, 6, 4, 4, '6'); INSERTINTO`leftaffix`VALUES (7, 8, 8, 8, '7'); SET FOREIGN_KEY_CHECKS = 1;

在建立索引樹的時候會對數據進行排序根據最左綴原則會先透過 B 進行排序也就是如果出現值相同就根據 C 排序如果 C相同就根據D 排序排好順序之後就是如下圖：

索引的生成就會根據圖二的順序進行生成我們看一下生成後的樹狀數據是什麽樣子

解釋一些這個樹狀圖首先根據圖二的排序我們知道順序是 1111a 2222b 所以在第三層我們可以看到 1111a 在第一層 2222b在第二層因為 111 < 222 所以 111 進入第二層然後得出第一層

簡化一下就是這個樣子

但是這種順序是相對的。這是因為MySQL建立聯合索引的規則是首先會對聯合索引的最左邊 第一個欄位排序 ，在第一個欄位的排序基礎上，然後在對第二個欄位進行排序。所以B=2這種查詢條件沒有辦法利用索引。

看到這裏還可以明白一個道理為什麽我們建立索引的時候不推薦建立在經常改變的欄位因為這樣的話我們的索引結構就要跟著你的改變而改動所以很消耗效能

補充

評論區老哥的提示最左綴原則可以透過跳躍掃描的方式打破簡單整理一下這方面的知識

這個是在 8.0 進行的最佳化

MySQL8.0版本 開始增加了索引跳躍掃描的功能，當第一列索引的唯一值較少時，即使where條件沒有第一列索引，查詢的時候也可以用到聯合索引。

比如我們使用的聯合索引是 bcd 但是b中欄位比較少我們在使用聯合索引的時候沒有使用 b 但是依然可以使用聯合索引 MySQL聯合索引有時候遵循最左字首匹配原則，有時候不遵循。

小總結

前提如果建立 b,c,d 聯合索引面

如果我where 後面的條件是 c = 1 and d = 1 為什麽不能走索引呢如果沒有b的話你查詢的值相當於 *11 我們都知道 * 是所有的意思也就是我能匹配到所有的數據

如果我 where 後面是 b = 1 and d =1 為什麽會走索引呢？你等於查詢的數據是 1*1 我可以透過前面 1 進行索引匹配所以就可以走索引

最左綴匹配原則的最重要的就是第一個欄位

我們接著看下一個失效場景

select *

思考

這裏是我之前的一個思維誤區 select * 不會導致索引失效之前測試發現失效是因為where 後面的查詢範圍過大導致索引失效並不是 Select * 引起的但是為什麽不推薦使用 select *

解釋

增加查詢分析器解析成本。

增減欄位容易與 resultMap 配置不一致。

無用欄位增加網路消耗，尤其是 text 型別的欄位。

在阿裏的開發手冊中，大面的概括了上面幾點。

在使用 Select * 索引使用正常

雖然走了索引但是也不推薦這種寫法為什麽呢？

首先我們在上一個驗證中建立了聯合索引我們使用B=1 會走索引但是與直接查詢索引欄位不同使用 SELECT* ,獲取了不需要的數據，則首先透過輔助索引過濾數據，然後再透過聚集索引獲取所有的列，這就多了一次b+樹查詢，速度必然會慢很多，減少使用 select * 就是降低回表帶來的損耗。

也就是 Select * 在一些情況下是會走索引的如果不走索引就是 where 查詢範圍過大導致MySQL 最優選擇全表掃描了並不是 Select * 的問題

上圖就是索引失效的情況

範圍尋找也不是一定會索引失效下面情況就會索引生效就是級別低生效的原因是因為縮小了範圍

小總結

select * 會走索引

範圍尋找有機率索引失效但是在特定的情況下會生效範圍小就會使用也可以理解為返回結果集小就會使用索引

mysql中連線查詢的原理是先對驅動表進行查詢操作，然後再用從驅動表得到的數據作為條件，逐條的到被驅動表進行查詢。

每次驅動表載入一條數據到記憶體中，然後被驅動表所有的數據都需要往記憶體中載入一遍進行比較。效率很低，所以mysql中可以指定一個緩沖池的大小，緩沖池大的話可以同時載入多條驅動表的數據進行比較，放的數據條數越多效能io操作就越少，效能也就越好。所以，如果此時使用 select * 放一些無用的列，只會白白的占用緩沖空間。浪費本可以提高效能的機會。

按照評論區老哥的說法 select * 不是造成索引失效的直接原因大部份原因是 where 後邊條件的問題但是還是盡量少去使用 select * 多少還是會有影響的

使用函式

使用在Select 後面使用函式可以使用索引但是下面這種做法就不能

因為索引保存的是索引欄位的原始值，而不是經過函式計算後的值，自然就沒辦法走索引了。

不過，從 MySQL 8.0 開始，索引特性增加了函式索引，即可以針對函式計算後的值建立一個索引，也就是說該索引的值是函式計算後的值，所以就可以透過掃描索引來查詢數據。

這種寫法我沒使用過感覺情況比較少也比較容易註意到這種寫法

計算操作

這個情況和上面一樣之所以會導致索引失效是因為改變了索引原來的值在樹中找不到對應的數據只能全表掃描

因為索引保存的是索引欄位的原始值，而不是 b - 1 運算式計算後的值，所以無法走索引，只能透過把索引欄位的取值都取出來，然後依次進行運算式的計算來進行條件判斷，因此采用的就是全表掃描的方式。

下面這種計算方式就會使用索引

Java比較熟悉的可能會有點疑問，這種對索引進行簡單的運算式計算，在程式碼特殊處理下，應該是可以做到索引掃描的，比方將 b - 1 = 6 變成 b = 6 - 1 。是的，是能夠實作，但是 MySQL 還是偷了這個懶，沒有實作。

小總結

總而言之言而總之只要是影響到索引列的值索引就是失效

Like %

這個真的是難受哦因為經常使用這個所以還是要小心點在看為什麽失效之前我們先看一下 Like % 的解釋

%百分號通配符: 表示任何字元出現任意次數(可以是0次).
_底線通配符: 表示只能匹配單個字元,不能多也不能少,就是一個字元.
like操作符: LIKE作用是指示mysql後面的搜尋模式是利用通配符而不是直接相等匹配進行比較.

註意: 如果在使用like操作符時,後面的沒有使用通用匹配符效果是和=一致的,

SELECT * FROM products WHERE products.prod_name like'1000';

2.匹配包含"Li"的記錄(包括記錄"Li") :

SELECT* FROM products WHERE products.prod_name like'%Li%';

3.匹配以"Li"結尾的記錄(包括記錄"Li",不包括記錄"Li ",也就是Li後面有空格的記錄,這裏需要註意)

SELECT * FROM products WHERE products.prod_name like'%Li';

在左不走在右走

右： 雖然走但是索引級別比較低主要是模糊查詢範圍比較大所以索引級別就比較低

左： 這個範圍非常大所以沒有使用索引的必要了這個可能不是很好最佳化還好不是一直拼接上面的。公眾號Java精選，回復java面試，獲取面試資料，支持線上刷題。

小總結定期回顧-審視自己、查缺補漏

索引的時候和查詢範圍關系也很大範圍過大造成索引沒有意義從而失效的情況也不少

使用Or導致索引失效

這個原因就更簡單了

在 WHERE 子句中，如果在 OR 前的條件列是索引列，而在 OR 後的條件列不是索引列，那麽索引會失效舉個例子，比如下面的查詢語句，b 是主鍵，e 是普通列，從執行計劃的結果看，是走了全表掃描。

最佳化

這個的最佳化方式就是在Or的時候兩邊都加上索引

就會使用索引避免全表掃描

in使用不當

首先使用In 不是一定會造成全表掃描的 IN肯定會走索引，但是當IN的取值範圍較大時會導致索引失效，走全表掃描

in 在結果集大於30%的時候索引失效

not in 和 In的失效場景相同

order By

這一個主要是Mysql 自身最佳化的問題我們都知道OrderBy 是排序那就代表我需要對數據進行排序如果我走索引索引是排好序的但是我需要回表消耗時間另一種我直接全表掃描排序不用回表也就是

走索引 + 回表

不走索引直接全表掃描

Mysql 認為直接全表掃面的速度比回表的速度快所以就直接走索引了在 Order By 的情況下走全表掃描反而是更好的選擇

子查詢會走索引嗎

答案是會但是使用不好就不會

大總結

減少回表最佳化思路

這個對於SQL有研究的人可能是比較了解的但是對於工作時長不久的會比較陌生的詞語但是這個是非常有意思且重要的

在這個索引問題上面還有一個細節的東西其中印象比較深刻的是回表會造成效率下降但是在我們日常工作中是比較常用單列索引聯合索引對於新手來說不是很常用但是單列索引在一些情況下肯定不是最優解例如 like % 問題會造成索引問題近期了解到一個 ICP 知識我之前都沒有關註過不知道大家對這個了解多少我這裏就進行一些整理

首先我們ICP 全稱是 Index Condition Pushdown 中文可以說成是索引下推主要的作用解決數據查詢回表的問題但是前提是和聯合索引進行使用才能發揮出來功效接下來不了解的小夥伴可以認真看一下這一點個人感覺還是比較有意思的東西