MySQL面試重點篇27問27答

時間：2021-05-17 10:55:18

關(guān)鍵字： MySQL 范式事務(wù)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]在任何一個關(guān)系數(shù)據(jù)庫中，第一范式（1NF）是對關(guān)系模式的基本要求，不滿足第一范式（1NF）的數(shù)據(jù)庫就不是關(guān)系數(shù)據(jù)庫。

26、數(shù)據(jù)庫三大范式精講

第一范式

在任何一個關(guān)系數(shù)據(jù)庫中，第一范式（1NF）是對關(guān)系模式的基本要求，不滿足第一范式（1NF）的數(shù)據(jù)庫就不是關(guān)系數(shù)據(jù)庫。所謂第一范式（1NF）是指數(shù)據(jù)庫表的每一列都是不可分割的基本數(shù)據(jù)項，同一列中不能有多個值，即實體中的某個屬性不能有多個值或者不能有重復(fù)的屬性。

如果出現(xiàn)重復(fù)的屬性，就可能需要定義一個新的實體，新的實體由重復(fù)的屬性構(gòu)成，新實體與原實體之間為一對多關(guān)系。在第一范式（1NF）中表的每一行只包含一個實例的信息。

簡而言之，第一范式就是無重復(fù)的列。

第二范式

第二范式（2NF）是在第一范式（1NF）的基礎(chǔ)上建立起來的，即滿足第二范式（2NF）必須先滿足第一范式（1NF）。第二范式（2NF）要求數(shù)據(jù)庫表中的每個實例或行必須可以被惟一地區(qū)分。

為實現(xiàn)區(qū)分通常需要為表加上一個列，以存儲各個實例的惟一標識。這個惟一屬性列被稱為主關(guān)鍵字或主鍵、主碼。第二范式（2NF）要求實體的屬性完全依賴于主關(guān)鍵字。

所謂完全依賴是指不能存在僅依賴主關(guān)鍵字一部分的屬性，如果存在，那么這個屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來形成一個新的實體，新實體與原實體之間是一對多的關(guān)系。為實現(xiàn)區(qū)分通常需要為表加上一個列，以存儲各個實例的惟一標識。

簡而言之，第二范式就是非主屬性非部分依賴于主關(guān)鍵字。

第三范式

滿足第三范式（3NF）必須先滿足第二范式（2NF）。簡而言之，第三范式（3NF）要求一個數(shù)據(jù)庫表中不包含已在其它表中已包含的非主關(guān)鍵字信息。

例如，存在一個部門信息表，其中每個部門有部門編號（dept_id）、部門名稱、部門簡介等信息。那么在員工信息表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表，則根據(jù)第三范式（3NF）也應(yīng)該構(gòu)建它，否則就會有大量的數(shù)據(jù)冗余。

簡而言之，第三范式就是屬性不依賴于其它非主屬性。

27、數(shù)據(jù)庫三大范式精要總結(jié)

（1）簡單歸納：

第一范式（1NF）：字段不可分；

第二范式（2NF）：有主鍵，非主鍵字段依賴主鍵；

第三范式（3NF）：非主鍵字段不能相互依賴。

（2）解釋：

1NF：原子性。字段不可再分,否則就不是關(guān)系數(shù)據(jù)庫;；

2NF：唯一性。一個表只說明一個事物；

3NF：每列都與主鍵有直接關(guān)系，不存在傳遞依賴。

28、MySQL常見的存儲引擎InnoDB、MyISAM的區(qū)別？適用場景分別是？

1）事務(wù)：MyISAM不支持，InnoDB支持

2）鎖級別：MyISAM 表級鎖，InnoDB 行級鎖及外鍵約束

3）MyISAM存儲表的總行數(shù)；InnoDB不存儲總行數(shù)；

4）MyISAM采用非聚集索引，B+樹葉子存儲指向數(shù)據(jù)文件的指針。InnoDB主鍵索引采用聚集索引，B+樹葉子存儲數(shù)據(jù)

適用場景：

MyISAM適合：插入不頻繁，查詢非常頻繁，如果執(zhí)行大量的SELECT，MyISAM是更好的選擇，沒有事務(wù)。

InnoDB適合：可靠性要求比較高，或者要求事務(wù)；表更新和查詢都相當?shù)念l繁，大量的INSERT或UPDATE

29、事務(wù)四大特性（ACID）原子性、一致性、隔離性、持久性？

第一種回答

原子性：一個事務(wù)（transaction）中的所有操作，要么全部完成，要么全部不完成，不會結(jié)束在中間某個環(huán)節(jié)。。事務(wù)在執(zhí)行過程中發(fā)生錯誤，會被恢復(fù)（Rollback）到事務(wù)開始前的狀態(tài)，就像這個事務(wù)從來沒有執(zhí)行過一樣。一致性：在事務(wù)開始之前和事務(wù)結(jié)束以后，數(shù)據(jù)庫的完整性沒有被破壞。這表示寫入的資料必須完全符合所有的預(yù)設(shè)規(guī)則，這包含資料的精確度、串聯(lián)性以及后續(xù)數(shù)據(jù)庫可以自發(fā)性地完成預(yù)定的工作。隔離性：數(shù)據(jù)庫允許多個并發(fā)事務(wù)同時對其數(shù)據(jù)進行讀寫和修改的能力，隔離性可以防止多個事務(wù)并發(fā)執(zhí)行時由于交叉執(zhí)行而導(dǎo)致數(shù)據(jù)的不一致。事務(wù)隔離分為不同級別，包括讀未提交（Read uncommitted）、讀提交（read committed）、可重復(fù)讀（repeatable read）和串行化（Serializable）。持久性：事務(wù)處理結(jié)束后，對數(shù)據(jù)的修改就是永久的，即便系統(tǒng)故障也不會丟失。

第二種回答

原子性（Atomicity）

原子性是指事務(wù)包含的所有操作要么全部成功，要么全部失敗回滾，因此事務(wù)的操作如果成功就必須要完全應(yīng)用到數(shù)據(jù)庫，如果操作失敗則不能對數(shù)據(jù)庫有任何影響。

一致性（Consistency）

事務(wù)開始前和結(jié)束后，數(shù)據(jù)庫的完整性約束沒有被破壞。比如A向B轉(zhuǎn)賬，不可能A扣了錢，B卻沒收到。

隔離性（Isolation）

隔離性是當多個用戶并發(fā)訪問數(shù)據(jù)庫時，比如操作同一張表時，數(shù)據(jù)庫為每一個用戶開啟的事務(wù)，不能被其他事務(wù)的操作所干擾，多個并發(fā)事務(wù)之間要相互隔離。

同一時間，只允許一個事務(wù)請求同一數(shù)據(jù)，不同的事務(wù)之間彼此沒有任何干擾。比如A正在從一張銀行卡中取錢，在A取錢的過程結(jié)束前，B不能向這張卡轉(zhuǎn)賬。關(guān)于事務(wù)的隔離性數(shù)據(jù)庫提供了多種隔離級別，稍后會介紹到。

持久性（Durability）

持久性是指一個事務(wù)一旦被提交了，那么對數(shù)據(jù)庫中的數(shù)據(jù)的改變就是永久性的，即便是在數(shù)據(jù)庫系統(tǒng)遇到故障的情況下也不會丟失提交事務(wù)的操作。

30、SQL中的NOW()和CURRENT_DATE()兩個函數(shù)有什么區(qū)別？

NOW（）命令用于顯示當前年份，月份，日期，小時，分鐘和秒。CURRENT_DATE（）僅顯示當前年份，月份和日期。

31、什么是聚合索引？

聚簇索引就是按照拼音查詢，非聚簇索引就是按照偏旁等來進行查詢。

其實，我們的漢語字典的正文本身就是一個聚集索引。比如，我們要查"安"字，就會很自然地翻開字典的前幾頁，因為"安"的拼音是"an"，而按照拼音排序漢字的字典是以英文字母"a"開頭并以"z"結(jié)尾的，那么"安"字就自然地排在字典的前部。如果您翻完了所有以"a"開頭的部分仍然找不到這個字，那么就說明您的字典中沒有這個字；同樣的，如果查"張"字，那您也會將您的字典翻到最后部分，因為"張"的拼音是"zhang"。也就是說，字典的正文部分本身就是一個目錄，您不需要再去查其他目錄來找到您需要找的內(nèi)容。

我們把這種正文內(nèi)容本身就是一種按照一定規(guī)則排列的目錄稱為"聚集索引"

32、什么是非聚合索引?

如果您認識某個字，您可以快速地從自動中查到這個字。但您也可能會遇到您不認識的字，不知道它的發(fā)音，這時候，您就不能按照剛才的方法找到您要查的字，而需要去根據(jù)"偏旁部首"查到您要找的字，然后根據(jù)這個字后的頁碼直接翻到某頁來找到您要找的字。

但您結(jié)合"部首目錄"和"檢字表"而查到的字的排序并不是真正的正文的排序方法，比如您查"張"字，我們可以看到在查部首之后的檢字表中"張"的頁碼是672頁，檢字表中"張"的上面是"馳"字，但頁碼卻是63 頁，"張"的下面是"弩"字，頁面是390頁。

很顯然，這些字并不是真正的分別位于"張"字的上下方，現(xiàn)在您看到的連續(xù)的"馳、張、弩"三字實際上就是他們在非聚集索引中的排序，是字典正文中的字在非聚集索引中的映射。

我們可以通過這種方式來找到您所需要的字，但它需要兩個過程，先找到目錄中的結(jié)果，然后再翻到您所需要的頁碼。

我們把這種目錄純粹是目錄，正文純粹是正文的排序方式稱為"非聚集索引"。

33、聚集索引與非聚集索引的區(qū)別是什么?

非聚集索引和聚集索引的區(qū)別在于，通過聚集索引可以查到需要查找的數(shù)據(jù)，而通過非聚集索引可以查到記錄對應(yīng)的主鍵值，再使用主鍵的值通過聚集索引查找到需要的數(shù)據(jù)。聚集索引和非聚集索引的根本區(qū)別是表記錄的排列順序和與索引的排列順序是否一致。

聚集索引（Innodb）的葉節(jié)點就是數(shù)據(jù)節(jié)點，而非聚集索引(MyisAM)的葉節(jié)點仍然是索引節(jié)點，只不過其包含一個指向?qū)?yīng)數(shù)據(jù)塊的指針。

34、創(chuàng)建索引時需要注意什么？

非空字段：應(yīng)該指定列為NOT NULL，除非你想存儲NULL。在 MySQL 中，含有空值的列很難進行查詢優(yōu)化，因為它們使得索引、索引的統(tǒng)計信息以及比較運算更加復(fù)雜。你應(yīng)該用0、一個特殊的值或者一個空串代替空值；

取值離散大的字段：（變量各個取值之間的差異程度）的列放到聯(lián)合索引的前面，可以通過count()函數(shù)查看字段的差異值，返回值越大說明字段的唯一值越多字段的離散程度高；

索引字段越小越好：數(shù)據(jù)庫的數(shù)據(jù)存儲以頁為單位一頁存儲的數(shù)據(jù)越多一次IO操作獲取的數(shù)據(jù)越大效率越高。唯一、不為空、經(jīng)常被查詢的字段的字段適合建索引

35、MySQL中CHAR和VARCHAR的區(qū)別有哪些？

char的長度是不可變的，用空格填充到指定長度大小，而varchar的長度是可變的。
char的存取數(shù)度還是要比varchar要快得多
char的存儲方式是：對英文字符（ASCII）占用1個字節(jié)，對一個漢字占用兩個字節(jié)。varchar的存儲方式是：對每個英文字符占用2個字節(jié)，漢字也占用2個字節(jié)。

36、MySQL 索引使用的注意事項

MySQL 索引通常是被用于提高 WHERE 條件的數(shù)據(jù)行匹配時的搜索速度，在索引的使用過程中，存在一些使用細節(jié)和注意事項。

函數(shù)，運算，否定操作符，連接條件，多個單列索引，最左前綴原則，范圍查詢，不會包含有NULL值的列，like 語句不要在列上使用函數(shù)和進行運算

1）不要在列上使用函數(shù)，這將導(dǎo)致索引失效而進行全表掃描。

select * from news where year(publish_time) < 2017

為了使用索引，防止執(zhí)行全表掃描，可以進行改造。

select * from news where publish_time < '2017-01-01'

還有一個建議，不要在列上進行運算，這也將導(dǎo)致索引失效而進行全表掃描。

select * from news where id / 100 = 1

為了使用索引，防止執(zhí)行全表掃描，可以進行改造。

select * from news where id = 1 * 100

2）盡量避免使用 != 或 not in或 <> 等否定操作符

應(yīng)該盡量避免在 where 子句中使用 != 或 not in 或 <> 操作符，因為這幾個操作符都會導(dǎo)致索引失效而進行全表掃描。盡量避免使用 or 來連接條件應(yīng)該盡量避免在 where 子句中使用 or 來連接條件，因為這會導(dǎo)致索引失效而進行全表掃描。

select * from news where id = 1 or id = 2

3）多個單列索引并不是最佳選擇

MySQL 只能使用一個索引，會從多個索引中選擇一個限制最為嚴格的索引，因此，為多個列創(chuàng)建單列索引，并不能提高 MySQL 的查詢性能。假設(shè)，有兩個單列索引，分別為 news_year_idx(news_year) 和 news_month_idx(news_month)?，F(xiàn)在，有一個場景需要針對資訊的年份和月份進行查詢，那么，SQL 語句可以寫成：

select * from news where news_year = 2017 and news_month = 1

事實上，MySQL 只能使用一個單列索引。為了提高性能，可以使用復(fù)合索引 news_year_month_idx(news_year, news_month) 保證 news_year 和 news_month 兩個列都被索引覆蓋。

4）復(fù)合索引的最左前綴原則

復(fù)合索引遵守“最左前綴”原則，即在查詢條件中使用了復(fù)合索引的第一個字段，索引才會被使用。因此，在復(fù)合索引中索引列的順序至關(guān)重要。如果不是按照索引的最左列開始查找，則無法使用索引。假設(shè)，有一個場景只需要針對資訊的月份進行查詢，那么，SQL 語句可以寫成：

select * from news where news_month = 1

此時，無法使用 news_year_month_idx(news_year, news_month) 索引，因為遵守“最左前綴”原則，在查詢條件中沒有使用復(fù)合索引的第一個字段，索引是不會被使用的。

5）覆蓋索引的好處

如果一個索引包含所有需要的查詢的字段的值，直接根據(jù)索引的查詢結(jié)果返回數(shù)據(jù)，而無需讀表，能夠極大的提高性能。因此，可以定義一個讓索引包含的額外的列，即使這個列對于索引而言是無用的。

6）范圍查詢對多列查詢的影響

查詢中的某個列有范圍查詢，則其右邊所有列都無法使用索引優(yōu)化查找。舉個例子，假設(shè)有一個場景需要查詢本周發(fā)布的資訊文章，其中的條件是必須是啟用狀態(tài)，且發(fā)布時間在這周內(nèi)。那么，SQL 語句可以寫成：

select * from news where publish_time >= '2017-01-02' and publish_time <= '2017-01-08' and enable = 1

這種情況下，因為范圍查詢對多列查詢的影響，將導(dǎo)致 news_publish_idx(publish_time, enable) 索引中 publish_time 右邊所有列都無法使用索引優(yōu)化查找。換句話說，news_publish_idx(publish_time, enable) 索引等價于 news_publish_idx(publish_time) 。對于這種情況，我的建議：對于范圍查詢，務(wù)必要注意它帶來的副作用，并且盡量少用范圍查詢，可以通過曲線救國的方式滿足業(yè)務(wù)場景。例如，上面案例的需求是查詢本周發(fā)布的資訊文章，因此可以創(chuàng)建一個news_weekth 字段用來存儲資訊文章的周信息，使得范圍查詢變成普通的查詢，SQL 可以改寫成：

select * from news where news_weekth = 1 and enable = 1

然而，并不是所有的范圍查詢都可以進行改造，對于必須使用范圍查詢但無法改造的情況，我的建議：不必試圖用 SQL 來解決所有問題，可以使用其他數(shù)據(jù)存儲技術(shù)控制時間軸，例如 Redis 的 SortedSet 有序集合保存時間，或者通過緩存方式緩存查詢結(jié)果從而提高性能。

7）索引不會包含有NULL值的列

只要列中包含有 NULL 值都將不會被包含在索引中，復(fù)合索引中只要有一列含有 NULL值，那么這一列對于此復(fù)合索引就是無效的。因此，在數(shù)據(jù)庫設(shè)計時，除非有一個很特別的原因使用 NULL 值，不然盡量不要讓字段的默認值為 NULL。

8）隱式轉(zhuǎn)換的影響

當查詢條件左右兩側(cè)類型不匹配的時候會發(fā)生隱式轉(zhuǎn)換，隱式轉(zhuǎn)換帶來的影響就是可能導(dǎo)致索引失效而進行全表掃描。下面的案例中，date_str 是字符串，然而匹配的是整數(shù)類型，從而發(fā)生隱式轉(zhuǎn)換。

select * from news where date_str = 201701

因此，要謹記隱式轉(zhuǎn)換的危害，時刻注意通過同類型進行比較。

9）like 語句的索引失效問題

like 的方式進行查詢，在 like “value%” 可以使用索引，但是對于 like “%value%” 這樣的方式，執(zhí)行全表查詢，這在數(shù)據(jù)量小的表，不存在性能問題，但是對于海量數(shù)據(jù)，全表掃描是非?？膳碌氖虑?。所以，根據(jù)業(yè)務(wù)需求，考慮使用 ElasticSearch 或 Solr 是個不錯的方案。

37、MySQL中有哪些索引？有什么特點？

普通索引：僅加速查詢
唯一索引：加速查詢 + 列值唯一（可以有null）
主鍵索引：加速查詢 + 列值唯一（不可以有null）+ 表中只有一個
組合索引：多列值組成一個索引，專門用于組合搜索，其效率大于索引合并
全文索引：對文本的內(nèi)容進行分詞，進行搜索
索引合并：使用多個單列索引組合搜索
覆蓋索引：select的數(shù)據(jù)列只用從索引中就能夠取得，不必讀取數(shù)據(jù)行，換句話說查詢列要被所建的索引覆蓋
聚簇索引：表數(shù)據(jù)是和主鍵一起存儲的，主鍵索引的葉結(jié)點存儲行數(shù)據(jù)(包含了主鍵值)，二級索引的葉結(jié)點存儲行的主鍵值。使用的是B+樹作為索引的存儲結(jié)構(gòu)，非葉子節(jié)點都是索引關(guān)鍵字，但非葉子節(jié)點中的關(guān)鍵字中不存儲對應(yīng)記錄的具體內(nèi)容或內(nèi)容地址。葉子節(jié)點上的數(shù)據(jù)是主鍵與具體記錄(數(shù)據(jù)內(nèi)容)

38、既然索引有那么多優(yōu)點，為什么不對表總的每一列創(chuàng)建一個索引呢？

當對表中的數(shù)據(jù)進行增加、刪除和修改的時候， 索引也要動態(tài)的維護，這樣就降低了數(shù)據(jù)的維護速度。
索引需要占物理空間，除了數(shù)據(jù)表占數(shù)據(jù)空間之外，每一個索引還要占一定的物理空間，如果要建立簇索引，那么需要的空間就會更大。
創(chuàng)建索引和維護索引要耗費時間，這種時間隨著數(shù)據(jù)量的增加而增加

39、索引如何提高查詢速度的

將無序的數(shù)據(jù)變成相對有序的數(shù)據(jù)（就像查有目的一樣）

40、使用索引的注意事項

在經(jīng)常需要搜索的列上，可以加快搜索的速度；
在經(jīng)常使用在where子句中的列上面創(chuàng)建索引，加快條件的判斷速度。
將打算加索引的列設(shè)置為NOT NULL，否則將導(dǎo)致引擎放棄使用索引而進行全表掃描
在經(jīng)常需要排序的列上創(chuàng)建索引，因為索引已經(jīng)排序，這樣查詢可以利用索引的排序，加快排序查詢時間
避免where子句中對字段施加函數(shù)，這會造成無法命中索引
在中到大型表索引都是非常有效的，但是特大型表的維護開銷會很大，不適合建索引，建立用邏輯索引
在經(jīng)常用到連續(xù)的列上，這些列主要是由一些外鍵，可以加快連接的速度
與業(yè)務(wù)無關(guān)時多使用邏輯主鍵，也就是自增主鍵在使用InnoDB時使用與業(yè)務(wù)無關(guān)的自增主鍵作為主鍵，即使用邏輯主鍵，而不要使用業(yè)務(wù)主鍵。
刪除長期未使用的索引，不用的索引的存在會造成不必要的性能損耗
在使用limit offset查詢緩存時，可以借助索引來提高性能。

41、增加B+樹的路數(shù)可以降低樹的高度，那么無限增加樹的路數(shù)是不是可以有最優(yōu)的查找效率？

不可以。因為這樣會形成一個有序數(shù)組，文件系統(tǒng)和數(shù)據(jù)庫的索引都是存在硬盤上的，并且如果數(shù)據(jù)量大的話，不一定能一次性加載到內(nèi)存中。有序數(shù)組沒法一次性加載進內(nèi)存，這時候B+樹的多路存儲威力就出來了，可以每次加載B+樹的一個結(jié)點，然后一步步往下找，

42、說一下數(shù)據(jù)庫表鎖和行鎖吧

表鎖

不會出現(xiàn)死鎖，發(fā)生鎖沖突幾率高，并發(fā)低。

MyISAM在執(zhí)行查詢語句（select）前，會自動給涉及的所有表加讀鎖，在執(zhí)行增刪改操作前，會自動給涉及的表加寫鎖。

MySQL的表級鎖有兩種模式：表共享讀鎖和表獨占寫鎖。

讀鎖會阻塞寫，寫鎖會阻塞讀和寫

對MyISAM表的讀操作，不會阻塞其它進程對同一表的讀請求，但會阻塞對同一表的寫請求。只有當讀鎖釋放后，才會執(zhí)行其它進程的寫操作。
對MyISAM表的寫操作，會阻塞其它進程對同一表的讀和寫操作，只有當寫鎖釋放后，才會執(zhí)行其它進程的讀寫操作。

MyISAM不適合做寫為主表的引擎，因為寫鎖后，其它線程不能做任何操作，大量的更新會使查詢很難得到鎖，從而造成永遠阻塞。

行鎖

會出現(xiàn)死鎖，發(fā)生鎖沖突幾率低，并發(fā)高。

在MySQL的InnoDB引擎支持行鎖，與Oracle不同，MySQL的行鎖是通過索引加載的，也就是說，行鎖是加在索引響應(yīng)的行上的，要是對應(yīng)的SQL語句沒有走索引，則會全表掃描，行鎖則無法實現(xiàn)，取而代之的是表鎖，此時其它事務(wù)無法對當前表進行更新或插入操作。

行鎖的實現(xiàn)需要注意：

行鎖必須有索引才能實現(xiàn)，否則會自動鎖全表，那么就不是行鎖了。
兩個事務(wù)不能鎖同一個索引。
insert，delete，update在事務(wù)中都會自動默認加上排它鎖。

行鎖的適用場景：

A用戶消費，service層先查詢該用戶的賬戶余額，若余額足夠，則進行后續(xù)的扣款操作；這種情況查詢的時候應(yīng)該對該記錄進行加鎖。

否則，B用戶在A用戶查詢后消費前先一步將A用戶賬號上的錢轉(zhuǎn)走，而此時A用戶已經(jīng)進行了用戶余額是否足夠的判斷，則可能會出現(xiàn)余額已經(jīng)不足但卻扣款成功的情況。

為了避免此情況，需要在A用戶操作該記錄的時候進行for update加鎖

43、SQL語法中內(nèi)連接、自連接、外連接（左、右、全）、交叉連接的區(qū)別分別是什么？

內(nèi)連接：只有兩個元素表相匹配的才能在結(jié)果集中顯示。

外連接：左外連接: 左邊為驅(qū)動表，驅(qū)動表的數(shù)據(jù)全部顯示，匹配表的不匹配的不會顯示。

右外連接:右邊為驅(qū)動表，驅(qū)動表的數(shù)據(jù)全部顯示，匹配表的不匹配的不會顯示。全外連接：連接的表中不匹配的數(shù)據(jù)全部會顯示出來。

交叉連接：笛卡爾效應(yīng)，顯示的結(jié)果是鏈接表數(shù)的乘積。

44、你知道哪些數(shù)據(jù)庫結(jié)構(gòu)優(yōu)化的手段？

范式優(yōu)化：比如消除冗余（節(jié)省空間。。）
反范式優(yōu)化：比如適當加冗余等（減少join）
限定數(shù)據(jù)的范圍：務(wù)必禁止不帶任何限制數(shù)據(jù)范圍條件的查詢語句。比如：我們當用戶在查詢訂單歷史的時候，我們可以控制在一個月的范圍內(nèi)。
讀/寫分離：經(jīng)典的數(shù)據(jù)庫拆分方案，主庫負責(zé)寫，從庫負責(zé)讀；
拆分表：分區(qū)將數(shù)據(jù)在物理上分隔開，不同分區(qū)的數(shù)據(jù)可以制定保存在處于不同磁盤上的數(shù)據(jù)文件里。這樣，當對這個表進行查詢時，只需要在表分區(qū)中進行掃描，而不必進行全表掃描，明顯縮短了查詢時間，另外處于不同磁盤的分區(qū)也將對這個表的數(shù)據(jù)傳輸分散在不同的磁盤I/O，一個精心設(shè)置的分區(qū)可以將數(shù)據(jù)傳輸對磁盤I/O競爭均勻地分散開。對數(shù)據(jù)量大的時時表可采取此方法?？砂丛伦詣咏ū矸謪^(qū)。

45、數(shù)據(jù)庫優(yōu)化中有一個比較常用的手段就是把數(shù)據(jù)表進行拆分，關(guān)于拆分數(shù)據(jù)表你了解哪些？

拆分其實又分垂直拆分和水平拆分

案例：簡單購物系統(tǒng)暫設(shè)涉及如下表：

1.產(chǎn)品表（數(shù)據(jù)量10w，穩(wěn)定）

2.訂單表（數(shù)據(jù)量200w，且有增長趨勢）

3.用戶表（數(shù)據(jù)量100w，且有增長趨勢）

以 MySQL 為例講述下水平拆分和垂直拆分，MySQL能容忍的數(shù)量級在百萬靜態(tài)數(shù)據(jù)可以到千萬

垂直拆分

解決問題：表與表之間的io競爭

不解決問題：單表中數(shù)據(jù)量增長出現(xiàn)的壓力

方案：把產(chǎn)品表和用戶表放到一個server上訂單表單獨放到一個server上

水平拆分

解決問題：單表中數(shù)據(jù)量增長出現(xiàn)的壓力

不解決問題：表與表之間的io爭奪

方案：用戶表 通過性別拆分為男用戶表和女用戶表，訂單表 通過已完成和完成中拆分為已完成訂單和未完成訂單，產(chǎn)品表 未完成訂單放一個server上，已完成訂單表盒男用戶表放一個server上，女用戶表放一個server上(女的愛購物哈哈)。

46、為什么MySQL索引要使用B+樹，而不是B樹或者紅黑樹？

我們在MySQL中的數(shù)據(jù)一般是放在磁盤中的，讀取數(shù)據(jù)的時候肯定會有訪問磁盤的操作，磁盤中有兩個機械運動的部分，分別是盤片旋轉(zhuǎn)和磁臂移動。盤片旋轉(zhuǎn)就是我們市面上所提到的多少轉(zhuǎn)每分鐘，而磁盤移動則是在盤片旋轉(zhuǎn)到指定位置以后，移動磁臂后開始進行數(shù)據(jù)的讀寫。那么這就存在一個定位到磁盤中的塊的過程，而定位是磁盤的存取中花費時間比較大的一塊，畢竟機械運動花費的時候要遠遠大于電子運動的時間。當大規(guī)模數(shù)據(jù)存儲到磁盤中的時候，顯然定位是一個非常花費時間的過程，但是我們可以通過B樹進行優(yōu)化，提高磁盤讀取時定位的效率。

為什么B類樹可以進行優(yōu)化呢？我們可以根據(jù)B類樹的特點，構(gòu)造一個多階的B類樹，然后在盡量多的在結(jié)點上存儲相關(guān)的信息，保證層數(shù)（樹的高度）盡量的少，以便后面我們可以更快的找到信息，磁盤的I/O操作也少一些，而且B類樹是平衡樹，每個結(jié)點到葉子結(jié)點的高度都是相同，這也保證了每個查詢是穩(wěn)定的。

特別地：只有B-樹和B+樹，這里的B-樹是叫B樹，不是B減樹，沒有B減樹的說法。

47、為什么MySQL索引采用B+樹而不用hash表和B樹？

利用Hash需要把數(shù)據(jù)全部 加載到內(nèi)存中，如果數(shù)據(jù)量大，是一件很 消耗內(nèi)存的事，而采用B+樹，是基于 按照節(jié)點分段加載，由此減少內(nèi)存消耗。
和業(yè)務(wù)場景有段， 對于唯一查找（查找一個值），Hash確實更快， 但數(shù)據(jù)庫中經(jīng)常查詢多條數(shù)據(jù)，這時候由于B+數(shù)據(jù)的有序性，與葉子節(jié)點又有鏈表相連，他的查詢效率會比Hash快的多。
b+樹的 非葉子節(jié)點不保存數(shù)據(jù)， 只保存子樹的臨界值（最大或者最?。?，所以同樣大小的節(jié)點， b+樹相對于b樹能夠有更多的分支，使得這棵樹更加矮胖，查詢時做的IO操作次數(shù)也更少。

48、MySQL中存儲索引用到的數(shù)據(jù)結(jié)構(gòu)是B+樹，B+樹的查詢時間跟樹的高度有關(guān)，是log(n)，如果用hash存儲，那么查詢時間是O(1)。既然hash比B+樹更快，為什么MySQL用B+樹來存儲索引呢？

一、從內(nèi)存角度上說，數(shù)據(jù)庫中的索引一般是在磁盤上，數(shù)據(jù)量大的情況可能無法一次性裝入內(nèi)存，B+樹的設(shè)計可以允許數(shù)據(jù)分批加載。

二、從業(yè)務(wù)場景上說，如果只選擇一個數(shù)據(jù)那確實是hash更快，但是數(shù)據(jù)庫中經(jīng)常會選中多條，這時候由于B+樹索引有序，并且又有鏈表相連，它的查詢效率比hash就快很多了。

49、關(guān)系型數(shù)據(jù)庫的四大特性在得不到保障的情況下會怎樣？

ACID，原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)

我們以從A賬戶轉(zhuǎn)賬50元到B賬戶為例進行說明一下ACID這四大特性。

原子性

原子性是指一個事務(wù)是一個不可分割的工作單位，其中的操作要么都做，要么都不做。即要么轉(zhuǎn)賬成功，要么轉(zhuǎn)賬失敗，是不存在中間的狀態(tài)！

如果無法保證原子性會怎么樣？

OK，就會出現(xiàn)數(shù)據(jù)不一致的情形，A賬戶減去50元，而B賬戶增加50元操作失敗。系統(tǒng)將無故丟失50元~

一致性

一致性是指事務(wù)執(zhí)行前后，數(shù)據(jù)處于一種合法的狀態(tài)，這種狀態(tài)是語義上的而不是語法上的。那什么是合法的數(shù)據(jù)狀態(tài)呢？這個狀態(tài)是滿足預(yù)定的約束就叫做合法的狀態(tài)，再通俗一點，這狀態(tài)是由你自己來定義的。滿足這個狀態(tài)，數(shù)據(jù)就是一致的，不滿足這個狀態(tài)，數(shù)據(jù)就是不一致的！

如果無法保證一致性會怎么樣？

例一:A賬戶有200元，轉(zhuǎn)賬300元出去，此時A賬戶余額為-100元。你自然就發(fā)現(xiàn)了此時數(shù)據(jù)是不一致的，為什么呢？因為你定義了一個狀態(tài)，余額這列必須大于0。
例二:A賬戶200元，轉(zhuǎn)賬50元給B賬戶，A賬戶的錢扣了，但是B賬戶因為各種意外，余額并沒有增加。你也知道此時數(shù)據(jù)是不一致的，為什么呢？因為你定義了一個狀態(tài)，要求A+B的余額必須不變。

隔離性

隔離性是指多個事務(wù)并發(fā)執(zhí)行的時候，事務(wù)內(nèi)部的操作與其他事務(wù)是隔離的，并發(fā)執(zhí)行的各個事務(wù)之間不能互相干擾。

如果無法保證隔離性會怎么樣？

假設(shè)A賬戶有200元，B賬戶0元。A賬戶往B賬戶轉(zhuǎn)賬兩次，金額為50元，分別在兩個事務(wù)中執(zhí)行。如果無法保證隔離性，A可能就會出現(xiàn)扣款兩次的情形，而B只加款一次，憑空消失了50元，依然出現(xiàn)了數(shù)據(jù)不一致的情形！

持久性

根據(jù)定義，持久性是指事務(wù)一旦提交，它對數(shù)據(jù)庫的改變就應(yīng)該是永久性的。接下來的其他操作或故障不應(yīng)該對其有任何影響。

如果無法保證持久性會怎么樣？

在MySQL中，為了解決CPU和磁盤速度不一致問題，MySQL是將磁盤上的數(shù)據(jù)加載到內(nèi)存，對內(nèi)存進行操作，然后再回寫磁盤。好，假設(shè)此時宕機了，在內(nèi)存中修改的數(shù)據(jù)全部丟失了，持久性就無法保證。

設(shè)想一下，系統(tǒng)提示你轉(zhuǎn)賬成功。但是你發(fā)現(xiàn)金額沒有發(fā)生任何改變，此時數(shù)據(jù)出現(xiàn)了不合法的數(shù)據(jù)狀態(tài)，我們將這種狀態(tài)認為是數(shù)據(jù)不一致的情形。

50、數(shù)據(jù)庫如何保證一致性？

分為兩個層面來說。

從數(shù)據(jù)庫層面，數(shù)據(jù)庫通過原子性、隔離性、持久性來保證一致性。也就是說ACID四大特性之中，C(一致性)是目的，A(原子性)、I(隔離性)、D(持久性)是手段，是為了保證一致性，數(shù)據(jù)庫提供的手段。 數(shù)據(jù)庫必須要實現(xiàn)AID三大特性，才有可能實現(xiàn)一致性。例如，原子性無法保證，顯然一致性也無法保證。
從應(yīng)用層面，通過代碼判斷數(shù)據(jù)庫數(shù)據(jù)是否有效，然后決定回滾還是提交數(shù)據(jù)！

51、數(shù)據(jù)庫如何保證原子性？

主要是利用 Innodb 的undo log。undo log名為回滾日志，是實現(xiàn)原子性的關(guān)鍵，當事務(wù)回滾時能夠撤銷所有已經(jīng)成功執(zhí)行的 SQL語句，他需要記錄你要回滾的相應(yīng)日志信息。例如

當你delete一條數(shù)據(jù)的時候，就需要記錄這條數(shù)據(jù)的信息，回滾的時候，insert這條舊數(shù)據(jù)
當你update一條數(shù)據(jù)的時候，就需要記錄之前的舊值，回滾的時候，根據(jù)舊值執(zhí)行update操作
當年insert一條數(shù)據(jù)的時候，就需要這條記錄的主鍵，回滾的時候，根據(jù)主鍵執(zhí)行delete操作

undo log記錄了這些回滾需要的信息，當事務(wù)執(zhí)行失敗或調(diào)用了rollback，導(dǎo)致事務(wù)需要回滾，便可以利用undo log中的信息將數(shù)據(jù)回滾到修改之前的樣子。

52、數(shù)據(jù)庫如何保證持久性？

主要是利用Innodb的redo log。重寫日志，正如之前說的，MySQL是先把磁盤上的數(shù)據(jù)加載到內(nèi)存中，在內(nèi)存中對數(shù)據(jù)進行修改，再寫回到磁盤上。如果此時突然宕機，內(nèi)存中的數(shù)據(jù)就會丟失。怎么解決這個問題？簡單啊，事務(wù)提交前直接把數(shù)據(jù)寫入磁盤就行啊。這么做有什么問題？

只修改一個頁面里的一個字節(jié)，就要將整個頁面刷入磁盤，太浪費資源了。畢竟一個頁面16kb大小，你只改其中一點點東西，就要將16kb的內(nèi)容刷入磁盤，聽著也不合理。
畢竟一個事務(wù)里的SQL可能牽涉到多個數(shù)據(jù)頁的修改，而這些數(shù)據(jù)頁可能不是相鄰的，也就是屬于隨機IO。顯然操作隨機IO，速度會比較慢。

于是，決定采用redo log解決上面的問題。當做數(shù)據(jù)修改的時候，不僅在內(nèi)存中操作，還會在redo log中記錄這次操作。當事務(wù)提交的時候，會將redo log日志進行刷盤(redo log一部分在內(nèi)存中，一部分在磁盤上)。當數(shù)據(jù)庫宕機重啟的時候，會將redo log中的內(nèi)容恢復(fù)到數(shù)據(jù)庫中，再根據(jù)undo log和binlog內(nèi)容決定回滾數(shù)據(jù)還是提交數(shù)據(jù)。

采用redo log的好處？

其實好處就是將redo log進行刷盤比對數(shù)據(jù)頁刷盤效率高，具體表現(xiàn)如下：

redo log體積小，畢竟只記錄了哪一頁修改了啥，因此體積小，刷盤快。
redo log是一直往末尾進行追加，屬于順序IO。效率顯然比隨機IO來的快。

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

MySQL面試重點篇27問27答

26、數(shù)據(jù)庫三大范式精講

第一范式

第二范式

第三范式

27、數(shù)據(jù)庫三大范式精要總結(jié)

28、MySQL常見的存儲引擎InnoDB、MyISAM的區(qū)別？適用場景分別是？

29、事務(wù)四大特性（ACID）原子性、一致性、隔離性、持久性？

第一種回答

第二種回答

30、SQL中的NOW()和CURRENT_DATE()兩個函數(shù)有什么區(qū)別？

31、什么是聚合索引 ？

32、什么是非聚合索引?

33、聚集索引與非聚集索引的區(qū)別是什么?

34、創(chuàng)建索引時需要注意什么？

35、MySQL中CHAR和VARCHAR的區(qū)別有哪些？

36、MySQL 索引使用的注意事項

37、MySQL中有哪些索引？有什么特點？

38、既然索引有那么多優(yōu)點，為什么不對表總的每一列創(chuàng)建一個索引呢？

39、索引如何提高查詢速度的

40、使用索引的注意事項

41、增加B+樹的路數(shù)可以降低樹的高度，那么無限增加樹的路數(shù)是不是可以有最優(yōu)的查找效率？

42、說一下數(shù)據(jù)庫表鎖和行鎖吧

表鎖

行鎖

43、SQL語法中內(nèi)連接、自連接、外連接（左、右、全）、交叉連接的區(qū)別分別是什么？

44、你知道哪些數(shù)據(jù)庫結(jié)構(gòu)優(yōu)化的手段？

45、數(shù)據(jù)庫優(yōu)化中有一個比較常用的手段就是把數(shù)據(jù)表進行拆分，關(guān)于拆分數(shù)據(jù)表你了解哪些？

46、為什么MySQL索引要使用B+樹，而不是B樹或者紅黑樹？

47、為什么MySQL索引采用B+樹而不用hash表和B樹？

48、MySQL中存儲索引用到的數(shù)據(jù)結(jié)構(gòu)是B+樹，B+樹的查詢時間跟樹的高度有關(guān)，是log(n)，如果用hash存儲，那么查詢時間是O(1)。既然hash比B+樹更快，為什么MySQL用B+樹來存儲索引呢？

49、關(guān)系型數(shù)據(jù)庫的四大特性在得不到保障的情況下會怎樣？

原子性

如果無法保證原子性會怎么樣？

一致性

如果無法保證一致性會怎么樣？

隔離性

如果無法保證隔離性會怎么樣？

持久性

50、數(shù)據(jù)庫如何保證一致性？

51、數(shù)據(jù)庫如何保證原子性？

52、數(shù)據(jù)庫如何保證持久性？