零基礎 SQL 資料庫小白,從入門到精通的學習路線與書單

數據分析那些事
17 min readNov 1, 2021

--

一,學SQL的苦惱

我觀察了 865 個 SQL 入門者,發現大家在學習 SQL 的時候,最大的問題不是 SQL 語法,而是對 SQL 原理的不熟悉。

很多初學者,往往被 SQL 能做什麼,為什麼會有 SQL 這門語言給迷惑到了。他們用學英語的方法,去學SQL,結果發現什麼都學不到,而且感覺越來越難學,難用。想想你為什麼討厭英語就明白了,每次翻開詞典,從 abandon 學起來,不到 10 頁就學不下去了,不就是因為太枯燥,太乏味了嘛。

假如我告訴你,聽聽音樂 yesterday once more, 看看電影 iron man 就能輕鬆學好英語,是不是覺得有趣多了?學 SQL 和學英語一樣,選擇枯燥的學習模式,必然帶來不好的學習結果。我們追求的是輕鬆學 SQL 的方法。

二,SQL 的原理

SQL 的原理,超級簡單,四個字,集合運算。

所有複雜的 SQL 語句,命令都是圍繞著這個本質在做文章,添油加醋。

如果對集合這個概念陌生,沒關係,高中畢業那麼久,不記得情有可原。畢竟當時老師也不知道,風靡全球的 SQL 會基於集合理念發明出來。

集合,最簡單的例子就是陣列,比如 { a, b, c, d}。舉個形象化的例子,比如大學全班同學,這是個大集合,按照性別進而可以分成男同學集合和女同學集合。

男同學有什麼特徵?高大,威猛,有鬍子。

女同學有什麼特徵?白嫩,溫柔,有長髮。

就這樣,我們有兩個大集合了,男同學集合,女同學集合。回到 SQL 的原理上來,針對這兩個集合,SQL 運算做的事情,無非就是這幾樣:

1、尋找身高大於180cm的男同學
2、尋找身高最高的男同學
3、尋找有鬍子的男同學
4、尋找長了鬍子,身高低於160cm的男同學
5、統計沒有長鬍子的男同學人數
6、尋找最高的女同學
7、尋找最白的女同學
8、尋找又高又白的女同學
9、尋找正在談戀愛的男女同學
10、尋找曾經談過戀愛,而現在又有其他男女朋友的男同學和女同學

你看,無非就是做這些事情。是不是對SQL立馬就有好感了呢!

三,SQL 的數學基礎

如此有趣的一件事情,教科書偏要說的枯燥(希望下面離散數學,集合理論的科普不會煩到你,不想看,完全可以跳過)

1、交換律(Commutative Laws):
A ∪ B = B∪A, A ∩ B = B ∩ A

2、結合律(Associative Laws):
(A ∪ B) ∪ C = A ∪ (B∪C) = A ∪ B∪C
(A ∩ B) ∩ C = A ∩ (B ∩ C) = A ∩ B ∩ C

3、分配律(Distributive Laws):
(A ∩ B) ∪C = (A∪C) ∩ (B∪C)
(A∪B) ∩ C = (A ∩ C) ∪(B ∩ C)

4、等冪律(Impotent laws):
A∪A = A,A∩A = A

5、吸收律(Absorption laws):
(A∩B)∪A = A,(A∪B)∩A = A

6、同一律(Domination laws):
A∪Ø = A,A∩Ω= A
A∪Ω=Ω,A∩Ø = Ø;

參考:http://math001.com/laws_of_set_theory/
這羅列了詳細的集合運算數學表示式。

所以,千萬別被教科書上的數學符號嚇到,而失去了學習SQL的興趣。學霸別聽我的,這些符號我知道對你完全是小菜一碟。

四,SQL基礎問題

下面我們用SQL來回答上面的10個男女同學問題:

1、把全班男女同學登記到花名冊上
2、找班上的八卦同學打聽男女朋友關係,記錄到戀愛關係秘本上

這裡用到的花名冊,戀愛關係秘本就是資料庫裡的二維表。先建這兩張表,分別是 Students(花名冊表),Relationships(戀愛關係秘本)。為了更加形象,用 Excel 展示下,這兩張表分別長這個樣子:

第一張表是 Students 花名冊表,共有 6 欄,分別解釋下含義:

﹣StudentId: 用來標註學生的學號,一個學生只有一個學號;
﹣Name:學生姓名;
﹣Gender:學生性別;
﹣Height:學生身高,cm 為單位
﹣Mustache:有無鬍子;
﹣SkinColor:膚色

第二張表是 Relationships(戀愛關係秘本),共有 6 欄,分別解釋下:

﹣RelationshipId: 男女朋友關係成立的編號,用來確立兩人曾經處過或正在處於關係之中;
﹣BoyId:男生編號;
﹣GirlId:女生編號;
﹣BeginDate:關係成立日期;
﹣CurrentActive:當前是否還在戀愛期;Y 表示正在戀愛;N 表示已經分手;
﹣EndDate:分手日期

注意:欄位在資料庫中被稱為欄位

用 SQL 語句來表達建表的命令:

Students:

Create Table dbo.Students(
StudentId Varchar(10),
Name Nvarchar(200),
Gender Nvarchar(1),
Height Numeric(4,1),
Mustache Varchar(3),
SkinColor Nvarchar(1)
);
Relationships:

Create Table dbo.Relationships(
RelationshipId Int,
BoyId Varchar(10),
GirlId Varchar(10),
BeginDate Datetime,
CurrentActive Varchar(1),
EndDate Datetime
);

注意:欄位旁邊必須加上資料型別,規範資料長度,精度,比如 varchar(3) 表示 3 個字長。
有關資料型別,可以參考參考官方文件對基本資料型別的定義和舉例

五,線上執行SQL工具

推薦可線上執行SQL的工具: http://sqlfiddle.com/

這款工具,有兩大特點:

1、支援六大資料庫,MySQL,Oracle,SQL Server,PostgreSQL,SQLite;
2、支援線上編輯及執行SQL,無需自搭資料庫環境

簡單瞭解下:

整個頁面分為1,2,3個區域。

區域 1 的編輯器用來建立資料庫 schema ,比如建表,新建資料;
區域 2 則用來編輯和執行 SQL;
區域 3 用來展示 區域 2 中的 SQL 執行結果

使用這款工具,無需你手工安裝資料庫便可以完成本指南所有的 SQL.

完美!我們成功的完成了第一步。

六,SQL 簡易實戰

接下來,讓我們為巧婦準備好精米。

INSERT

使用這條 SQL 命令,將新增全班同學的個人資訊,包括姓名,學號,性別,身高,膚色,有無鬍子,以及男女朋友關係,(當然這可不能讓班主任知道。)

INSERT INTO Students(
StudentId,
Name,
Gender,
Height,
Mustache,
SkinColor
)
Values
('001',N'陈冠奇',N'男',186,'No',N'白'),
('002',N'谢堂风',N'男',182,'No',N'白'),
('003',N'黄博',N'男',176,'Yes',N'黑'),
('004',N'李少杰',N'男',172,'Yes',N'黑'),
('005',N'徐少斌',N'男',163,'No',N'黑'),
('006',N'张白芷',N'女',172,'No',N'白'),
('007',N'张少函',N'女',163,'No',N'白'),
('008',N'灵昆',N'女',181,'No',N'黑'),
('009',N'夏平',N'女',158,'No',N'白'),
('010',N'莫文丽',N'女',156,'No',N'白')
INSERT INTO Relationships(
RelationshipId,
BoyId,
GirlId,
BeginDate,
CurrentActive,
EndDate
)
Values
(1001,'001','006','2002-04-01','Y',null),
(1002,'003','009','2001-04-01','Y',null),
(1003,'005','010','2003-04-01','N','2004-04-01'),
(1004,'002','010','2004-04-01','N','2004-05-01'),
(1005,'004','010','2004-05-01','N','2005-08-01')

接下來我們用 SQL 做一些有意思的事情:

查詢身高大於180cm的男同學:

SELECT Name
FROM Students
WHERE Height > 180 and Gender = N'男'

查詢身高大於170cm的膚白女同學:

SELECT Name 
FROM Students
WHERE Height> 170 and SkinColor = N'白' and Gender = N'女'

查詢最高的女同學:

SELECT Name
FROM Students
WHERE Height = (SELECT MAX(Height) FROM Students WHERE Gender = N’女’ )
and Gender = N’女’

查詢有戀愛關係的同學:

SELECT Boy.Name as BoyName,
Girl.Name AS GirlName
FROM Relationships Rel
INNER JOIN Students Boy on Rel.BoyId = Boy.StudentId
INNER JOIN Students Girl on Rel.GirlId = Girl.StudentId

最帥的陳冠奇居然留鬍子了,讓我們記錄下:

UPDATE Students 
SET Mustache = ‘Yes’
WHERE Name = N’陳冠奇’

帥奇留鬍子的原因居然是,陳冠奇和張白芷前兩天分手了,我們要記錄這段關係的破裂:

UPDATE Relationships
SET CurrentActive = ‘N’,
EndDate = ‘2008–04–01’
WHERE BoyId = (SELECT StudentId FROM Students WHERE Name = N’陳冠奇’) AND
GirlId = (SELECT StudentId FROM Students WHERE Name = N’張白芷’)

任何的痛苦都離不開戀人的離去,張白芷居然去國外留學了,因此花名冊少了這個人:

DELETE Students 
WHERE Name = N’張白芷’

帥帥的陳冠奇,怎麼甘心就此沉淪,他又找了莫文麗做女朋友:

INSERT INTO Relationships(
RelationshipId,
BoyId,
GirlId,
BeginDate,
CurrentActive,
EndDate
)
Values
(1006,’001',’010',’2008–04–01',’Y’,null)

好奇的小樂,查了查莫文麗的後臺,發現她居然曾有過三次戀愛關係:

SELECT RelationshipId 
FROM Relationships
WHERE GirlId = (SELECT StudentId FROM Students WHERE Name = N’莫文麗’)

恭喜!到此為止,所有的SQL基本操作你都會了。

七,SQL 晉級分水嶺

有競爭力的技術肯定是要花大功夫來磨鍊的,否則人人看一遍就會的東西,賣得出什麼高價呢!

因此當大家都度過第一階段之後,如何意識到還有第二階段,第三階段,甚至第四階段就很重要了。那會影響你的長期發展。舒適區是留給平庸者的。

從技術角度,我們習慣將 SQL 資料庫開發分為 4 個階段:入門,初級,高階,資深。

注:技術角度可分這四個階段,並不代表做到資深,你一定能年薪百萬。可千萬別這麼想,很多朋友諮詢我的第一個問題是,“黃老師,以我的水平,能要個30K不?” 這我不打包票,能做到什麼收入完全看你水平和天意(沒錯,很多時候,賺大錢靠運!)

在本文中,我只談 SQL 技術水平的晉級,不談其他。

上面的入門指南,相信你看完之後,寫 SQL 基本掌握了。這一階段過後,就是要透過反覆的操練這些 SQL ,直到你熟透這些 SQL 命令和語法。

幫你度過這階段最好的方式,是什麼呢?刷題。沒錯,簡單粗暴。這裡推薦牛客網,你可以試著去刷:

左邊是題目,右邊編輯 SQL, 點選【儲存並除錯】即可執行 SQL。系統會提示,你的答案是否透過!

刷完這 60 多道題目,相信你的感覺一定很好!

再推薦基本經典的小書,可以兼顧理論與實戰,具體看哪一本,依據你使用的資料庫軟體來:

●《SQL 必知必會》(綜合)
●《T-SQL Querying》中文《T-SQL 查詢》(SQL Server適用)
●《Oracle程式設計藝術》(Oracle適用,只要是 ASK Tom 主編 Thomas Kyte 的著作不會錯)

八,SQL 資料庫深入學習

當你跨過了第二個階段,所有的 SQL 命令都會了,看到 SQL 題目也有自信了,自認為天下資料,為 SQL 皆可取的時候,你應該來挑戰下高難度了

當然如果你跟我一樣,對紙質書情有獨鍾的話,這裡推薦幾本:

綜合類的資料庫調優書:

●《資料庫索引設計與最佳化》
●《資料查詢最佳化器的藝術》

Oracle 相關調優書:

●《Oracle Concepts》
●《Oracle 體系架構》
●《Oracle DBA 手記》(雲和恩墨出品都是精品)

MySQL 相關調優書:

●《高效能 MySQL》

SQL Server 相關調優書:

●《Inside SQL Server 》系列
●《T-SQL 效能調優密集-基於 SQL Server 2012 視窗函式》

這些書看下來應該會耗掉你2–3年的時間。當然,如果你願意痛飲咖啡,用007(一週工作7天,每天連續12個小時)的速度來看書,那也可能1年左右就夠了。但不建議這麼幹,身體健康比什麼都重要!

九,SQL 人的職業生涯

當任何超過5秒的SQL,在你手下都變成了秒出時,你可能會昂天長嘯,“老子終於天下第一啦”。不過且慢,你別忘記了,你還是會被專案經理催著幹活,比如改個欄位,改個需求,改處bug等等。此時,你恐怕最需要的是,一個得力的左膀右臂,一個能打的需求分析,更重要的是搞定靈活多變的業務變更,甚至你要挽起袖子,自己盯著業務變更,釋出更靈活適配的資料模型。此時資料建模,業務管理,資料治理,資料探勘,安全稽核等等都來了

此時,正是你職業生涯的分水嶺。

若你覺得你就是幹不了開會,扯皮,來回折騰的活兒,就喜歡指揮機器幹活,那就選擇偏技術的方向,比如運維DBA,資料庫研發。從事這條路線,意味著你要懂的更多的邊角料知識,比如作業系統,網路協議,自動化程式設計,架構設計,分散式計算,雲計算等。這些知識資料早已有現成的資料可以參考,只要耐得下心來學,一定有成功出頭的那一天。但也極其容易放棄,因為東西實在太多,太雜,而且有些邊緣性的學科,一時半會你還用不到,比如網路協議。但如果不懂網路協議,碰到資料庫安全的問題,你就容易敗下陣來,死的很慘。你的任何一個缺點都會伴隨每一次的故障而被無限放大,被很多同事視為毫無戰鬥力,讓你自己都開始懷疑自己,鄙視自己。所以幹這行,首先要有一顆強大的心臟,在無數的口誅筆伐之下,你要堅挺自己的信念,不要懷疑自己的判斷,丟失基本判斷能力。

且運維不僅僅是個智力活,還是個體力活。

白天所有執行在資料庫上的應用都好好地跑著,一般不會有大問題,看上去 DBA 很輕鬆。但是一到晚上,你們的活兒才剛剛開始。有索引重建,磁碟告警了;有 ETL Job 失敗,資料庫卡住了;有叢集節點宕機,需要更換機器了,等等。總之 7*24 的重活,累活都來了,而且是必須趕在天亮業務開始之前修復。有時候,那些夜貓子也很兇悍,大晚上非還要搶點貨,點個夜宵啥的。一下單,系統崩潰了,你的美夢也就泡湯了。或許你感冒了,正在休息,不行你得起來;或許你正在電影院看著復聯呢,不行,你得回公司。總之,為了工作,為了搶修資料庫,你必須第一時間趕赴現場。多少年輕的DBA都曾在高壓現場,留下了人生中第一口鮮血。

你說DBA那麼累,傻子才選,你走第二條路,扯皮!

恭喜你,你選了一條可以通向公司高層的路。也許是 CTO,也許是CEO。透過做資料執行,資料產品,或者資料分析,你認識了全公司上上下下的大小頭目,今天與運營總監吃個飯,明天與生產總監喝個咖啡。總之他們提的一切需求,都希望你全部搞定。你說你團隊人手不夠,公司不肯招人,跟他們有什麼關係?你說你excel就能實現的功能,為什麼非要整一套炫酷而無任何實用價值的視覺化報表分析軟體?他們就想要!你說你這個需求要1個月才能做好,他們拍著你的肩膀說,“你可以的,要相信自己。倆天,頂多兩天就能搞定!”

你帶著這麼多需求回到你的辦公室,看著滿臉青春的這些小夥小姑娘們,刷著微博,舔著朋友圈,個個臉上洋溢著熱焦瑪的香氣。你好忍心讓他們陪你加班到凌晨,還自費打滴滴麼!

好不容易,2個shot的星爸爸熱焦瑪下肚,你來了精神。熬到凌晨2點,連續2,3天回家看不到老婆/老公的笑臉,還給自己打氣,一切都是為了家庭。等到交上報告一看,“這裡資料改一下,口徑要和運營部統一”,“哪裡整個版面太醜了,影響公司形象,再修得漂亮一些。還有,這些報表都要加上許可權,不能讓其他部門人看到。好吧,明天下班前我們再談”。

好吧,這回你只得厚起臉皮請小朋友們一起改了,晚餐自費交了KFC全家桶,全組加班人員,一律打車報銷。你默默的在群裡丟了一個又一個紅包。收到一個又一個的“老闆帥氣,老闆再來一個,寶寶沒搶到”

終於趕在deadline之前做完了,“怎麼樣,我說你可以的吧,看好你哦。這樣,我們昨天幾個人會後碰了下,發現你原來的設計也挺好,只是稍微還要再改改;還有,資料需要增加匯入匯出功能…”

如此反反覆覆,來來回回的折騰,某天你突然感慨,原來“別人用了一年,真的學到了我十年所用會的SQL技術”。此時,你會堅持自己的選擇是對的嗎,假如不幸的是,公司投資人撤資了,你所熟悉的環境沒了,怎麼辦?

因此,在這些零零碎碎的專案鍛鍊中,你能否總結有效的規律,提高自己業務溝通的能力,掌握資料治理的策略,嚴格把控專案管理的進度,都成了你的必修課。一旦鬆懈和迷茫,可真是萬劫不復!

十,SQL 資料庫必讀書單

如果你選的是 DBA,除了各家資料庫文件要通讀之外,還需要補充雲計算相關:

●《資料庫系統實現》
●《雲計算通俗講義》
●《讓雲落地:雲計算服務模式》
●《雲計算架構技術與實踐》
●《Kubernates權威指南》
●《微服務架構設計模式》

如果你選的是業務設計(無論是運營,產品,資料分析,尤其是資料分析師),那麼這些書,肯定是要讀一讀的

Kimball 的系列書:

●《維度建模權威指南》
●《資料倉庫與商業智慧寶典-成功設計、部署和維護 DW/BI 系統》

業務場景解決方案:

●《計算廣告》
●《推薦系統實戰》
●《決戰大資料》
●《大資料之路-阿里巴巴大資料實踐》
●《企業IT架構轉型之道》
●《設計資料密集型應用》

大數據系列:

●《Hadoop 權威指南》
●《Spark 權威指南》
●《Hive 程式設計》
●《Hive 實戰》
●《Spark 高階資料分析》
●《Hadoop構建資料倉庫實踐》

以上就是基本路線了,能在5–10年搭好這個基礎,你定當可以獨當一面。

立即試用FineBI免費版:

https://intl.finebi.com/zh-tw/trial?utm_source=Medium_Banner

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

如何避免分析兩分鐘,運行兩小時?這是一份SQL優化大全

资料分析师的SQL要学到什么程度?

一道SQL面試題,為什麼能淘汰494位候選人

--

--

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/