為什麽我們仍在使用 SQL?
SQL 和關聯式資料庫管理系統(RDBMS)都是在上世紀70 年代早期開發的。Edgar F. Codd 開發了 RDBMS,而 Donald D. Chamberling 和 Raymond F. Boyce 開發了 SQL。
二者都誕生在電腦技術的早期,而且在 90% 的時間裏都非常有效,使得資料庫成為了一項 「已經被解決的問題」。就像 MailChimp 已經成為了發送新聞簡訊的同義詞。如果你想使用資料庫,你就得使用 RDBMS 和 SQL。
不過,仍然還是有人使用其他 email 軟體,正如還是用人使用非 SQL 的資料庫。但即使是存在著其他可供使用的資料庫技術,SQL 依舊占據霸主地位。
以下 8 條,就是我們在 SQL 誕生 50 年後依舊使用它的原因。
一、數據處理能力
SQL 最初基於關系代數和元組關系演算——由 Codd 特別為關聯式資料庫開發的兩種數學模式。
所以,SQL 是特別為處理數據而設計的,而事實證明,它非常善於存取和組織數據。
那麽第一個原因就是:作為一種資料庫技術,SQL 非常稱職。
二、實踐檢驗
RDBMS 已經問世很長時間了,所以已經用於了大量不同的情況。在 「前網路時代」,它就作為線下資料庫使用,到如今,有了重大修改的 SQL 資料庫,仍在 Facebook 這樣的全球性 app 中扮演中核心角色——RDBMS 和 SQL 已經久經沙場。而在眾多產品中執行過的無數個小時,證明了它們是可信賴的。
有些軟體就是能解決問題,尤其是當你在處理充斥著遺失、損壞和失敗等問題的資料庫時,這種優勢尤為明顯。作為成熟的軟體,SQL 有著備份計劃、變化管理和操作嚴謹性,而這些會使棘手的情況大為好轉。
因此,SQL 資料庫幾乎總是最好的選擇。
三、知識和社群
當事物存在一段時間之後,圍繞著它的知識體系就會被建立。SQL 也不例外。最過去的時間裏,大量的 SQL 知識被寫成文件,SQL 社群快速發展,許許多多的技術人才成長了起來。
因為 SQL 社群如此活躍,SQL 文件又如此豐富,所以它便吸引了大量的人才和商業活動。而又因為 SQL 吸引了大量的人才,所以 SQL 社群更加壯大,知識更加深入。
這就是多年來 SQL 的發展狀況。
四、簡單
電腦語言發展了這麽久,直到今天,SQL 仍然是一種非常易學的語言。短短幾天,你就可以學會基本的功能,能夠進行查詢和返回數據。非常簡單。
即使是傳統意義上的非技術崗位,比如市場,公司高管,以及非技術性的產品經理,都會去學習基本的 SQL 功能,來支持他們的工作。
而深入地了解 SQL 基於的關系型資料庫系統,完全是另一件事。對於大多數只需要使用查詢功能的人來說,SQL 真是太好用了。
五、高度普及
因為有半數的開發者都會使用 SQL 和 RDBMS,所以我們可以肯定地說,這兩者高度普及。這絕不是一件壞事。正如上文所說,由於使用人數多,相關知識和社群得以快速發展。而又由於其簡單,故而對於開發者以及其他相關人員來說,SQL 知識幾乎是常識。
於是,相關知識就極易在公司、產業之間傳播,人才儲備充足。而這又反過來促進了知識的創造和社群的成長。
可見,SQL 資料庫普及度極高的特性,已經為其自身的成長構築了一個良性迴圈。
六、開源及互操作性
從 1995 年至今,開源的 SQL 技術(MySQL 和 PostgreSQL)已經成為了主要的 SQL 資料庫技術。
圖源:Stack Overflow
2023年,Stack Overflow面向90000名開發人員進行的一項調查顯示,PostgreSQL在資料庫引擎的選擇上領先於MySQL,這與往年的調查相比有了顯著變化。
這種向開源 SQL 資料庫切換的趨勢,對於已經規模龐大的 SQL 社群來說是一件好事。
同時這種趨勢的存在也印證了,SQL 社群中的開發者們正在努力地使 SQL 變得更好。
七、能用 SQL 誰還寫程式碼?
坊間流傳著這樣一句話……
能用 SQL server 做好的事情就別寫程式碼。
這句話背後的邏輯是,在絕大多數情況下,SQL 都能找到最有效的辦法來完成你的任務,而且做得比任何能自己寫程式碼來解決的人更好。
舉個例子。假設我們需要建立一份關於 「加利福尼亞 2020 年第三季稅收」 的報告,具體做法是,選出列表中加利福尼亞的使用者,並按照數據進行排列。那麽你只需要一句 SQL 語句就可以完成:
SELECTSUM(Value_USD) AS California_Revenue_Q3 FROM Transactions WHERE Location = ‘California’ ANDDATEPART(q, Date) = 3ANDYEAR(Date) = 2020;
而如果你要按照不同的地區對數據進行分解,那麽 SQL 語句是這樣的:
SELECT Location, SUM(Value_USD) AS Revenue_Q3 FROM Transactions WHEREDATEPART(q, Date) = 3ANDYEAR(Date) = 2020GROUPBY Location ORDERBY Location;
如果你想得到稅收最高的 5 個區域:
SELECT TOP 5 Location, SUM(Value_USD) AS Revenue_Q3 FROM Transactions WHEREDATEPART(q, Date) = 3ANDYEAR(Date) = 2020GROUPBY Location ORDERBYSUM(Value_USD) DESC;
如果你想用其他語言來進行這些查詢,情況就會復雜很多,既耗時間,語句也長得多。設計 SQL 就是為了切割數據,而且看起來 SQL 做得非常好。畢竟,不是數據因計算而存在,而是計算因數據而存在。
八、SQL/RDBMS 和 NoSQL/DBMS 資料庫各司其職
資料庫是工具。工具不應該只有斧子,還應該有扳手,螺絲刀,鋸子等等。每一種工具各司其職,解決不同的問題。而每一種資料庫都長於一些事情,而短於另一些事情。
當你無法預見數據匯總或數據用途的所有可能性,但又需要表示一個系統中各部份的關系時,關聯式資料庫就是最好的選擇。而且老實說,大部份系統在這方面做得並不好。再者,SQL 語言本身提供了一種使用者友好型的數據組織方式。
SQL/RDBMS 只是眾多工具中的一種,且剛好在很多情況下都是切實能用的那種。而當需要保證數據的完整性、一致性時(比如金融領域),SQL/RDBMS 就是最好用的工具。
SQL 資料庫有它們自身的缺點,且對於某些工作來說,並不是最好的選擇。但在大部份情況下,它們可以輕松打敗其他非 SQL 資料庫。
有些人會擔心數據規模的問題,但實際上,只有很小一部份人需要解決 RDBMS 的擴容問題——畢竟你不是 Facebook 或者 Google。因此,你仍然可以用 SQL 資料庫管理數一百萬計的使用者資訊,而不出現任何問題。
更何況,只要知道如何權衡利弊,RDBMS 是可以擴容的。
再用 50 年?
盡管數不清的其他資料庫系統和技術,都在不斷擴大著使用人群,但是,毫無疑問地,SQL 資料庫在可預見的未來甚至更遠,會一直發揮作用。隨著大數據,深度學習和物聯網的到來,即使 SQL 資料庫再流行 50 年也不奇怪。
確實,SQL 資料庫是有缺點的。但在絕大多數的案例中,龐大的社群,簡單的語言,以及有強大的 RDBMS 作為其基礎,使得 SQL 成為了最好的選擇之一。
為什麽我們在 SQL 誕生 50 年後還一直使用它呢?因為它能用,而且在 90% 的情況中都能完成任務。這對於身處越來越復雜的技術與整合環境中的開發者而言,就是最大的優點。
來源丨內容整理自網路
dbaplus社群歡迎廣大技術人員投稿,投稿信箱: [email protected]
活動推薦
2024 XCOPS智慧運維管理人年會·廣州站將於5月24日舉辦 ,深究大模型、AI Agent等新興技術如何落地於運維領域,賦能企業智慧運維水平提升,構建全面運維自治能力! 碼上報名,享早鳥優惠。