整理 | 彭慧中 責編 | 何苗
出品 | CSDN(ID:CSDNnews)
目前,中國已經進入“人人都是開發者,家家都是數據公司”的新數據庫時代。
6月29日,CSDN 創始人&董事長、極客幫創投創始合伙人蔣濤在騰訊雲數據庫&CSDN工程師能力輕量認證發布會上發表了《新數據庫時代》主題演講分享。他指出,在開源吞噬世界的背景下,數據庫也在大力擁抱開源。不同於傳統關係型數據庫,新型數據庫已成為行業風口,急需大量相關人才匯入,青年才俊應當抓住機遇,迎接挑戰。
CSDN 創始人&董事長、極客幫創投創始合伙人 蔣濤
以下是蔣濤演講實錄:
大家好,我是CSDN創始人蔣濤。我是程序員出身,30年前數據庫就是程序員的必備技能,而近幾年,數據庫又有了很大的發展。作為投資人,我也曾投資過巨杉數據庫。
CSDN目前是中國知名的技術社區,據最新數據顯示,CSDN的用戶量已經超過3,600萬,公司規模也在不斷發展壯大。如今,開發者變得越來越重要,我們圍繞着開發者建立了一系列業務支持體系,幫助開發者獲得能力與成長。其中,不僅有協助開發的工具開發雲(https://dev.csdn.net),還有幫助大家找到更好職業的人才雲等。目前,開發者市場越來越好,相信“人人都是開發者,家家都是技術公司”的時代不久後就要到來。
在此背景下,中國想要構建自己的核心技術生態,數據庫是其中關鍵。今天我將圍繞三個部分分享《新數據庫時代》:
第一是揭示「我們正在進入的數據大時代」現狀;
第二是了解「開源正在吞噬數據庫」的改變;
第三是把握「新型的數據庫人才特別搶手」的趨勢。
數據大時代
我們正處於大數據時代,幾乎每家公司都在對自己的業務進行數字化變革。據統計,全球數據量每年持續增加,去年全球產生的數據總量是79ZB,2025年預計將達到180ZB。
由於雲技術的發展,越來越多的數據都存儲在雲端。數據顯示,在2016年只有10%的數據儲存在雲端的數據倉庫里,但到了2022年,這個數字已經快速增長到了75%,這說明隨着數字經濟的發展,每家公司都將成為數據公司,數據庫市場也迎來了爆炸性增長。
數據庫市場歷史其實非常悠久,從1964年,世界上第一個數據庫系統IDS(Integrated Data Storage,集成數據存儲)誕生開始,到今天數據庫發展已經快60年。1980年代,數據庫開始在中國生根發芽。直到現在,整個全球市場依然保持了20%以上的增長規模。儘管數據庫是個古老的技術,但其中又蘊含了很多新的機會。
從數據庫技術公司融資情況來看,數字非常驚人。過去10年,數據庫公司融資總額87億,其中一半是在過去兩年內完成的。2021年,超級獨角獸大數據公司Databricks兩輪融資總額為26億美元。如此看來,數據庫技術也進入到了一個新時代。
開源吞噬數據庫
那麼數據庫的技術進入到新時代的標誌是什麼?
即“開源吞噬數據庫”。
開源已經成為所有開發者的必選項,據GitHub統計數據:2016年僅有80萬人第一次做出開源代碼貢獻,而2021年,這個數字已經增長到300萬。
在數據庫領域中,開源的“吞噬”情況也十分明顯。dbdb.io(卡內基梅隆大學維護的全球數據庫信息庫)分析了全球知名的841個數據庫系統,其中開源數據庫有608個,佔比72%,只有200多家是商業數據庫。在全球頂尖數據庫排行榜中,開源數據庫也佔到一半。
在CSDN製作的2021 數據庫全景圖(V1.0)中,我們將不同領域的數據庫按照開源和閉源兩類進行顏色區分,右側淺綠色的部分是開源數據庫,左側深綠色的部分是閉源數據庫。可以很明顯地看到開源在快速發展,且有吞噬閉源數據庫的趨勢。
來源:《新程序員 002》
中國數據庫在發展核心技術生態的大背景下,也發展得非常的迅猛。dbdb.io(卡內基梅隆大學維護的全球數據庫信息庫)統計的全球800多家數據庫企業中,中國有56家,但實際上中國數據庫廠商有200多家。尤其在新型數據庫上,中國企業“冒頭”較多,例如現在發展勢頭強勁的TiDB,在GitHub上非常活躍。
當然,開發者目前使用較多的還是相對傳統的基礎關係型數據庫MySQL,還有大數據領域Redis、Apache/Hive、MongoDB等相對比較傳統的技術,但絕大部分都是開源的。儘管最普遍被使用的依然是關係型數據庫,但新型數據庫則代表了未來趨勢。根據CSDN 2021-2022年數據庫開發者大調查顯示,在雲趨勢下,有52%的公司已經部署了雲數據庫,只有23%的公司尚未計劃部署雲數據庫。
新型數據庫人才搶手
對於目前的就業環境,我認為開發者應當好好學習數據庫技術,並且不要局限於僅學習關係型數據庫,更要學新型數據庫。為什麼呢?
新型數據庫的技術棧跟過去大有不同,關係型數據庫只是裡面最基礎的一環,而數據分析、數據倉庫、可視化等很多新型技術棧在湧現。開源中比較熱門的新數據庫類型包括分布式數據庫、時序數據庫、圖數據庫、流式數據庫等都在GitHub上排名非常靠前,Star數也非常高。
20年前,市面上只有關係型數據庫,主要面向事務性的交易。而如今得益於雲、微服務、分布式應用、全球規模、實時數據、深度學習等,新的數據庫架構應運而生,以解決新的性能需求:快速讀取和快速寫入的不同系統;專門用於支持實時分析的系統;用於非結構化、半結構化、事務性、關係、圖形或時間序列數據的系統;適用於緩存、搜索、基於索引、事件等的數據……據統計,一家企業平均在七個或更多不同的數據庫中存儲數據。
這些新技術帶來了新機會,同時也加大了市場對人才的需求。我國數據工程師真正誕生是在十幾年前。而現在,隨着數據量的激增且更多地存儲在雲端,越來越多公司變成數據公司、市場對數據公司的需求也在持續增長。基於數據做分析的數據分析工程師也非常重要,他們既要了解數據庫的技術,又要懂業務,才能更好地進行數據分析,這樣的人才在未來會非常緊俏。
據Glassdoor(美國一家做企業點評與職位搜索的職場社區)統計,從2016年到2020年,“數據科學家”在美國最佳工作排行榜中一直位居榜首,被稱為21世紀最性感的工作。現在,數據科學家和數據工程師的需求還在持續上升,薪資也是。
目前,中國對數據庫人才的需求也具有相同趨勢,儘管過去在關係型數據庫領域處於引領地位的還是Oracle的MySQL數據庫。但我相信,中國未來會構建自己的數據庫新生態。中國也非常有機會在新技術上進行彎道超車,例如騰訊雲數據庫TDSQL,以及其他新型數據庫。同時,也希望更多CSDN平台上的開發者能夠加入新型數據庫賽道中來,並歡迎大家去參加能力認證活動。
END
《新程序員002:新數據庫時代&軟件定義汽車》,由60餘位專家傾力創作,包含世界級技術大師的深邃思考、前沿技術的發展,以及深入行業的應用實踐。隨書附贈《2021數據庫全景圖V1.0》和《2021汽車技術與產業生態全景圖V1.0》,同時內含《2021年度數據庫發展研究報告》和《2021年度軟件定義汽車研究報告》,圖文與視頻多媒體呈現。
成就一億技術人