過去十五年來,誕生於「雙11」海量交易場景的OceanBase,在螞蟻集團的金融場景中不斷磨礪打磨技術,並曾打破Oracle保持9年之久的世界紀錄。2025年5月17日,OceanBase迎來新動態。當天,OceanBase舉辦了升級AI戰略後的首次開發者大會,同時也是OceanBase的第三屆開發者大會。
會上,OceanBase CTO楊傳輝回憶道:「OceanBase從螞蟻集團獨立出來之後已被用於全球2000多家企業。其中,第一家金融行業客戶是南京銀行,第一家證券行業客戶是招商證券,第一家保險行業客戶是中國人保,第一家非金融行業客戶是中國移動,第一家教育行業客戶是科大訊飛,第一家餐飲行業客戶是海底撈,第一家智造行業客戶是理想汽車,第一家出行行業客戶是T3出行,第一家物流行業客戶是德邦物流,第一家海外客戶是GCash。」
而在AI發展的時代背景之下,不久之前OceanBase CEO楊冰通過全員信宣布公司全面進入AI時代,為此OceanBase 將努力實現數據與AI的融合,打造「DATA×AI」核心能力,建設AI時代的數據底座。距離上述全員信發佈不到一個月,本次會上公布了該公司的更多AI動態——既發佈了數款產品,也重申了OceanBase在AI時代背景下的使命和願景。
發佈PowerRAG,提供開箱即用的RAG應用開發能力
會上,OceanBase首次發佈面向AI的應用產品PowerRAG,該產品提供開箱即用的RAG應用開發能力,能夠提供AI驅動的開箱即用的RAG服務,是OceanBase面向AI時代的探索之一。
楊傳輝介紹稱,傳統RAG應用的常用開發模式包括組件森林開發模式、RAG平台模式等,這些模式存在開發周期長、維護成本高、灰箱調試困難、性能難以優化等問題。OceanBase PowerRAG提供開箱即用的RAG應用開發能力,打通應用開發數據層、平台層、接口層與應用層的全流程,提供Document(文檔)和 Chat(對話)兩個核心API接口,幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。
楊傳輝進一步表示,PowerRAG是OceanBase在應用層面探索的第一步,未來還將在應用層面、平台層面不斷突破,並致力於成為AI時代的一體化從,以便應對生成式AI給數據基礎設施帶來的技術挑戰。其中,數據底座指的是通過一體化的產品、一體化的引擎,同時地處理OLTP、OLAP以及AI的混合負載。

向量性能達業內領先水平,並已實現規模化落地
大會現場,基於基準測試工具VectorDBBench,OceanBase採用Performamce768D1M測試數據集,與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示,OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。「通過這次跑分測試可以看到OceanBase的向量性能已經達到了開源向量數據庫業內領先的水平,並且比其他的主流開源向量數據庫都要好不少。」楊傳輝表示。
面對AI時代的海量數據,OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場景的內存需求;引入針對JSON半結構化數據的壓縮能力,降低AI場景中的半結構化數據存儲成本。根據測試結果,在同等召回率與性能的情況下,引入BQ量化算法能夠實現內存成本較引入前降低 95%,而在TPC-H 10G數據集上,OceanBase的JSON壓縮比可達 MongoDB 的3倍。
此外,OceanBase已具備面向多種數據模型的混合檢索能力。在最新版本中,OceanBase混合檢索性能進一步增強,通過豐富的執行策略、自研的向量算法庫、內核級多模混合查詢等實現更快、更准、更易用的混合檢索。
目前,OceanBase的向量數據庫已經得到上百家客戶的使用,並已實現規模化的落地。比如,聯通軟研院基於OceanBase打造了AI助手,in銀泰商業則基於OceanBase打造了零售業智能問數平台。
推出「共享存儲」,實現TP場景下穩定運行對象存儲
為了解決無共享架構在彈性和成本方面的瓶頸問題,OceanBase宣布一體化架構再升級,並在本次會上推出了「共享存儲」產品,該產品能將計算與存儲解耦,以自研一體化架構實現對對象存儲(如Amazon S3、阿里雲OSS等)的深度支持。
該產品還能實現對象存儲與事務型數據庫(TP,Transactional Processing)的深度集成,所構建的存算一體與分離的多雲原生架構,不僅大幅提升雲上數據存儲的彈性擴展能力,更使TP負載的存儲成本最高降低50%。
據悉,「共享存儲」產品在雲上可被應用於多種業務場景,包括典型TP、歷史庫及備份庫,時序類業務、HBase兼容類業務、流水型業務系統、OLAP業務等。
楊傳輝進一步介紹稱,「共享存儲」產品背後蘊含著OceanBase的多項技術突破:一是構建多級緩存架構,有效解決對象存儲的訪問延遲問題;二是自研基於對象存儲的 LSM-Tree引擎並採用深度工程手段,降低對象存儲的I/O壓力;三是通過獨有的持久化緩存彈性伸縮,進一步解決TP場景下熱點數據的穩定性問題;此外,優化對象存儲的訪問全鏈路,確保TP業務毫秒級響應的穩定性。

通過逐一突破這些技術難點,使得OceanBase的雲數據庫OB Cloud成為目前業內唯一能夠在 TP 場景下穩定運行對象存儲的多雲原生數據庫:在TP負載下,存儲成本最高降低50%;在AP負載下,存儲成本最高可降低為原來的1/10。
與此同時,OceanBase還宣布,OB Cloud正式上線百度雲。截止目前,OB Cloud已支持阿里雲、華為雲、騰訊雲、百度雲、AWS、Google Cloud 六大主流公有雲平台,全球覆蓋超過100個可用區。
承接AI時代使命:從一體化數據庫向一體化數據底座演進
IDC軟件市場研究經理李凌霄在本次會上表示,預計到2028年全球企業級數據的數據量相比2023年整體增長400%以上,年複合增長率約為30.2%。通過生成式AI技術去讓多模態數據產生價值已經具備技術可行性,這意味着多模態數據將能為企業的管理、運營、決策、業務帶來價值。未來,人們將會大量地產生、存儲和加工多模態數據。
與此同時,AI時代也帶來了新的數據難題。於企業而言,數據倉庫的容量已實現質的飛躍,結構化數據存儲規模「突破PB級邁向EB級」成為新常態,這給數據存儲、管理與分析帶來嚴峻挑戰。
面對行業需求,OceanBase正在大膽探索。楊傳輝表示,OceanBase已經具備了一定的AI時代數據處理能力,如分佈式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。但大模型落地產生價值的核心在於數據與模型的一體化融合,這也是OceanBase提出的構建Data×AI能力的關鍵。
基於這一能力,OceanBase致力於從一體化數據庫向一體化數據底座演進,通過一套引擎同時支持TP/AP/AI混合負載,支持向量數據庫,實現SQL與AI的混合檢索。
作為一款原生分佈式數據庫,OceanBase原本就具有的企業級分佈式數據庫能力,為AI時代的海量數據處理分析打下了基礎。對於支持AI應用落地的核心基礎設施比如向量性能、混合檢索等層面,OceanBase也在持續探索,進一步加強SQL+AI能力。比如,模型上下文協議(MCP,Model Context Protocol)是最近一款非常流行的技術,通過MCP能把每個產品接入大模型生態里,OceanBase的OceanBase service和OceanBase的管控工具OCP目前均已實現MCP支持,未來OceanBase也會全面擁抱MCP的大模型生態。
正如楊冰所言:「面向未來要搭建的不是另外一幢十幾層的高樓大廈,而是要搭建一百層甚至好幾百層的摩天大樓,這時就需要重新構建底層基礎設施,而這也是我們所擅長的,我們也有強烈的被召喚的使命感。」未來的應用一定是基於AI的應用,未來的數據公司也都會是AI公司。」楊冰還說道:「作為一個數據存儲軟件未來要支撐的不僅僅是存和算,還要去支持知識的學習和獲取、支持應用的推理、支持更多的決策。」為了更好地推進這些方向,OceanBase定下了四個大方向:一是成為「知識底座」,二是打破「數據次元壁」, 三是當AI的「靠譜參謀」, 四是做流量的「衝浪高手」。
而作為AI戰略「一號位」的楊傳輝,針對Data×AI分享了更多細節。他表示OceanBase正致力於構建能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。
Data x AI從概念上可以分成兩層:Bring Data to AI和Bring AI to Data。Bring Data to AI,指的是要把數據融入大模型里,通過數據提升模型準確度,從而提升推理效率並降低推理成本。Bring AI to Data,則分成兩個層次:第一個層次是在數據庫里通過類似AI function的方式直接集成大模型的能力;第二個層次是把AI融合到整個數據庫,以便提升數據庫的可應用性,比如開發智能知識庫和智能助手等。
此外,在楊傳輝描繪的一體化數據底座版圖中,OceanBase希望能夠實現從算力、基礎設施,到平台層、應用層、交付形態的全方位布局。他表示:「未來15年一定是一個AI大爆發的時代,我們也相信隨着AI的應用場景以及來自中國乃至世界的AI場景打磨,OceanBase將成為AI時代的一體化數據底座。」

那麼,OceanBase的信心從何而來?對此,楊傳輝表示:首先,Data x AI一體化數據底座其實是OceanBase一體化數據庫的延伸,它的核心在於能否做好數據處理。未來,OceanBase一定會拓展數據處理範疇,但是並不會把自己局限在關係數據庫的舒適圈裡,而是會讓數據處理更好地適應AI時代的工作負載。其次,AI時代的應用大爆發給了OceanBase更大的機會,AI時代的應用一方面需要更多的數據,另一方面需要混合負載。對於開發者來說,他們希望在一套引擎里直接通過一條SQL處理所有的工作負載,而一體化和分佈式恰好是OceanBase的優勢。「今天我可以告訴大家,OceanBase的研發團隊既能做數據庫,也能做分佈式系統,還能做AI的infra。再加上由螞蟻集團技術能業務場景支持,OceanBase做這件事情是非常順理成章的。」楊傳輝表示。他還總結稱:「學AI用AI,學OB用OB。只要大家學好AI、學好OB,我們都能很好地掌握AI時代的數據和技術。」
如前所述,OceanBase原本是螞蟻集團的一個子部門,後來獨立出來成立單獨的公司。在關係上螞蟻集團就好比是OceanBase的「長輩」,螞蟻集團CTO何征宇也在本次大會現場表示大力支持OceanBase的AI戰略。他說,螞蟻集團將支持OceanBase在金融、醫療、生活等螞蟻AI的核心場景的突破,支持OceanBase去實踐DataxAI的理念和架構創新,幫助OceanBase進一步攻堅AI關鍵能力。同時,螞蟻集團將繼續支持OceanBase開源開放,把在Data×AI上的能力逐漸開放給行業,為AGI的夢想添磚加瓦。