承接AI時代使命:OceanBase詳解Data×AI戰略並發佈首款RAG產品

2025年06月01日12:10:17 財經 7639

過去十五年來,誕生於「雙11」海量交易場景的OceanBase,在螞蟻集團的金融場景中不斷磨礪打磨技術,並曾打破Oracle保持9年之久的世界紀錄。2025年5月17日,OceanBase迎來新動態。當天,OceanBase舉辦了升級AI戰略後的首次開發者大會,同時也是OceanBase的第三屆開發者大會。

會上,OceanBase CTO楊傳輝回憶道:「OceanBase從螞蟻集團獨立出來之後已被用於全球2000多家企業。其中,第一家金融行業客戶是南京銀行,第一家證券行業客戶是招商證券,第一家保險行業客戶是中國人保,第一家非金融行業客戶是中國移動,第一家教育行業客戶是科大訊飛,第一家餐飲行業客戶是海底撈,第一家智造行業客戶是理想汽車,第一家出行行業客戶是T3出行,第一家物流行業客戶是德邦物流,第一家海外客戶是GCash。」

而在AI發展的時代背景之下,不久之前OceanBase CEO楊冰通過全員信宣布公司全面進入AI時代,為此OceanBase 將努力實現數據與AI的融合,打造「DATA×AI」核心能力,建設AI時代的數據底座。距離上述全員信發佈不到一個月,本次會上公布了該公司的更多AI動態——既發佈了數款產品,也重申了OceanBase在AI時代背景下的使命和願景。

發佈PowerRAG,提供開箱即用的RAG應用開發能力

會上,OceanBase首次發佈面向AI的應用產品PowerRAG,該產品提供開箱即用的RAG應用開發能力,能夠提供AI驅動的開箱即用的RAG服務,是OceanBase面向AI時代的探索之一。

楊傳輝介紹稱,傳統RAG應用的常用開發模式包括組件森林開發模式、RAG平台模式等,這些模式存在開發周期長、維護成本高、灰箱調試困難、性能難以優化等問題。OceanBase PowerRAG提供開箱即用的RAG應用開發能力,打通應用開發數據層、平台層、接口層與應用層的全流程,提供Document(文檔)和 Chat(對話)兩個核心API接口,幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。

楊傳輝進一步表示,PowerRAG是OceanBase在應用層面探索的第一步,未來還將在應用層面、平台層面不斷突破,並致力於成為AI時代的一體化從,以便應對生成式AI給數據基礎設施帶來的技術挑戰。其中,數據底座指的是通過一體化的產品、一體化的引擎,同時地處理OLTP、OLAP以及AI的混合負載。

承接AI時代使命:OceanBase詳解Data×AI戰略並發佈首款RAG產品 - 天天要聞

向量性能達業內領先水平,並已實現規模化落地

大會現場,基於基準測試工具VectorDBBench,OceanBase採用Performamce768D1M測試數據集,與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示,OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。「通過這次跑分測試可以看到OceanBase的向量性能已經達到了開源向量數據庫業內領先的水平,並且比其他的主流開源向量數據庫都要好不少。」楊傳輝表示。

面對AI時代的海量數據,OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場景的內存需求;引入針對JSON半結構化數據的壓縮能力,降低AI場景中的半結構化數據存儲成本。根據測試結果,在同等召回率與性能的情況下,引入BQ量化算法能夠實現內存成本較引入前降低 95%,而在TPC-H 10G數據集上,OceanBase的JSON壓縮比可達 MongoDB 的3倍。

此外,OceanBase已具備面向多種數據模型的混合檢索能力。在最新版本中,OceanBase混合檢索性能進一步增強,通過豐富的執行策略、自研的向量算法庫、內核級多模混合查詢等實現更快、更准、更易用的混合檢索。

目前,OceanBase的向量數據庫已經得到上百家客戶的使用,並已實現規模化的落地。比如,聯通軟研院基於OceanBase打造了AI助手,in銀泰商業則基於OceanBase打造了零售業智能問數平台。

推出「共享存儲」,實現TP場景下穩定運行對象存儲

為了解決無共享架構在彈性和成本方面的瓶頸問題,OceanBase宣布一體化架構再升級,並在本次會上推出了「共享存儲」產品,該產品能將計算與存儲解耦,以自研一體化架構實現對對象存儲(如Amazon S3、阿里雲OSS等)的深度支持。

該產品還能實現對象存儲與事務型數據庫(TP,Transactional Processing)的深度集成,所構建的存算一體與分離的多雲原生架構,不僅大幅提升雲上數據存儲的彈性擴展能力,更使TP負載的存儲成本最高降低50%。

據悉,「共享存儲」產品在雲上可被應用於多種業務場景,包括典型TP、歷史庫及備份庫,時序類業務、HBase兼容類業務、流水型業務系統、OLAP業務等。

楊傳輝進一步介紹稱,「共享存儲」產品背後蘊含著OceanBase的多項技術突破:一是構建多級緩存架構,有效解決對象存儲的訪問延遲問題;二是自研基於對象存儲的 LSM-Tree引擎並採用深度工程手段,降低對象存儲的I/O壓力;三是通過獨有的持久化緩存彈性伸縮,進一步解決TP場景下熱點數據的穩定性問題;此外,優化對象存儲的訪問全鏈路,確保TP業務毫秒級響應的穩定性。

承接AI時代使命:OceanBase詳解Data×AI戰略並發佈首款RAG產品 - 天天要聞

通過逐一突破這些技術難點,使得OceanBase的雲數據庫OB Cloud成為目前業內唯一能夠在 TP 場景下穩定運行對象存儲的多雲原生數據庫:在TP負載下,存儲成本最高降低50%;在AP負載下,存儲成本最高可降低為原來的1/10。

與此同時,OceanBase還宣布,OB Cloud正式上線百度雲。截止目前,OB Cloud已支持阿里雲、華為雲、騰訊雲、百度雲、AWS、Google Cloud 六大主流公有雲平台,全球覆蓋超過100個可用區。

承接AI時代使命:從一體化數據庫向一體化數據底座演進

IDC軟件市場研究經理李凌霄在本次會上表示,預計到2028年全球企業級數據的數據量相比2023年整體增長400%以上,年複合增長率約為30.2%。通過生成式AI技術去讓多模態數據產生價值已經具備技術可行性,這意味着多模態數據將能為企業的管理、運營、決策、業務帶來價值。未來,人們將會大量地產生、存儲和加工多模態數據。

與此同時,AI時代也帶來了新的數據難題。於企業而言,數據倉庫的容量已實現質的飛躍,結構化數據存儲規模「突破PB級邁向EB級」成為新常態,這給數據存儲、管理與分析帶來嚴峻挑戰。

面對行業需求,OceanBase正在大膽探索。楊傳輝表示,OceanBase已經具備了一定的AI時代數據處理能力,如分佈式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。但大模型落地產生價值的核心在於數據與模型的一體化融合,這也是OceanBase提出的構建Data×AI能力的關鍵。

基於這一能力,OceanBase致力於從一體化數據庫向一體化數據底座演進,通過一套引擎同時支持TP/AP/AI混合負載,支持向量數據庫,實現SQL與AI的混合檢索。

作為一款原生分佈式數據庫,OceanBase原本就具有的企業級分佈式數據庫能力,為AI時代的海量數據處理分析打下了基礎。對於支持AI應用落地的核心基礎設施比如向量性能、混合檢索等層面,OceanBase也在持續探索,進一步加強SQL+AI能力。比如,模型上下文協議(MCP,Model Context Protocol)是最近一款非常流行的技術,通過MCP能把每個產品接入大模型生態里,OceanBase的OceanBase service和OceanBase的管控工具OCP目前均已實現MCP支持,未來OceanBase也會全面擁抱MCP的大模型生態。

正如楊冰所言:「面向未來要搭建的不是另外一幢十幾層的高樓大廈,而是要搭建一百層甚至好幾百層的摩天大樓,這時就需要重新構建底層基礎設施,而這也是我們所擅長的,我們也有強烈的被召喚的使命感。」未來的應用一定是基於AI的應用,未來的數據公司也都會是AI公司。」楊冰還說道:「作為一個數據存儲軟件未來要支撐的不僅僅是存和算,還要去支持知識的學習和獲取、支持應用的推理、支持更多的決策。」為了更好地推進這些方向,OceanBase定下了四個大方向:一是成為「知識底座」,二是打破「數據次元壁」, 三是當AI的「靠譜參謀」, 四是做流量的「衝浪高手」。

而作為AI戰略「一號位」的楊傳輝,針對Data×AI分享了更多細節。他表示OceanBase正致力於構建能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。

Data x AI從概念上可以分成兩層:Bring Data to AI和Bring AI to Data。Bring Data to AI,指的是要把數據融入大模型里,通過數據提升模型準確度,從而提升推理效率並降低推理成本。Bring AI to Data,則分成兩個層次:第一個層次是在數據庫里通過類似AI function的方式直接集成大模型的能力;第二個層次是把AI融合到整個數據庫,以便提升數據庫的可應用性,比如開發智能知識庫和智能助手等。

此外,在楊傳輝描繪的一體化數據底座版圖中,OceanBase希望能夠實現從算力、基礎設施,到平台層、應用層、交付形態的全方位布局。他表示:「未來15年一定是一個AI大爆發的時代,我們也相信隨着AI的應用場景以及來自中國乃至世界的AI場景打磨,OceanBase將成為AI時代的一體化數據底座。」

承接AI時代使命:OceanBase詳解Data×AI戰略並發佈首款RAG產品 - 天天要聞

那麼,OceanBase的信心從何而來?對此,楊傳輝表示:首先,Data x AI一體化數據底座其實是OceanBase一體化數據庫的延伸,它的核心在於能否做好數據處理。未來,OceanBase一定會拓展數據處理範疇,但是並不會把自己局限在關係數據庫的舒適圈裡,而是會讓數據處理更好地適應AI時代的工作負載。其次,AI時代的應用大爆發給了OceanBase更大的機會,AI時代的應用一方面需要更多的數據,另一方面需要混合負載。對於開發者來說,他們希望在一套引擎里直接通過一條SQL處理所有的工作負載,而一體化和分佈式恰好是OceanBase的優勢。「今天我可以告訴大家,OceanBase的研發團隊既能做數據庫,也能做分佈式系統,還能做AI的infra。再加上由螞蟻集團技術能業務場景支持,OceanBase做這件事情是非常順理成章的。」楊傳輝表示。他還總結稱:「學AI用AI,學OB用OB。只要大家學好AI、學好OB,我們都能很好地掌握AI時代的數據和技術。」

如前所述,OceanBase原本是螞蟻集團的一個子部門,後來獨立出來成立單獨的公司。在關係上螞蟻集團就好比是OceanBase的「長輩」,螞蟻集團CTO何征宇也在本次大會現場表示大力支持OceanBase的AI戰略。他說,螞蟻集團將支持OceanBase在金融、醫療、生活等螞蟻AI的核心場景的突破,支持OceanBase去實踐DataxAI的理念和架構創新,幫助OceanBase進一步攻堅AI關鍵能力。同時,螞蟻集團將繼續支持OceanBase開源開放,把在Data×AI上的能力逐漸開放給行業,為AGI的夢想添磚加瓦。

財經分類資訊推薦

重要光伏子公司揚州棒傑繼續停產,棒傑股份實控人擬轉讓控制權 - 天天要聞

重要光伏子公司揚州棒傑繼續停產,棒傑股份實控人擬轉讓控制權

每經記者:黃海 每經編輯:董興生曾號稱計劃投入百億元擴產的棒傑股份(002634.SZ,股價3.95元,市值18.14億元),將迎來易主。6月2日晚間,棒傑股份公告稱,公司控股股東、實控人陶建偉及其一致行動人陶士青、持股5%以上股東蘇州青嵩企業管理合夥企業(有限合夥)(以下簡稱「蘇州青嵩」)已於5月30日晚間與上海啟爍睿行企...
「車來了」母公司元光科技開啟招股;新世界發展四隻永續債延遲派息丨港交所早參 - 天天要聞

「車來了」母公司元光科技開啟招股;新世界發展四隻永續債延遲派息丨港交所早參

每經記者:黃婉銀 每經編輯:魏文藝|2025年6月3日 星期二|NO.1 「車來了」母公司元光科技開啟招股6月2日,實時公交平台「車來了」母公司MetaLight(元光科技,HK02605)開啟招股,將於6月5日截止認購。「車來了」主要通過大數據分析和AI技術為通勤者提供實時公交信息預測服務。公司擬全球發售約2485.6萬股股份,發售價為...
小米即將發佈自研芯片,這個芯片到底有多強? - 天天要聞

小米即將發佈自研芯片,這個芯片到底有多強?

在輿論風暴中的小米又迎來了一次里程碑式發展 —— 最近雷軍宣布,他們的小米玄戒 O1 芯片馬上就要發佈了。這款芯片到底有怎樣的性能?它對整個手機產業、對中國製造又有什麼影響?對風暴中的小米又會有什麼幫助?我們來好好分析一下。
Q1收入下滑,樂信財報後股價走低 - 天天要聞

Q1收入下滑,樂信財報後股價走低

【財報】消費信貸知名企業樂信(LX.NASDAQ)一季度凈利潤雖然創下歷史新高,但收入卻遭遇了最近10個季度以來首次下滑。增利不增收態勢,讓樂信股價在財報發佈後遭遇了大跌。財報顯示,樂信一季度實現營收31億元,減少4.3%。
追光逐綠!中鐵十局單體最大光伏項目併網發電 - 天天要聞

追光逐綠!中鐵十局單體最大光伏項目併網發電

追光逐綠 向「新」發展5月28日中鐵十局單體最大光伏項目丘北小塘子200兆瓦光伏發電項目提前1個月併網發電這座矗立於滇東南岩溶高原與西北部丘陵地帶的「陽光電站」有力推動了區域能源結構轉型升級在雲嶺深處點亮了綠色發展「新坐標」丘北小塘子200
假期75個公司發佈減持公告,一半都是高管減持,千萬別踩雷了 - 天天要聞

假期75個公司發佈減持公告,一半都是高管減持,千萬別踩雷了

這個假期利空挺多的,關稅衝突又起波瀾,俄烏又出新狀況,這直接導致港股市場今天大幅下跌,而這個假期A股的減持公告也特別多,剛剛看了下75份減持公告,其中有一半都是高管減持,這樣看,明天A股又是腥風血雨的一天啊,大家一定要注意這些減持的股票。
聚人氣 拓市場 共奮進——「塞上江南」經濟煥發新活力 - 天天要聞

聚人氣 拓市場 共奮進——「塞上江南」經濟煥發新活力

賀蘭黛色青,塞上雲天闊。地處中國大陸版圖幾何中心的寧夏,發展熱潮湧動。今年一季度,寧夏地區生產總值同比增長6%,增速位列全國第五,這是寧夏連續11個季度超過全國平均水平。起勢有力的寧夏跑出「加速度」:重大項目滿弓勁發、文旅融合創新出圈、特色產業奮楫揚帆、閩寧協作共促振興……「塞上江南」正展現出向上、向好...