IBM發布新時間序列模型覆蓋全企業預測任務

時間序列數據有多種形式和潛在應用場景,這意味著沒有單一的預測方法能夠在所有情況下都表現最佳。

如果你要預測明天的最高和最低溫度,或者一家公司是否能達到下周的銷售目標,點預測是個不錯的選擇。但如果你要決定何時補充產品庫存或評估公司的風險敞口,概率預測可能更有用。其他時候,你可能需要在實時數據流中檢測異常,以防止網路中斷或機器故障,這時速度至關重要。

IBM研究院構建了一系列在各種場景下表現出色的時間序列基礎模型。這些模型於本周發布,目前在Hugging Face的GIFT-Eval排行榜上名列前茅:FlowState-r1.1用於點預測(在零樣本、可復現、無數據泄漏的模型中),PatchTST-FM-r1用於概率預測(在可復現、非智能體、無數據泄漏的模型中),以及TTM-r3和TSPulse-r1用於高效預測、異常檢測、分類和搜索,支持每秒數千次推理。

這些模型基於不同的架構構建,各有自己的優勢。本文將詳細介紹這些新功能、每個模型最適合的任務類型,以及如何訪問和使用它們。

PatchTST-FM-r1模型特性

我們最新的基於Transformer的模型PatchTST-FM-r1與倫斯勒理工學院聯合開發,基於我們開創性的PatchTST架構演進而來,該架構引入了通道獨立性和分塊技術,實現更準確、更高效的預測。PatchTST-FM-r1模型在預測任務中表現出色。它支持128到8,192個時間點的上下文長度,能夠在短期和長期時間範圍內進行預測,並且對缺失值具有魯棒性。其目前的GIFT-Eval排名證明,在由真實和合成數據組成的大規模數據集上訓練時,Transformer架構可以靈活、富有表現力且具有高精度性能。

TTM-r3高效性能

TTM-r3是我們TinyTimeMixer模型的第三代版本,旨在平衡速度和準確性。該版本引入了多項創新,提高了預測精度,推理速度比當前最先進的模型快15到50倍。TTM-r3在僅CPU環境中也能出色運行,使其非常適合真實世界的高吞吐量部署。TTM-r3支持快速微調、多變數預測,甚至可以整合控制變數,在複雜的工業場景中提升性能。我們的TTM模型極受歡迎,在Hugging Face上的下載量已超過3700萬次。

FlowState-r1.1創新架構

FlowState-r1.1是我們FlowState模型的最新版本,基於名為S5的新穎狀態空間架構構建,能夠處理短期和長期輸入以及預測時間範圍,還支持不同的採樣率。通過結合狀態空間模型編碼器和函數基礎解碼器,FlowState-r1.1具有協調不同採樣率數據以產生準確長期預測的罕見能力。這個新版本整合了額外的合成訓練數據,並增加了上下文長度以進一步提升性能。

模型應用場景

所有三個模型版本都擴展了IBM的時間序列模型產品組合,並與TSPulse互補。TSPulse是我們在異常檢測、搜索、分類和插值任務中表現出色的緊湊型預訓練模型系列。

這些模型共同覆蓋了廣泛的真實企業需求。應用場景包括工業製造和監控,以及檢測IT事件和電網中斷。這些模型總共在超過1000億個來自公共領域或人工生成的數據點上進行了訓練。

根據應用場景,每個模型都有其關鍵優勢。對於CPU機器上的高吞吐量和低延遲需求,可以嘗試TTM-r3。對於準確的點預測和概率預測,可以分別嘗試FlowState-r1.1和PatchTST-FM-r1。對於時間序列異常檢測、分類和其他非預測任務,可以嘗試TSPulse。

技術發展歷程

自2021年發布TST以來,IBM一直引領著時間序列基礎模型的研究和開發,TST是最早應用於時間序列數據的基於Transformer的模型之一。2023年,PatchTST為時間序列數據引入了分塊和通道獨立性概念,使Transformer能夠高效處理長時間序列。同年,TSMixer通過使用多層感知機(MLP)結合分塊和跨通道信息,在提高速度和效率方面開闢了道路。

在混合器的基礎上,2024年發布的Tiny Time Mixer(TTM)引入了首批跨多個領域任務的輕量級時間序列模型。2025年,基於狀態空間模型(SSM)這種高效的循環神經網路類型,我們推出了FlowState時間序列模型。其創新包括並行訓練、函數基礎解碼和採樣率不變性。TTM和FlowState的早期版本在2024年和2025年的GIFT-Eval預測排行榜上表現優異。

今年,我們通過發布PatchTST-FM-r1、TTM-r3和FlowState-r1.1完善了產品組合,這些模型再次在GIFT-Eval預測排行榜上名列前茅。它們與專門從事異常檢測和分類的TSPulse相輔相成,共同覆蓋了廣泛的真實使用場景。

模型獲取方式

我們所有的模型都是開放權重的,可以在Hugging Face上下載。研究版本在非商業許可下提供,而我們的Granite時間序列模型系列在精選數據集上訓練,在寬鬆的Apache 2.0許可下提供。

為了幫助用戶開始使用IBM的時間序列模型,我們提供了多個筆記本。這些筆記本突出展示了每個模型的功能和最佳用例,基於我們開源存儲庫的模型架構和支持代碼構建,涵蓋FlowState、TTM、PatchTST-FM以及TSPulse異常檢測和分類等內容。

Q&A

Q1:IBM發布的時間序列模型有哪些,各自適用什麼場景?

A:IBM發布了四個主要模型:FlowState-r1.1適用於點預測,PatchTST-FM-r1適用於概率預測,TTM-r3適用於高吞吐量和低延遲的CPU環境,TSPulse適用於異常檢測、分類和搜索任務。這些模型共同覆蓋了工業製造監控、IT事件檢測、電網中斷預警等企業級應用場景。

Q2:TTM-r3相比其他模型有什麼優勢?

A:TTM-r3是第三代TinyTimeMixer模型,主要優勢是速度快,推理速度比當前最先進模型快15到50倍,在僅CPU環境中也能出色運行,非常適合高吞吐量部署。它支持快速微調、多變數預測,還可以整合控制變數,在複雜工業場景中表現優異,在Hugging Face上下載量已超過3700萬次。

Q3:如何獲取和使用IBM的時間序列模型?

A:所有模型都在Hugging Face平台開放下載,研究版本採用非商業許可,Granite系列採用Apache 2.0許可。IBM提供了多個使用筆記本,包括FlowState、TTM、PatchTST-FM和TSPulse的使用指南,這些筆記本基於開源存儲庫構建,詳細展示了每個模型的功能和最佳用例。