時序是什麼?時序預測可以為業務帶來哪些價值?產品銷量預測、電池剩餘壽命預測……這些高價值場景如何提高預測準確率?深度學習模型在時序預測有什麼優勢?如何尋得一款集前沿高尖時序技術的產品,為業務所用?近日,百度飛槳重磅發布了一款開源時序建模算法庫——PaddleTS,可以幫助開發者實現時序數據處理、分析、建模、預測全流程,具有更優的使用體驗:
時間序列是按照時間發生的先後順序進行排列的數據點序列,簡稱時序。時間序列預測是最常見的時序問題之一,在很多行業都有時序預測的應用,且通常時序預測效果對業務有着重大影響。例如:
零售企業:準確的預測產品銷量,可以為企業備貨、配送、運營策略的制定提供有效依據,顯著降本增效;
電網公司:準確的預測發電量與用電量,可以使電網的調度更加合理化,發揮最大效能;製造企業:提前預測生產設備可能發生的故障,可以提前預警、維修,降低停工造成的損失;新能源車企:實時預測電池剩餘電量、預測剩餘壽命,可以更經濟、更合理的使用車輛;金融領域:利率、股票、現金流、外匯等走勢預測都對經濟產生重大影響。Github傳送門,歡迎大家🌟Star🌟收藏
https://github.com/PaddlePaddle/PaddleTS
不僅如此,時間序列預測還在金融利率預測、股票波動率預測、現金流預測等關鍵場景發揮重大作用。經典的機器學習算法應用到時間序列預測中,其優勢在於模型使用靈活、訓練簡單,但也存在明顯的缺點,需要大量的人工工作在特徵工程上。近年來,深度學習逐步在語音、視覺、自然語言理解等領域得到廣泛應用,其算法的優勢明顯。首先,它可以自動捕捉關鍵特徵,不需要依賴統計學知識,不需要複雜的特徵工程;其次,它在建模流程與準確率上有着機器學習不可比擬的優勢;此外,它還具備很多功能優勢,如使用靈活、表達力強、兼容多樣性等。既然深度學習這麼優秀,怎麼為時序場景業務所用呢?PaddleTS提供了一系列先進的基於深度學習技術的時序建模算法及相關組件,它功能豐富、簡單易用、效果領先,包括能源、交通、製造等多個行業客戶早已應用起來,還不快來試試~~1. 微信掃描下方二維碼,關注公眾號,填寫問卷後進入微信群
2. 查看群公告領取福利

PaddleTS覆蓋時序預測和時序異常檢測兩大核心應用場景,針對建模全流程,提供了豐富的功能。既支持單變量也支持多變量的時序分析,同時還具備模型融合、自動建模及豐富的建模工具組件。PaddleTS無論是在功能豐富度上,還是在集成的時序算法數量上,都超過了市面上典型的開源時序產品。除了基礎能力以外,產品還有以下特色功能:
全面的數據類型支持:PaddleTS提供的協變量支持功能,支持歷史觀測協變量、未來可知協變量、靜態協變量和分類變量等各種協變量數據類型,幫助開發者有效利用各種數據充分發揮數據的價值。
主流新穎的深度模型:PaddleTS集成了Transformer、TCN、VAE、TS2Vec、N-beats等豐富的深度學習模型,可以很好的捕捉複雜時序場景中的多變量動態依賴關係,解決長周期、多變量、小樣本等問題,取得更好的模型效果。豐富的分析建模工具集:PaddleTS內置了時序特徵處理、數據分析、回測、滾動預測、自動建模、模型融合等分析建模過程中非常實用的功能,可以幫助開發者減少編碼數量,提升開發效率。不需要深刻的專業背景和複雜的特徵工程
3行代碼實現時序建模
PaddleTS覆蓋了大部分主流深度學習模型,開發者只需將數據按照格式要求灌入數據集,再通過簡單的歸一化處理即可進行模型訓練預測。相較於傳統統計模型對開發者統計知識的要求,機器學習模型在訓練前複雜的特徵工程,開發者使用PaddleTS構建深度學習模型更加快速、簡單。dataset=TSDataset.load_from_dataframe(df,**kwargs)mlp=MLPRegressor(in_chunk_len=7*24,out_chunk_len=24)mlp.fit(dataset)PaddleTS默認集成了sklearn、pyod等第三方庫,解決了傳統機器學習方法不能直接用於時序數據,且建模過程複雜等問題。開發者通過幾行代碼即可實現傳統機器學習的調用,搭配PaddleTS中豐富的建模全流程工具,充分滿足個性化需求。時序預測代碼示例
ts_forecasting_model=make_ml_model(sklearn.linear_model.LinearRegression,in_chunk_len=16,out_chunk_len=1)ts_forecasting_model.fit(tsdataset)res=ts_forecasting_model.predict(tsdataset)ts_anomaly_model=make_ml_model(pyod.models.knn.KNN,in_chunk_len=16)ts_anomaly_model.fit(tsdataset)res=ts_anomaly_model.predict(tsdataset)時序專屬的自動建模與集成預測器
策略更優、操作更簡單
PaddleTS將傳統的自動建模和集成學習工具進行改良優化,針對時序場景重新設計了更加便捷的建模工具。自動建模AutoTS:在該模塊中內置了默認搜索空間、超參優化算法、重採樣策略與參數評估策略,開發者僅需2行代碼即可完成自動建模的主體訓練流程定義。AutoTS功能代碼示例
autots_model=AutoTS(MLPRegressor,96,24)autots_model.fit(tsdataset)集成預測器Ensemble:該模塊採用集成學習的思想,提供兩種集成預測器,開發者通過簡單的操作即可把多個PaddleTS預測器集合成一個,滿足多數場景下的集成需求。Ensemble功能代碼示例
ensemble_model=StackingEnsembleForecaster(96,24,estimators=[(NHiTSModel,nhits_params),(RNNBlockRegressor,rnn_params),(MLPRegressor,mlp_params)])ensemble_model.fit(ts_train,ts_val)
PaddleTS基於飛槳框架,對數據加載、模型訓練、模型預測等核心環節精心打磨優化,效率相比同類開源產品有非常大的優勢。訓練環境:GPU CUDA 11.2,設備 NVIDIA A30指標說明:MAE,即絕對平均誤差,它表示預測值和觀測值之間絕對誤差的平均值,越小則預測效果越好此外,相較於同類產品,使用PaddleTS中的AutoTS自動建模工具可以取得更優的建模效果,在大多數情況下優於專家經驗調參。WTH數據集:包含2010年至2013年4年間近1600個美國地區的當地氣候數據
11月8日(周二)19:00,百度資深工程師將為大家深度解析時序建模算法庫PaddleTS,歡迎大家掃描海報二維碼報名直播課,與各位開發者進行技術和業務深度交流!
更多精彩直播推薦
