close
時序是什麼?時序預測可以為業務帶來哪些價值?產品銷量預測、電池剩餘壽命預測……這些高價值場景如何提高預測準確率?深度學習模型在時序預測有什麼優勢?如何尋得一款集前沿高尖時序技術的產品,為業務所用?

近日,百度飛槳重磅發布了一款開源時序建模算法庫——PaddleTS,可以幫助開發者實現時序數據處理、分析、建模、預測全流程,具有更優的使用體驗:

超易用:3行代碼即可完成時序建模
速度快:模型訓練效率比同類產品快2倍
效果好:時序專屬的自動建模與集成預測效果突出

時間序列是按照時間發生的先後順序進行排列的數據點序列,簡稱時序。時間序列預測是最常見的時序問題之一,在很多行業都有時序預測的應用,且通常時序預測效果對業務有着重大影響。例如:

零售企業:準確的預測產品銷量,可以為企業備貨、配送、運營策略的制定提供有效依據,顯著降本增效;

電網公司:準確的預測發電量與用電量,可以使電網的調度更加合理化,發揮最大效能;
製造企業:提前預測生產設備可能發生的故障,可以提前預警、維修,降低停工造成的損失;
新能源車企:實時預測電池剩餘電量、預測剩餘壽命,可以更經濟、更合理的使用車輛;
金融領域:利率、股票、現金流、外匯等走勢預測都對經濟產生重大影響。

Github傳送門,歡迎大家🌟Star🌟收藏

https://github.com/PaddlePaddle/PaddleTS

不僅如此,時間序列預測還在金融利率預測、股票波動率預測、現金流預測等關鍵場景發揮重大作用。
工業設備異常檢測
經典的機器學習算法應用到時間序列預測中,其優勢在於模型使用靈活、訓練簡單,但也存在明顯的缺點,需要大量的人工工作在特徵工程上。近年來,深度學習逐步在語音、視覺、自然語言理解等領域得到廣泛應用,其算法的優勢明顯。首先,它可以自動捕捉關鍵特徵,不需要依賴統計學知識,不需要複雜的特徵工程;其次,它在建模流程與準確率上有着機器學習不可比擬的優勢;此外,它還具備很多功能優勢,如使用靈活、表達力強、兼容多樣性等。
既然深度學習這麼優秀,怎麼為時序場景業務所用呢?PaddleTS提供了一系列先進的基於深度學習技術的時序建模算法及相關組件,它功能豐富、簡單易用、效果領先,包括能源、交通、製造等多個行業客戶早已應用起來,還不快來試試~~


加入PaddleTS技術交流群


1. 微信掃描下方二維碼,關注公眾號,填寫問卷後進入微信群

2. 查看群公告領取福利



功能全面豐富


PaddleTS覆蓋時序預測和時序異常檢測兩大核心應用場景,針對建模全流程,提供了豐富的功能。既支持單變量也支持多變量的時序分析,同時還具備模型融合、自動建模及豐富的建模工具組件。PaddleTS無論是在功能豐富度上,還是在集成的時序算法數量上,都超過了市面上典型的開源時序產品。除了基礎能力以外,產品還有以下特色功能:

全面的數據類型支持:PaddleTS提供的協變量支持功能,支持歷史觀測協變量、未來可知協變量、靜態協變量和分類變量等各種協變量數據類型,幫助開發者有效利用各種數據充分發揮數據的價值。

主流新穎的深度模型:PaddleTS集成了Transformer、TCN、VAE、TS2Vec、N-beats等豐富的深度學習模型,可以很好的捕捉複雜時序場景中的多變量動態依賴關係,解決長周期、多變量、小樣本等問題,取得更好的模型效果。
豐富的分析建模工具集:PaddleTS內置了時序特徵處理、數據分析、回測、滾動預測、自動建模、模型融合等分析建模過程中非常實用的功能,可以幫助開發者減少編碼數量,提升開發效率。


簡單易用、快速上手


不需要深刻的專業背景和複雜的特徵工程

3行代碼實現時序建模

PaddleTS覆蓋了大部分主流深度學習模型,開發者只需將數據按照格式要求灌入數據集,再通過簡單的歸一化處理即可進行模型訓練預測。相較於傳統統計模型對開發者統計知識的要求,機器學習模型在訓練前複雜的特徵工程,開發者使用PaddleTS構建深度學習模型更加快速、簡單。
時序建模代碼示例
dataset=TSDataset.load_from_dataframe(df,**kwargs)mlp=MLPRegressor(in_chunk_len=7*24,out_chunk_len=24)mlp.fit(dataset)

兼容第三方庫,機器學習模型也能高效利用

PaddleTS默認集成了sklearn、pyod等第三方庫,解決了傳統機器學習方法不能直接用於時序數據,且建模過程複雜等問題。開發者通過幾行代碼即可實現傳統機器學習的調用,搭配PaddleTS中豐富的建模全流程工具,充分滿足個性化需求。

時序預測代碼示例

ts_forecasting_model=make_ml_model(sklearn.linear_model.LinearRegression,in_chunk_len=16,out_chunk_len=1)ts_forecasting_model.fit(tsdataset)res=ts_forecasting_model.predict(tsdataset)
時序異常檢測代碼示例
ts_anomaly_model=make_ml_model(pyod.models.knn.KNN,in_chunk_len=16)ts_anomaly_model.fit(tsdataset)res=ts_anomaly_model.predict(tsdataset)

時序專屬的自動建模與集成預測器

策略更優、操作更簡單

PaddleTS將傳統的自動建模和集成學習工具進行改良優化,針對時序場景重新設計了更加便捷的建模工具。
自動建模AutoTS:在該模塊中內置了默認搜索空間、超參優化算法、重採樣策略與參數評估策略,開發者僅需2行代碼即可完成自動建模的主體訓練流程定義。

AutoTS功能代碼示例

autots_model=AutoTS(MLPRegressor,96,24)autots_model.fit(tsdataset)
集成預測器Ensemble:該模塊採用集成學習的思想,提供兩種集成預測器,開發者通過簡單的操作即可把多個PaddleTS預測器集合成一個,滿足多數場景下的集成需求。

Ensemble功能代碼示例

ensemble_model=StackingEnsembleForecaster(96,24,estimators=[(NHiTSModel,nhits_params),(RNNBlockRegressor,rnn_params),(MLPRegressor,mlp_params)])ensemble_model.fit(ts_train,ts_val)


速度快、效果優


PaddleTS基於飛槳框架,對數據加載、模型訓練、模型預測等核心環節精心打磨優化,效率相比同類開源產品有非常大的優勢。
訓練環境:GPU CUDA 11.2,設備 NVIDIA A30
指標說明:MAE,即絕對平均誤差,它表示預測值和觀測值之間絕對誤差的平均值,越小則預測效果越好
此外,相較於同類產品,使用PaddleTS中的AutoTS自動建模工具可以取得更優的建模效果,在大多數情況下優於專家經驗調參。

WTH數據集:包含2010年至2013年4年間近1600個美國地區的當地氣候數據

*利用默認的TPE算法,運行50次參數試驗


PaddleTS直播課預告


11月8日(周二)19:00,百度資深工程師將為大家深度解析時序建模算法庫PaddleTS,歡迎大家掃描海報二維碼報名直播課,與各位開發者進行技術和業務深度交流!

更多精彩直播推薦

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()