引言
科技的快速發(fā)展和新技術的出現使人們對電力有著持續(xù)性增長的需求,能源短缺問題也日益凸顯。中國電力企業(yè)聯合會于2021年底發(fā)布的《電力行業(yè)碳達峰碳中和發(fā)展路徑研究》顯示,電力行業(yè)正迎來重大機遇與挑戰(zhàn),對于電力數據的價值挖掘研究與應用已經成為未來發(fā)展的必然趨勢,充分發(fā)揮電網基礎設施的作用,提高資源配置能力是應對該現狀的有效方式之一。
當前,發(fā)電方式存在不穩(wěn)定性,用電高峰期無法保證有效持續(xù)供電。部分地區(qū)電網網架結構薄弱、送電通道容量上限不高,供電量受限,未來一段時期我國部分地區(qū)電力供需緊張態(tài)勢仍將持續(xù)。在高校中,供電需求量大,用電高峰期的電量峰值較其他區(qū)域高,供電壓力大,對電力資源進行合理配置顯得尤為重要。本文通過采集學生用電數據,對學生宿舍用電情況進行分析,建立模型對校園宿舍用電量進行學習和預測。預測未來幾天內的用電需求,不僅能夠給學生作為參考,也可對電力供需提供預警功能,保障宿舍電力供需平衡,加強高校的節(jié)電管理,從源頭上減少能耗。
1模型理論
1.1時間序列
時間序列預測是根據歷史時間序列數據建立模型的方法,被廣泛應用于經濟學、管理學、氣象學等領域。對某一個或者一組變量X(t)進行觀察測量,將在一系列時刻t1,t2,…,tn所得的離散數字組成的序列集合,稱之為時間序列。時間序列預測方法首先考慮的是事物的趨勢性,通過歷史數據來預測事物的發(fā)展趨勢;其次考慮的是事物的季節(jié)性,如氣候條件、節(jié)假日等各種周期性因素,根據事物發(fā)展的季節(jié)性變化預測事物的周期變化;最后考慮隨機因素的影響,不規(guī)則波動通常夾雜在時間序列之中,以致時間序列產生波浪式或振蕩式變動?;陔娏啃蛄械奶匦砸约皵祿?本文基于自回歸滑動平均模型(Auto-RegressiveandMovingAverageModel,ARMA)建立模型。ARMA模型是研究時間序列的常用方法,用于研究平穩(wěn)隨機過程有理譜,適用性很強。
1.2神經網絡
神經網絡作為機器學習方法之一,起源于人類對大腦的研究,是一種仿生的網絡結構。通過大量簡單的生物神經元之間的相互連接,來構造復雜的網絡結構,以模擬生物神經網絡的智能行為,從而克服傳統算法處理智能信息的困難?;陂L短期記憶人工神經網絡(Long-shortTermMemory,LSTM)獨特的設計結構,LSTM作為一種特殊的遞歸神經網絡,不僅可以利用時間序列對輸入進行分析,還不會像普通的遞歸神經網絡忽略長時間前的有用信息,因此,本文根據電量序列的特性選擇基于LSTM建立模型。
2模型建立與求解
2.1數據采集
本文以廈門大學漳州校區(qū)的學生作為調查對象,廈門大學漳州校區(qū)宿舍用電情況作為主要調查內容,采用問卷調查法和實地觀察法兩種數據采集方法。
2.1.1問卷調查法
本項目組前期通過查詢相關資料制訂了本次調查問卷,調查問卷設計分為三大部分:第一部分為被調查者基本情況,第二部分為被調查者對宿舍用電器的使用情況,第三部分為被調查者夏冬兩季用電量及電費支出情況,總計包含12個問題。在本次調查中,共發(fā)出問卷168份,收回問卷168份,有效問卷154份,有效回收率為91.7%。對調查問卷的數據進行分析,總結了影響本校大學生宿舍用電量情況的因素,并對校園節(jié)電管理及大學生節(jié)電意識培養(yǎng)提出了相關意見和建議。
2.1.2實地觀察法
本文以廈門大學漳州校區(qū)為例,對校園內各個園區(qū)共58幢宿舍樓采取隨機抽樣調查的方法,通過學校的電費網站采集了每個園區(qū)各一個宿舍從9月7日至12月7日的每日用電量。數據可視化如圖1所示。
2.2影響因素分析
為了探究用電情況是否受性別影響,抽樣統計不同宿舍樓同宿舍號的9、10、11和12月的用電量情況,結果如表1所示。
為了更直觀地進行對比,基于表1數據繪制圖2。
統計北區(qū)不同宿舍樓同宿舍號的9、10、11和12月的用電量,發(fā)現用電量情況是受性別影響的,從圖2中可以看出,女生宿舍在9月一11月的平均用電量都明顯高于男生宿舍。將該結論與168份調查問卷的結果對比來看,在耗電最多的電器中有14.29%的男生選擇了日常電器這一選項,而選擇這一選項的女生有29.39%。經過實地走訪調查發(fā)現,女生宿舍備有電器的數量比男生來得多,并且功率也相對更大,可以推斷出這是造成男女生宿舍用電量差異較為關鍵的部分。
2.3ARMA模型建立
ARMA的基本思想是把AR和MA模型結合起來,使得所用參數個數保持很少。模型形式為:
式中:{小i}為自回歸系數:{9i}為移動平均系數:{yl}為時間序列:{gl}為白噪聲序列:p和.為非負整數。
本文通過觀察PACF、ACF截尾以及AIC、BIC準則來分別判斷p和.的值,以進行模型定階。
從預測日期開始,利用ARMA模型對不同園區(qū)宿舍電量進行預測,預測值作為新的樣本加入預測模型,逐日增加樣本量,計算預測值與實際值y的累計差異率s,公式為:
通過觀察差異率變動趨勢,對預測數據進行有效修正,最終確定選擇ARMA)9,1)作為預測模型。
2.4LSTM模型建立
LSTM是一種特殊的RNN,可以學習到長期記憶信息,解決長時依賴問題,并且在反向傳播求導時梯度幾乎保持為常量,避免了梯度消失或爆炸,模型收斂速度更快。LSTM神經網絡模型的循環(huán)單元內部包括三個結構:遺忘門、輸入門和輸出門。遺忘門決定了上一時刻的工作狀態(tài)需要保留多少到當前時刻,可由tanh函數實現:輸入門決定當前時刻網絡輸入哪些信息來更新長期記憶狀態(tài),該閥門篩選出有用信息喂入網絡,可由sigmoid函數實現:最后一個是輸出閥門,它置于網絡的輸出之后,用于控制單元狀態(tài),可以自動提取輸出信息中的重要部分,它也由sigmoid函數實現。
LSTM網絡的基本單元如圖3所示,fl,il,ol分別為遺忘門、輸入門、輸出門:xl,gl,hl,Cl分別為l時刻的輸入、輸入節(jié)點、中間輸出和細胞單元的狀態(tài):口、tanh分別為sigmoid和tanh函數變化。
本文先將數據轉換為平穩(wěn)數據,再將序列構造為一個有監(jiān)督的學習問題,并把數據集以2:1的比例分成訓練數據集和測試數據集。為了達到較好的訓練效果,本文將batchsize設置為1000輪,以進行模型訓練。
3實驗結果與分析
本文以Yx園區(qū)宿舍的數據為例分別進行模型訓練,將實際值與兩種預測模型得到的預測值進行可視化,結果如圖4所示。由圖4可知兩種模型預測效果都較為不錯,走向與實際值大致相同。
為了更好地評價并對比模型效果,本文分別計算了LSTM的平均絕對值誤差MAE與平均絕對值百分比誤差MAPE,這兩個指標都經常被用于時間序列分析中來評價衡量預測誤差和準確性。
MAE公式為:
MAPE公式為:
結果如表2所示。
從結果可以看出,LSTM模型的MAE與MAPE均小于ARMA模型,所以LSTM模型略優(yōu)于ARMA模型。
4結論
(1)本文通過不同的時間序列模型預測對照,得出LSTM模型的預測效果優(yōu)于ARMA模型,機器學習相較傳統的時間序列模型更加精準。
(2)本文通過對廈門大學漳州校區(qū)宿舍用電量進行調查,得出性別是影響宿舍用電量的重要因素之一,原因是女生總體使用電器更多。此外,電量可能也與氣溫有關。
(3)根據用電量情況的預測既可以合理規(guī)劃各地區(qū)配電網,也能為宿舍用電預警提供實踐依據,避免因忘繳電費引起停電,造成生活不便。
(4)時間序列模型還可用于動植物種群數量逐月或逐年的消長進程、某證券交易所每日收盤指數等等,還能夠用在國民經濟宏觀操縱、區(qū)域綜合進展計劃、企業(yè)經營治理、市場潛量預測、氣象預報、水文預報、地震預兆預報、農作物病蟲災害預報、環(huán)境污染操縱、生態(tài)平穩(wěn)、天文學和海洋學等方面。
(5)神經網絡模型預測具有一定的可行性及可靠性,電網公司可以根據研究資料與成果,基于事故在范圍、時間等方面的信息,快速預估停電造成的影響,還可以結合已經掌握的信息快速制訂解決方案。