基于支持向量機的燃氣短期負荷預測

摘 要

摘要:介紹支持向量機的原理和支持向量回歸模型,提出支持向量回歸(SVR)模型的城市燃氣短期負荷預測方法。探討輸入樣本數(shù)據的選擇和預處理方法、核函數(shù)和支持向量機參數(shù)的選擇,

摘要:介紹支持向量機的原理和支持向量回歸模型,提出支持向量回歸(SVR)模型的城市燃氣短期負荷預測方法。探討輸入樣本數(shù)據的選擇和預處理方法、核函數(shù)和支持向量機參數(shù)的選擇,結合某城市燃氣日負荷數(shù)據進行燃氣短期負荷預測。與BP神經網絡預測方法相比,支持向量回歸模型預測方法用于小樣本情況下的燃氣短期負荷預測精度略高。

關鍵詞:燃氣負荷預測;  短期負荷;  支持向量機;  BP神經網絡;  支持向量回歸模型

Short-term Gas Load Forecast Based on Support Vector Machine

Abstract: The principle of support vector machine and the support vector regression model are introduced. A short-term city gas load forecast method based on support vector regression model is proposed. The selection and pretreatment method of input sample data and the selection of kernel function support vector machine parameters are discussed. The short-term gas load forecast is conducted with the daily gas load data of a city. For small sample datathe forecast method based on support vector regression model has higher short-term city gas load forecast precision than the forecast method based on BP neural network.

Key words: gas load forecast;short-term loadsupport vector machine;BP neural networksupport vector regression model

1 概述

國內外對燃氣負荷預測的研究[1-7]主要開始于20世紀后期,隨著技術進步和計算機的廣泛應用,各種新理論和方法相繼被應用于燃氣負荷預測。早期常用的方法是基于統(tǒng)計學的回歸分析和時間序列分析,但是由于負荷預測問題的高度非線性和不確定性,傳統(tǒng)方法往往難以建立精確的數(shù)學模型,為解決這一問題,我們引入了灰色理論、人工神經網絡和支持向量機等理論方法。本文利用支持向量回歸模型進行燃氣短期負荷預測研究,為建立城鎮(zhèn)燃氣短期負荷預測模型提供一條新途徑。

2 支持向量機的原理和支持向量回歸模型

支持向量機(Support Vector Machine)簡稱SVM[8],是一種監(jiān)督式學習的方法,廣泛應用于統(tǒng)計分類以及回歸分析中,其算法見圖1。支持向量機首先通過內積核函數(shù)K(X)定義的非線性變換將輸入空間X變換到一個高維空間,然后在這個空間中求最優(yōu)分類面,其輸出Y是中間節(jié)點的線性組合,每個中間節(jié)點對應一個輸入樣本與一個支持向量的內積,因此也被稱為支持向量網絡。研究表明[9-10],相對于神經網絡而言,支持向量回歸模型不存在局部極小值問題,對于解決模糊、隨機、不確定性、樣本數(shù)有限和非線性的復雜問題具有明顯優(yōu)勢。支持向量機從結構風險最小化原則出發(fā),為機器學習提供了一個嶄新的方法,被認為是小樣本學習中一種很好的機器學習算法。

 

SVM常用的學習算法有Chunking算法、分解算法、序列最小優(yōu)化SM0法、最近點快速迭代(NPA)算法和最小二乘法等。SVM方法在建模過程中,核函數(shù)及其參數(shù)對模型預測的執(zhí)行效率和推廣預測能力影響較大,對于SVM參數(shù)的優(yōu)化選取,目前尚未有統(tǒng)一的最佳方案,常用的方法就是使參數(shù)在一定范圍內取值,采用試算方法來選取最優(yōu)的一組參數(shù)。為避免試算的盲目性,除常規(guī)的網格劃分方法外,目前常用的啟發(fā)式參數(shù)尋優(yōu)方法還有遺傳算法(GA)和粒子群優(yōu)化算法(PSO)等。  

2.1 基本原理

假設樣本(xiyi),i=1,nxi∈Rn,yi∈R(Rnn維的實數(shù)空間,R為實數(shù)),支持向量機的基本原理就是將學習樣本(xiyi)通過映射函數(shù)ø映射到一個高維特征空間,然后選擇適當?shù)暮撕瘮?shù)K(X)和懲罰參數(shù)C,通過求解二次優(yōu)化問題可得到松弛變量δi和參數(shù)b。

優(yōu)化的目標函數(shù)為F=wTw,目標函數(shù)F可以保證分類的最優(yōu)性,約束條件(2)則保證分類的正確性。為了消除異常樣本的影響,引入松弛變量δi,相應的目標函數(shù)可以表示為:

 

式中 w——超平面的權值向量

     C——懲罰參數(shù),對錯誤分類起懲罰作用

    δi——松弛變量,其作用是衡量對樣本(xi,yi)的誤分類程度

     b——參數(shù)

向量xi通過函數(shù)ø (x)被映射到高維空間,K(xiyi)=ø(xiT)ø(xj)為核函數(shù)。支持向量機通過將輸入空間映射到一個高維內積空間,解一個線性約束的二次規(guī)劃問題得到全局最優(yōu)解,從而有效避免了“維數(shù)災難”,保證了收斂速度。在最優(yōu)分類面中選擇適當?shù)暮撕瘮?shù),可以實現(xiàn)某一非線性變換后的線性分類,且不增加其計算的復雜性。

SVM中最常用的幾種核函數(shù)見式(3)(6),其中線性核函數(shù)可以看作是多項式核函數(shù)的一種特殊情況。

 

2.2支持向量回歸模型(SVR)

1996年國外相關學者提出了一種利用支持向量機進行回歸的計算方法。該方法需要解決的問題與式(1)類似,通常被稱為支持向量回歸(SVR)模型。假設待回歸的函數(shù)為f(x)=wx+P,樣本數(shù)據(xi,yi)i=1,n,xi∈Rnyi∈R,按照支持向量機理論,其擬合函數(shù)為:

 

 

式中 αi,α'i,p——參數(shù)

(7)中的參數(shù)αi,α'i,p通過解下面的二次優(yōu)化問題獲得,優(yōu)化的目標函數(shù)為:

 

約束條件為:

 

式中 μ——預測誤差

     C1——懲罰因子,表示對超出誤差μ的樣本的懲罰程度

3 燃氣負荷預測的支持向量回歸模型

燃氣負荷是由數(shù)量眾多的各類用戶用氣所形成,由于影響負荷的各種自然、社會和經濟條件不斷變化,以及終端用戶的使用情況影響,導致燃氣負荷處于一個動態(tài)的變化過程。燃氣負荷具有時變性,對于短期負荷預測而言,最重要的影響因素是星期幾、溫度、天氣、是否節(jié)假日等特殊日等。

假設已有多日的燃氣負荷實際數(shù)據(xiyi),i=12,m,其中xi為第i天燃氣負荷的影響因素,yi為第i天的燃氣負荷實測值。利用支持向量回歸模型進行燃氣負荷預測,即建立每天燃氣負荷影響因素xi與燃氣負荷yi之間的非線性函數(shù)關系,即:

 

根據支持向理機理論,該非線性函數(shù)關系可以用支持向量機對前i-1天實測數(shù)據的學習來獲得,其回歸計算公式為:

 

3.1 確定輸入輸出

燃氣負荷預測支持向量回歸模型的輸入因素通常為溫度(包括最高、最低和平均溫度)、日期和天氣情況,輸出值則為當日的燃氣負荷。支持向量回歸模型只能處理非模糊的定量數(shù)據,采用較多的負荷相關因素作為輸入可以提高預測的精度,輸入的影響因素越多,網絡運算的精度越高,樣本訓練所需的時間也會越多,因此在實際應用時應根據已有資料選擇適當數(shù)量的輸入因素。

燃氣負荷處于一個隨機非平穩(wěn)的過程,由于受到各種因素的影響,其歷史數(shù)據常常包含部分不良數(shù)據,因此通常在使用前要進行預處理,例如采用低通濾波法去除分散或連續(xù)出現(xiàn)的不大的尖峰擾動,使樣本數(shù)據更具有實際意義。在樣本選擇和優(yōu)化處理過程中,如果數(shù)據源中有大量未經處理或者虛假的數(shù)據,將會妨礙對網絡的正確訓練,因此剔除或使用正常數(shù)據置換那些不符合實際的異常樣本數(shù)據,確定出數(shù)據的合適數(shù)目。

3.2 參數(shù)的優(yōu)選

支持向量機參數(shù)的優(yōu)選主要包括兩部分內容,一是核函數(shù)的選擇,二是參數(shù)的優(yōu)選。通常情況下,我們優(yōu)先選擇RBF核函數(shù),與其他核函數(shù)相比,它在數(shù)值計算上具有一定優(yōu)勢,而線性核函數(shù)和Sigmoid核函數(shù)如果選擇適合的參數(shù)都可以轉變?yōu)?span lang="EN-US">RBF核函數(shù)。對于支持向量機參數(shù)的優(yōu)選,目前最常用的方法是采用網格劃分與交叉檢驗相結合的方法。

4 預測實例

4.1 預測流程

利用支持向量機進行燃氣短期負荷預測的基本流程見圖2。

 

4.2 預測實例

選擇某城市21天的燃氣負荷數(shù)據,初始訓練樣本為前7天的負荷數(shù)據(見表l),利用SVR預測第8天的燃氣負荷,然后將第8天的實測負荷并入初始訓練樣本,再利用SVR預測第9天的燃氣負荷,以此類推,可以得到第8天至第21天的燃氣負荷預測值及相對誤差(見表2)。

 

 

以星期幾、平均溫度、最高溫度、最低溫度、天氣情況作為SVR模型的輸入參數(shù),模型輸出為當日的燃氣負荷。由于各影響因素差別較大,為方便支持向量機的訓練和學習,需要將學習樣本和預測樣本數(shù)據進行歸一化處理,通常將樣本數(shù)據調整為[0,1][-11],分別用支持向量回歸模型和BP神經網絡模型進行訓練和預測,數(shù)據對比見表2。其中支持向量回歸模型選擇RBF函數(shù)作為核函數(shù),參數(shù)的選擇采用網格劃分和交叉檢驗來確定;BP神經網絡包括1個隱含層,根據試算結果選擇9個節(jié)點。

由表2可以看出,對于燃氣短期負荷的預測,SVR模型和BP神經網絡模型預測這兩種預測方法,除個別點外,相對誤差基本都在5%以內,預測值與實測值吻合良好。樣本數(shù)量較少時,SVR模型預測方法較BP神經網絡模型預測精度更高,隨著樣本數(shù)量的增大,兩者的預測相對誤差都呈下降趨勢。綜上所述,利用SVR模型預測燃氣短期負荷可行,并且對于小樣本數(shù)據,其預測準確度略高于BP神經網絡模型預測。

5 結論

燃氣短期負荷與其影響因素之間的關系是復雜的非線性關系,用傳統(tǒng)的數(shù)學模型很難處理。本文將支持向量機應用于城市燃氣短期負荷預測,建立星期幾、平均溫度、最高溫度、最低溫度、天氣情況與燃氣負荷的支持向量回歸模型,對某城市燃氣負荷進行預測,與BP神經網絡的預測結果對比后顯示,SVR預測方法準確度略高,具有很高的實用價值,并且在解決小樣本、非線性及高維模式識別問題中具有特有的優(yōu)勢。

 

參考文獻:

[1] 楊愛萍,鄧連杰,劉鳳國.城市燃氣負荷預測技術應用分析[J].煤氣與熱力,2011,31(9)A39-A41.

[2] 焦文玲,金佳賓,廉樂明,等.時間序列分析在城市天然氣短期負荷預測中的應用[J].哈爾濱建筑大學學報,200134(4)79-83.

[3] 焦文玲,朱寶成,馮玉剛.基于BP神經網絡城市燃氣短期負荷預測[J].煤氣與熱力,200626(12)12-15.

[4] 劉燕,張應輝,杜學平.基于同歸分析的北京市天然氣供應規(guī)模預測[J].煤氣與熱力,201030(6)A26-A29.

[5] 嚴銘卿,廉樂明,焦文玲,等.燃氣負荷及其預測模型[J].煤氣與熱力,200323(5)259-262.

[6] 焦文玲,鄒濤,鞏曉峰,等.燃氣日負荷影響因素的相關分析和偏相關分析[J].煤氣與熱力,2010,30(5)Bol-1705.

[7] 姚健,周偉國,張中秀.人工神經網絡法燃氣日負荷預測輸入變量選取[J].煤氣與熱力,201030(1)A28-A30.

[8] 浦星材,沈曉風,張清揚,等.基于偏最小二乘法的支持向量機短期負荷預測[J].電網與清潔能源,201127(10)32-35.

[9] 馬文濤.參數(shù)優(yōu)化LSSVM的巷道圍巖松動圈預測研究[J].巖土力學,200728(s1)460-464.

[10] 趙洪波.支持向量機在隧道圍巖變形預測中的應用[J].巖石力學與工程學報,2005,24(4)649-652.

 

本文作者:郭微 姜德義

作者單位:重慶大學煤礦災害動力學與控制國家重點實驗室