北京市天然氣日負(fù)荷預(yù)測(cè)實(shí)時(shí)優(yōu)化系統(tǒng)

摘 要

摘要:論述了北京市天然氣日負(fù)荷的特點(diǎn)、預(yù)測(cè)模型的建立及優(yōu)化過程。實(shí)現(xiàn)了智能動(dòng)態(tài)預(yù)測(cè),提高了預(yù)測(cè)模型的準(zhǔn)確度和可信度。關(guān)鍵詞:天然氣日負(fù)荷;負(fù)荷預(yù)測(cè);實(shí)時(shí)優(yōu)化Real-time Opti

摘要:論述了北京市天然氣日負(fù)荷的特點(diǎn)、預(yù)測(cè)模型的建立及優(yōu)化過程。實(shí)現(xiàn)了智能動(dòng)態(tài)預(yù)測(cè),提高了預(yù)測(cè)模型的準(zhǔn)確度和可信度。
關(guān)鍵詞:天然氣日負(fù)荷;負(fù)荷預(yù)測(cè);實(shí)時(shí)優(yōu)化
Real-time Optimization Forecast System of Natural Gas Daily Load in Beijing City
LI Chi-iia,LIU Yan,SHAO Zhen-yu
AbstractThe characteristics of natural gas daily load,the establishment and the optimization process of the forecast model for Beijing City are described.The intelligept dynamic forecast is realized,and the accuracy and reliability of the forecast model are improved.
Key wordsnatural gas daily load;load forecast;real-time optimization
    日負(fù)荷預(yù)測(cè)的準(zhǔn)確性關(guān)系到城市的供氣安全、穩(wěn)定及經(jīng)濟(jì)性,意義十分重大[1]。本文根據(jù)北京市天然氣日負(fù)荷變化特點(diǎn),在分時(shí)段采用合適的預(yù)測(cè)模型基礎(chǔ)上,利用創(chuàng)新的實(shí)時(shí)優(yōu)化系統(tǒng),對(duì)預(yù)測(cè)模型進(jìn)行實(shí)時(shí)優(yōu)化后再預(yù)測(cè),提高了預(yù)測(cè)模型準(zhǔn)確度和可信度。
1 北京市天然氣日負(fù)荷特點(diǎn)
    北京市大量天然氣要用于供暖,一年中用氣結(jié)構(gòu)發(fā)生顯著變化,造成全年用氣極不均勻,年高峰日用氣量相當(dāng)于低峰日用氣量的8倍左右。結(jié)合北京市溫度變化及用氣結(jié)構(gòu)的時(shí)段變化特性,經(jīng)過分析,北京市日負(fù)荷可以分為3個(gè)時(shí)段,即供暖期(當(dāng)年11月15日至次年3月15日)、供暖過渡期(當(dāng)年10月25日至11月14日及次年3月16日至3月31日)及用氣平穩(wěn)期(當(dāng)年4月1日至10月24日)。不同的時(shí)段對(duì)應(yīng)著不同的負(fù)荷變化規(guī)律。在供暖期大量天然氣用于供暖,負(fù)荷主要受溫度影響,變化較大。供暖過渡期主要指自主供暖用戶的陸續(xù)開始或結(jié)束期間,表現(xiàn)出負(fù)荷急劇增加或減少。用氣平穩(wěn)期用氣負(fù)荷變化不大,目前北京市夏季天然氣制冷用戶用氣量比例還很小,對(duì)總負(fù)荷變化影響也較小。
2 負(fù)荷預(yù)測(cè)模型的確定
    北京市天然氣負(fù)荷受用氣結(jié)構(gòu)、氣象因素、節(jié)假日、隨機(jī)因素等影響,全年用氣極不均勻。對(duì)于北京市供暖期負(fù)荷變化明顯不同于非供暖期的特殊情況,完全有必要根據(jù)不同時(shí)段的特性,研究使用不同的預(yù)測(cè)方法。不可能采用一種模型就可以使全年每天的負(fù)荷預(yù)測(cè)都取得較好的準(zhǔn)確度。
    綜合分析目前常用的各種預(yù)測(cè)方法并結(jié)合北京市負(fù)荷變化的特點(diǎn),基本確定了包括神經(jīng)網(wǎng)絡(luò)、時(shí)間序列、線性回歸這3種預(yù)測(cè)方法[2~6],以預(yù)測(cè)對(duì)應(yīng)的各時(shí)段負(fù)荷。
    對(duì)于供暖期,其主要影響因素是平均溫度及近幾天負(fù)荷。經(jīng)計(jì)算得,近年來供暖期日負(fù)荷與日平均溫度及前2d的負(fù)荷相關(guān)系數(shù)相當(dāng)大。供暖期適合用線性回歸模型預(yù)測(cè)。近年來供暖過渡期對(duì)應(yīng)時(shí)期變化規(guī)律趨于一致,適合參照歷史變化信息與當(dāng)前主要影響因素建立神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè),樣本選取一定量的前2年同期數(shù)據(jù)及預(yù)測(cè)日近20d左右的數(shù)據(jù),最后訓(xùn)練學(xué)習(xí)并預(yù)測(cè)。1年中用氣平穩(wěn)期日用氣量變化不大,可看作一個(gè)隨時(shí)間變化的平穩(wěn)時(shí)間序列,經(jīng)差分處理后非常適合于用時(shí)間序列ARMA模型建模預(yù)測(cè)。
3 負(fù)荷預(yù)測(cè)模型優(yōu)化
    城市天然氣負(fù)荷一直在動(dòng)態(tài)變化中,分時(shí)段確定的負(fù)荷預(yù)測(cè)模型并不能適應(yīng)天然氣的發(fā)展。同一時(shí)段其主要影響因素也在動(dòng)態(tài)變化,例如各個(gè)供暖期內(nèi)的前5個(gè)影響因素就經(jīng)常發(fā)生變化,即使同一供暖期主要影響因素在不同時(shí)間段也不盡相同。同一預(yù)測(cè)方法的建模變量數(shù)、樣本量選取及參數(shù)都將影響到預(yù)測(cè)模型的準(zhǔn)確度。提高模型的預(yù)測(cè)準(zhǔn)確度并能讓軟件分析計(jì)算出最優(yōu)模型參數(shù),并給出最優(yōu)預(yù)測(cè)值,是預(yù)測(cè)軟件實(shí)用化的必然要求,也只有這樣才能從根本解決預(yù)測(cè)準(zhǔn)確度問題。為此,本文創(chuàng)建了預(yù)測(cè)模型評(píng)估與實(shí)時(shí)優(yōu)化系統(tǒng)。
3.1 預(yù)測(cè)模型評(píng)估
    預(yù)測(cè)模型學(xué)習(xí)方法的泛化性能涉及它在獨(dú)立的檢驗(yàn)數(shù)據(jù)上的預(yù)測(cè)能力。在實(shí)踐中,泛化性能評(píng)估尤為重要,它指導(dǎo)學(xué)習(xí)方法或模型的選擇,并為我們提供最終選定模型的質(zhì)的度量[7]。
由訓(xùn)練樣本估計(jì)的預(yù)測(cè)模型對(duì)應(yīng)的樣本誤差為:
 
式中Ey——由訓(xùn)練樣本估計(jì)的預(yù)測(cè)模型對(duì)應(yīng)的樣本誤差
    N——訓(xùn)練樣本的數(shù)量
    i——訓(xùn)練樣本編號(hào)
    yi——訓(xùn)練樣本中對(duì)應(yīng)輸入變量xi的目標(biāo)變量
    f——由訓(xùn)練樣本估計(jì)的預(yù)測(cè)模型
    xi——訓(xùn)練樣本輸入變量
   模型泛化誤差是指預(yù)測(cè)模型在獨(dú)立于訓(xùn)練樣本的新數(shù)據(jù)上的期望預(yù)測(cè)誤差。我們需要確定泛化誤差的大小,而樣本誤差顯然不能作為泛化誤差的估計(jì)值。隨著訓(xùn)練步數(shù)的增加,模型的復(fù)雜度提高,擬合優(yōu)度提高,可以使得樣本誤差減小到0,然而樣本誤差為0的模型由于過分?jǐn)M合訓(xùn)練數(shù)據(jù),泛化性能通常很差。擬合優(yōu)度的高低并不能用來判斷建立模型的好壞。只有泛化誤差的大小才能評(píng)估預(yù)測(cè)模型的優(yōu)劣。
    因此,通常將建模數(shù)據(jù)分成3部分:訓(xùn)練樣本集、驗(yàn)證集和檢驗(yàn)集。訓(xùn)練樣本集用于擬合模型,驗(yàn)證集用來估計(jì)模型的預(yù)測(cè)誤差,檢驗(yàn)集用來評(píng)估最終選定的模型的泛化誤差。但是在實(shí)際應(yīng)用中,模型的泛化誤差只有在進(jìn)行了預(yù)測(cè)且預(yù)測(cè)結(jié)果實(shí)際發(fā)生后才能知道,而此時(shí)知道了預(yù)測(cè)誤差并沒有多大意義,這是因?yàn)橹缹?shí)際結(jié)果前,我們就需要根據(jù)預(yù)測(cè)數(shù)據(jù)進(jìn)行決策。因此要找到一種根據(jù)樣本或檢驗(yàn)數(shù)據(jù)的誤差來估計(jì)泛化誤差的實(shí)用方法。
    目前估計(jì)泛化誤差最簡(jiǎn)單且最廣泛使用的方法是交叉驗(yàn)證。這種方法直接估計(jì)樣本外誤差。通常將數(shù)據(jù)分成大致相等的k部分,k一般取5或10,對(duì)于第k部分,用其他的k-1部分?jǐn)M合建立模型預(yù)測(cè)第k部分?jǐn)?shù)據(jù),從而計(jì)算擬合模型的泛化誤差。
泛化誤差的交叉驗(yàn)證估計(jì)如下:
 
式中Ef(α)——模型f-k(xi,α)泛化誤差的交叉驗(yàn)證估計(jì)
    α——預(yù)測(cè)模型的調(diào)整參數(shù)
    f-k(xi,α)——去掉了第七部分?jǐn)?shù)據(jù)后的樣本估計(jì)的由參數(shù)OL調(diào)整的預(yù)測(cè)模型
3.2 實(shí)時(shí)優(yōu)化系統(tǒng)
通過分析北京市天然氣日負(fù)荷數(shù)據(jù),發(fā)現(xiàn)負(fù)荷變化受其最近幾天的負(fù)荷變化影響最大。根據(jù)“近大遠(yuǎn)小”的規(guī)律并結(jié)合交叉驗(yàn)證理論,模型優(yōu)化系統(tǒng)求預(yù)測(cè)模型泛化誤差估計(jì)值時(shí),人為地為預(yù)測(cè)日期的前2d加上了較大的權(quán)值,其權(quán)值參照預(yù)測(cè)日期近段時(shí)間內(nèi)實(shí)際預(yù)測(cè)模型誤差進(jìn)行適應(yīng)性調(diào)整。本文以式(3)計(jì)算模型最優(yōu)參數(shù)。
 
式中E′f(α)——引入調(diào)整權(quán)值后的模型f-k(xi,α)泛化誤差的交叉驗(yàn)證估計(jì)
    λ(i)——與目標(biāo)變量yi相對(duì)應(yīng)的權(quán)值,由模型評(píng)優(yōu)模塊根據(jù)歷史預(yù)測(cè)結(jié)果實(shí)際誤差確定
    其工作過程如下:分析當(dāng)前需要預(yù)測(cè)日期前幾天負(fù)荷及歷史同期負(fù)荷變化情況,實(shí)時(shí)分析近期主要影響因素,作為模型輸入變量。對(duì)建模樣本數(shù)、是否考慮星期及節(jié)假日影響、模型主要變量數(shù)及模型結(jié)構(gòu)參數(shù)等尋優(yōu)。相當(dāng)于建立廠一系列不同的模型,根據(jù)歷史預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的誤差大小確定評(píng)優(yōu)準(zhǔn)則及相應(yīng)的權(quán)值,由式(3)計(jì)算得出誤差平方和最小時(shí)對(duì)應(yīng)的預(yù)測(cè)模型參數(shù),再以評(píng)估確定的最佳模型進(jìn)行預(yù)測(cè)。當(dāng)預(yù)測(cè)結(jié)果的真值出現(xiàn)后,進(jìn)一步對(duì)預(yù)測(cè)結(jié)果進(jìn)行后評(píng)價(jià)及誤差統(tǒng)計(jì),為下一步預(yù)測(cè)時(shí)確定或修正評(píng)優(yōu)準(zhǔn)則提供依據(jù)。預(yù)測(cè)工作流程見圖1。
 

4 日負(fù)荷預(yù)測(cè)結(jié)果
    北京市天然氣日負(fù)荷預(yù)測(cè)系統(tǒng)由可視化編程語言VB基于MATLAB數(shù)值計(jì)算軟件和SQL Server2000數(shù)據(jù)庫(kù)環(huán)境混合編程開發(fā)完成。系統(tǒng)結(jié)構(gòu)采用CS(客戶端-服務(wù)器)結(jié)構(gòu),即數(shù)據(jù)庫(kù)安裝在服務(wù)器上,應(yīng)用程序安裝在各臺(tái)電腦上,應(yīng)用程序通過ODBC訪問數(shù)據(jù)庫(kù)。用戶只需安裝應(yīng)用程序便可實(shí)現(xiàn)對(duì)燃?xì)庳?fù)荷的預(yù)測(cè)、指標(biāo)統(tǒng)計(jì)以及用戶信息等操作。開發(fā)的負(fù)荷預(yù)測(cè)系統(tǒng),經(jīng)過在不同時(shí)段自動(dòng)選擇不同的預(yù)測(cè)模型,并采用模型實(shí)時(shí)優(yōu)化系統(tǒng)得出最佳預(yù)測(cè)模型。表1是北京市2006年3月16日至2007年10月31日共595d的天然氣日負(fù)荷的預(yù)測(cè)統(tǒng)計(jì)結(jié)果。表1中︱δ︱表示相對(duì)誤差絕對(duì)值。
表1 天然氣日負(fù)荷預(yù)測(cè)統(tǒng)計(jì)結(jié)果
相對(duì)誤差范圍
所占比例/%
相對(duì)誤差范圍
所占比例/%
︱δ︱<1%
23.87
5%︱δ︱<7%
11.26
1%︱δ︱<2%
22.18
7%︱δ︱<10%
4.54
2%︱δ︱<3%
15.80
︱δ︱≥10%
1.85
3%︱δ︱<5%
20.50
    可以看出,預(yù)測(cè)結(jié)果相對(duì)誤差絕對(duì)值小于5%者占總天數(shù)的82.35%,大于10%者占總天數(shù)的1.85%。計(jì)算得到595d的預(yù)測(cè)結(jié)果的相對(duì)誤差絕對(duì)值平均值為2.95%,總體情況較好。但最大相對(duì)誤差達(dá)26.2%,調(diào)查發(fā)現(xiàn)是因一些大用戶突然啟停等造成負(fù)荷突然大幅度變化而造成,如2006年6月24日用氣量為459.6×104m3/d,而6月25日突降為350.1×104m3/d,造成預(yù)測(cè)相對(duì)誤差為26.2%。2006年8月7日用氣量為367.0×104m3/d,而8月8日突增為507.1×104m3/d,預(yù)測(cè)相對(duì)誤差為-19.7%。燃?xì)夤救羟袑?shí)掌握大用戶的用氣計(jì)劃情況,對(duì)相應(yīng)的預(yù)測(cè)值進(jìn)行必要的修正,則效果會(huì)更好。
5 結(jié)論
    在分時(shí)段采用不同的預(yù)測(cè)模型的基礎(chǔ)上,利用模型實(shí)時(shí)優(yōu)化系統(tǒng)自動(dòng)計(jì)算出最優(yōu)模型參數(shù)進(jìn)行預(yù)測(cè),使預(yù)測(cè)模型能主動(dòng)學(xué)習(xí)并跟隨天然氣負(fù)荷規(guī)律變化,解決了以前負(fù)荷預(yù)測(cè)模型不能適應(yīng)城市天然氣發(fā)展變化的矛盾,大大提高了預(yù)測(cè)模型智能化程度,預(yù)測(cè)準(zhǔn)確度也有明顯提高,且更加穩(wěn)定可靠,是解決天然氣日負(fù)荷預(yù)測(cè)問題的一條新途徑。
    在軟件智能預(yù)測(cè)的基礎(chǔ)上,掌握一些大用戶突然變化情況并結(jié)合專家的寶貴知識(shí)及經(jīng)驗(yàn),適當(dāng)對(duì)預(yù)測(cè)結(jié)果進(jìn)行必要的修正,可以一定程度上解決預(yù)測(cè)軟件的不足。另外,進(jìn)一步研究?jī)?yōu)化學(xué)習(xí)規(guī)則,并加入更多的預(yù)測(cè)模型,在實(shí)時(shí)智能優(yōu)化系統(tǒng)這一平臺(tái)下,將有效地提高負(fù)荷預(yù)測(cè)準(zhǔn)確度和可靠度。
參考文獻(xiàn):
[1] 席德粹,焦文玲,李持佳,等.上海市燃?xì)庳?fù)荷預(yù)測(cè)系統(tǒng)的開發(fā)與試驗(yàn)運(yùn)行[J].城市燃?xì)猓?004,(7):14-16.
[2] 焦文玲,崔建華,廉樂明,等.城市燃?xì)舛唐谥芷谪?fù)荷預(yù)測(cè)的時(shí)序模型[J].天然氣工業(yè),2002,(1):92-94.
[3] 李持佳,焦文玲,朱建豪,等.基于人工神經(jīng)網(wǎng)絡(luò)的春節(jié)期間燃?xì)庳?fù)荷預(yù)測(cè)[J].煤氣與熱力,2004,24(9):477-480.
[4] 嚴(yán)銘卿,廉樂明,焦文玲,等.燃?xì)庳?fù)荷及其預(yù)測(cè)模型[J].煤氣與熱力,2003,23(5):259-266.
[5] 焦文玲,朱寶成,馮玉剛.基于BP神經(jīng)網(wǎng)絡(luò)城市燃?xì)舛唐谪?fù)荷預(yù)測(cè)[J].煤氣與熱力,2006,26(12):12-15.
[6] 焦文玲,趙林波,秦裕琨.城市燃?xì)庑r(shí)用氣負(fù)荷周期性研究[J].煤氣與熱力,2003,23(9):515-517.
[7] HASTIE T,TIBSHIRANI R,F(xiàn)RIEDMAR J(著),范明,柴玉梅,昝紅英,等(譯).統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)——數(shù)據(jù)挖掘、推理與預(yù)測(cè)[M].北京:電子工業(yè)出版社,2003.
 
(本文作者:李持佳1 劉燕2 邵震宇1 1.北京市公用事業(yè)科學(xué)研究所 北京 100011;2.北京市燃?xì)饧瘓F(tuán)有限責(zé)任公司 北京 100035)