模式识别-时间序列模型预测城市时用水量
论文类型 | 基础研究 | 发表日期 | 2004-12-01 |
来源 | 中国水网 | ||
作者 | 段焕丰,俞国平,俞海宁 | ||
关键词 | 模式识别 时间序列 时用水量 预测 积分自回归-移动平均模型 | ||
摘要 | 介绍了基于模式识别和时间序列方法相结合的模型来预测城市时用水量。将每天的水量需求模式分为“上升(快速和缓慢)”、“波动”和“下降”三个或四个连续反复的状态,即连续的马尔可夫状态。并分别利用低次积分自回归-移动平均模型(ARIMA) 来拟合预测。实例结果表明该模型能够准确预测未来几天的时用水量,并且可以实时操作,简单易行。 |
段焕丰 俞国平 俞海宁 摘要:介绍了基于模式识别和时间序列方法相结合的模型来预测城市时用水量。将每天的水量需求模式分为“上升(快速和缓慢)”、“波动”和“下降”三个或四个连续反复的状态,即连续的马尔可夫状态。并分别利用低次积分自回归-移动平均模型(ARIMA) 来拟合预测。实例结果表明该模型能够准确预测未来几天的时用水量,并且可以实时操作,简单易行。 Pattern Recognition and Time Series Analysis Models for Forecasting Urban Hourly Water Demands Duan Huanfeng; Yu Guoping; Yu Haining Abstract: Hourly water-demand data is forecasted with a model based on a combination of pattern recognition and time series analysis. There or four repeating states are observed in the daily demand pattern: “Rising (slow or rapid),” “Oscillating,” and “Falling,” which are defined as successive states of a Markov process; and low-order auto-regressive integrated moving average models (ARIMA) fitted to each segment. An example followed shows that the model can be used to forecast hourly demands for a period of one to several days ahead, and the forecast can be performed in real time easily. 城市配水系统在线作业控制的任务是为该系统制定和执行某一计划方案。其目的就是在最小费用的目标下满足用水量需求,即最优运行操作方案。一般来说,由于配水系统的许多运行工作都是以一天(24小时)为周期,其运行方案须至少提前24小时就制定好。而制定该最优运行方案的前提条件就是要准确预测出整个方案期间的时用水量。因此,时用水量的预测对配水系统的经济运行有着重要的意义。 1.基本思想 一天中需水量的变化取决于许多因素,如温度,湿度,距上次下雨的时间间隔以及一周中的第几天等等。然而,我们从实践中许多实例的考察可以看出某些天中的用水需求曲线模式有显著的相似。一般来说,每天用水量曲线总的趋势都是在晚上较低,从早上开始上升,一直达到最高并有波动,然后又下降。这些变化部分的过渡或者是各部分的曲线形状将随用水对象的不同而不同。但是,我们可以将每天的模式划分为“上升”、“波动”和“下降”三个部分或状态,下面我们所要讨论的模型将基于此,然后确定各部分的过渡点并且为每个部分构造时间序列模型。 2.预测模型的建立 2.1 需求模型 (1) 在时刻t,需水量xt是一个标准的n次自回归过程: (2) 其中:ct=(c0t,c1t,……,cnt)为一组与时间有关的系数向量; 又设在(2)中的参数向量θt=(ct,bt),在任何时刻t 都能假设1 到m之间的值k ,并设vt=k,k=1,…m 则。自回归模型的次序m 可以允许在各部分之间变化,这样可以为模型的适应度带来更大的灵活性。假设有数据X1N=(x1,…xN),我们将利用该数据来解决以下两个相关的问题: (3) 其中,f(XlN|P,θl,…,θm) 为向量XlN 的条件概率密度。 1)logf(XlN|P,θl,…,θm) 为单调不减; (4) 即f(XlN|P,θl,…,θm) 的一个局部极大值点。 其递推方程为: (5) (6) 并且: (7) 其中:p(vt=k|XlN,Ps,θsl,…,θsm) 为在时刻t状态k下过程xt 的事后概率,对其估计按照马尔可夫链的性质及式(7)来进行计算。
(8) 根据Yacovlev 和Vorob’yov (1986)有: (9) 由上述(1)~(9)式,我们即可以对模型(1)和(2)的参数P,θl,…,m 进行估计,其具体的算法步骤叙述如下。 其中,t=1,…,Nl,并任意设 (11) 4)根据(5)计算θlk=k,k=1,…m,并计算(6)、(7)和(8)式,这些计算均是对t=1,…,Nl而言。 2.2.2模式识别 这部分计算均是对所有的样本数据t=1,…,N : k=1,…m 2)根据(5)和(6)式计算和。 这部分计算是一个重复递推过程,直到满足局部最优可行解的条件。在计算过程中定义一个误差函数和相对应的真值函数,使得误差函数值最小。
其中λ(k,k)=0;λ(k,l)=1;k,l=1,…,m,且k≠1 (15) 以上的计算过程中,在特殊情况下可以通过引入动态规划法进行最小化修正详见文献。 2.2.3预测 (16) 其中,pt 为事后概率,看作为随机过程;ζt 同前;BT 为转置矩阵(B=xt-xt-1);φ1,Γ1,Γ2为多项式。 性能指标: (17) 2) 用水量预测 3.应用 根据某城市配水系统1999年夏的两个月(6.1日~7.31日)的实测时用水量数据来进行预测。整个中心城区的服务总人口约20万,平均日用水量为2.2万m3。由于篇幅限制其原始数据省略。通过上述模型训练与模式识别来进行未来用水量的预测。本文仅就上文中的四态模型进行预测,三态模型的预测原理过程同样可得。图1中给出了对未来五天(8.1日~8.5日)的时用水量预测结果。图中还同时给出了真实用水量值以进行比较。
图1 四态模型24小时用水量的预测曲线 表1 四态模型对八月份用水量的预测值
4. 结语 通过对预测模型的理论推导和实例应用,我们可以看出该模型方法误差很小。尽管它在理论推导有些繁琐,但是,在实际中,通过模块化编程形成计算软件,其应用非常简单,特别适用于实时连续监测系统;而且它能够在个人计算机上只需很短时间的运行即可得到较为精确的结果。因此,该预测方法在给水系统的最优运行中具有很大实用经济价值。当然,对于某些很小的城镇配水系统,由于其用水变化很大,甚至单个用户用水对整个系统都有影响,该方法则难以精确预测,这也仍需进一步探讨。 参考文献 [1] Jowitt, P.W., and Xu, C. (1992). Demand forecasting for water distribution systems [J]. Civ. Engrg. System, 9,105-121. [2] Box, G.E.P., and Jenkins, G.M. (1970). Time series analysis, forecasting and control [M]. Holden Day, San Francisco, CA. [3] Christensen, P.E., and Macdassi, T.J. (1989). Computerized analysis and prediction of hourly demand curves [M]. AWWA Speciality Comp. Conf., American Water Works association, Denver, Colo. [4] Mottl’, V.V., and Muchnik, I.B. (1984). Segmentation of structural curves using dynamic programming methods [J]. Automation and Remote Control, 44(8), 1035-1044. [5] 袁一星,张杰等. 城市用水量中长期预测模型的研究[J]. 给水排水,2004,30(6):102~105 [6] 俞峰,陶建科. 城市给水系统时用水量预测方法的探讨.城市公用事业[J],2003,17(6):23~26 [7] 何迎晖,钱伟民编著. 随机过程简明教程[M]. 上海,同济大学出版社,2004 [8] (美)Bruce Eckel 著,刘宗田,袁兆山,潘秋菱等译. C++编程思想[M]. 北京,机械工业出版社,2002 作者简介 段焕丰,男,1982年生,安徽安庆人,硕士研究生,主要从事市政工程设计与运行最优化方向的研究。 |
论文搜索
月热点论文
论文投稿
很多时候您的文章总是无缘变成铅字。研究做到关键时,试验有了起色时,是不是想和同行探讨一下,工作中有了心得,您是不是很想与人分享,那么不要只是默默工作了,写下来吧!投稿时,请以附件形式发至 paper@h2o-china.com ,请注明论文投稿。一旦采用,我们会为您增加100枚金币。