何大四☆ 张旭 同济大学
李元旦 特灵(中国)公司
摘 要: 准确预测空调负荷不仅对蓄能系统高效运行意义重大,而且也是新兴的冷热电三联产技术发挥技术优势的关键所在。本文针对同一幢建筑,分别采用了多元线性回归、季节性指数平滑法以及神经网络方法等三种典型性预测方法进行负荷预测研究,并对三种方法做了进一步改进。然后从预测精度、建模的复杂程度、工程上的可行性以及模型的其它特性(诸如在线性能和新建筑预测问题)等四个方面对负荷预测方法进行分析。结果表明:神经网络方法具有较高预测精度,而改进的季节性指数平滑法则具有较好的工程应用价值。
关键词: 负荷预测;线性回归;指数平滑;神经网络
前言
采用合理的运行调节方法是提高空气调节系统的能源利用效率主要途径之一。从已有的文献报道来看,实行负荷预测是空气调节系统优化运行的基础,也是蓄能空调系统高效经济运行[1]和新兴的冷热电三联产技术发挥技术优势的关键所在。关于负荷预测方法,虽然有很多学者提出过不同的观点和方法,但都有各自的局限性和使用条件[2-6]。如何选择工程应用切实可行的方法,仍然是一个值得探讨和研究的问题。由于预测方法门类繁多,本文拟从不同类别的预测方法中选取具有典型性的线性回归(Line Regression)、指数平滑(Exponential Weighted Moving Average)和神经网络(Artificial Neural Network)等三种方法进行负荷预测的研究,以期得到有指导意义的空调系统负荷预测方法。
1 基准数据与评价指标
出于对数据精度要求的考虑,本文选用1997 年日本空气调和与卫生工学会(SHASE)负荷预测方法基准测试(Benchmark)竞赛的相关数剧作为负荷预测模型的基准数据[7,8]。基准数据包含某建筑物6、7 月份逐时室外、室内气象参数、空调机组开启数量以及空调系统的总负荷测量值,以及1996 年8 月的室内外逐时气象参数、空调机组开启数量。负荷预测模型将根据基准数据给出8 月份空调系统负荷值。
负荷预测模型的准确度用以下三个指标来评价:
1. 累积误差平方和(Squared Difference Summation)
2. 平均相对误差(Mean Relative Error)
3. 加权绝对百分比误差(Plus Weighted Absolute Percentage Error)
式中:
q 为实测负荷值, q ˆ 为预测负荷值, n 为预测期间的总的时间数。
2 线性回归模型
回归分析方法是最为常见的一种数据处理方式。将回归分析方法应用于预测领域时,所建立的预测模型是一种解释性模型。
假设空调负荷(y)和各影响因素(xi)之间呈线性关系,则可以用式(5)来描述:
应用最小二乘法和数理统计的知识,t+1 时刻的负荷可以通过式(6)求出:
由于负荷日变化具有周期性,单一方程模型很难描述这种变化。作为一种改进,本文采用了逐时模型,即24 小时分别建模。运用选元技术,最终每个时刻模型中定义了10 个输入参数和一个输出参数。输入参数分别是提前1 个小时到5 个小时室外温度值和提前1 个小时到5 个小时室外太阳辐射值。输出参数为空调系统负荷。
模型预测结果见后面部分。
3 季节性指数平滑模型
指数平滑法是根据预测对象本身的历史数据来进行预测的,属于时间序列预测技术范畴。经典的季节性指数平滑模型原理详见文献[9],它无需额外的相关数据,也即无输入。因而,指数平滑法实施起来非常容易,预测代价非常小。不过,有时这也成了它的缺点,限制了进一步提高预测精度的可能。本文结合建筑物空调负荷和影响因素之间的关系——空调日总负荷和日平均气温之间的强烈相关性,提出了一种改进的季节性指数平滑模型。区别于一般的指数平滑法,它是带输入的,在实施预测是需要提供未来时刻的室外日平均温度。具体模型如下:
和经典的温特季节性指数平滑法相比,这个模型主要有两点不同:其一、少了趋势因子;其二、对水平因子S t 进行了修正。新的方法中去掉趋势因子是基于这样的考虑:长期来看,建筑物负荷有周期性增大和减小的趋势,但这种趋势在短期内表现并不明显。这在后面的预测结果中有所体现。去掉一个平滑项带到的好处不言而喻,既降低的模型应用难度,又方便了平滑系数的寻优工作。
对水平因子进行修正,是这个模型特点所在。水平因子和平均值概念类似,它决定了预测值的大小水平;水平因子越大,意味着预测值也越大,从温特季节性指数平滑模型中不难发现这种关系。在常规的指数平滑方法中,水平因子基本上放映了当前周期预测对象大小水平,所以把它当作下一周期预测对象大小水平就引起了一定的误差。减少这误差的办法是:对水平因子乘以系数予以修正,修正系数ξd 定义为下一周期预测对象大小水平和当前周期预测对象大小水平的比值。
具体到负荷预测,定义具体到负荷预测,定义具体到负荷预测,定义ξd 为第二天负荷大小水平与当天负荷大小水平的比值。那么ξd 怎么计算呢?
我们知道,日平均气温与日总负荷间有较强的相关性。日平均气温越高,日总负荷就越大。本文中采用如下多项式方程来回归它们之间的关系,取得了较好的效果。
显然,日总负荷就代表了当日的负荷大小水平。因此ξd 可通过下式确定:
式中:L d +1 :第二天日总负荷。L d :当天日总负荷。
用到了第二天的平均温度值,通过气象预报得到。
改进的季节性指数平滑模型的计算过程类似于温特季节性指数平滑模型[10]。
4 神经网络模型
本文采用三层前向反馈网络。网络结构为11×10×1。即输入层神经元数为11,中间隐含层神经元数为10,输出层神经元数为1。输出层和输入层神经元对应的物理意义具体见表1。
对上述网络结构,利用给出的6~7 月份的实测负荷和室内外气象参数数据,对网络进行了训练,求解工具采用了Math Works 的神经网络工具箱(Neural Network Toolbox)。
在选定的神经网络结构中,隐含层的传递函数采用了S 型函数(Sigmoid 函数),定义见(12)式,输出层采用了线性函数(Purelin 函数),定义见(13)式。训练采用贝叶斯(Bayes)学习算法,收敛速度快且可以有效防止在训练过程中神经网络收敛于局部最小,同时采用神经网络算法中的 “早停和正则化”技巧,防止网络训练过程中发生数据“过拟合”(表现为训练精度很高而预测精度很差)现象。
在利用6、7 两个月的数据对网络进行训练后,对8 月份的建筑物负荷进行了预测。在预测过程中采用了所谓的“逐日更新训练法”——首先利用训练好的网络对8 月1 日的负荷进行预测并将预测的结果保存,再将8 月1 日的实测负荷值和室内外气象参数等24 组数据添加到训练样本中;然后利用扩大了的样本对网络进行训练,再次预测8 月2 日的负荷值,依次循环直到31 日结束。
5 负荷预测方法比较与分析
表2 表明:无论是从累积误差平方和还是相对误差或加权绝对百分比误差来看,神经网络方法的预测精度最高。改进的季节性指数平滑法也取得了相当高的精度,就累计误差平方和而言,和神经网络方法仅相差10%左右,加权绝对百分比误差也仅相差1 个百分点,在最大日累积误差平方和和预测值与实测值相关度两个评价指标上甚至优于神经网络方法。多元线性回归方法的预测精度最差,和其它两种方法在预测精度上有显著性差别。
神经网络方法作为一种高度智能的非线性算法,只要选取的网络结构和训练方式得当,并有足够多的数据供网络训练,理论上神经网络模型能够以任意精度逼近实际的物理模型。
虽然本文中的神经网络方法比改进的季节性平滑法精度提高的不多,但随着网络构成方式以及训练方式的变化,神经网络方法预测精度有进一步提高的潜力。而对于指数平滑法来说,由于模型结果简单,不能有效利用与建筑物负荷有密切关系的相关因素的数据,很难再进一步提升预测精度;但从预测结果来看,它已取得了足够高的精度,平均相对误差为-2.5%,加权绝对百分比误差也仅为10%,足以满足一般工程应用要求。多元线性回归方法的预测结果表明,对于建筑物负荷这样一类高度非线性的系统,线性的多元回归方法基本上是失效的。
总的来说,仅考虑预测精度的话,神经网络方法无疑是最佳选择,改进的季节性指数平滑法对于一般的工程应用也足以胜任,而多元线性回归方法在大多数情况下都将是不可取的。以上结论对不同类型的建筑物负荷预测工作有一定的指导意义。
一般来说,模型的预测精度与建模的复杂度相关。模型的预测精度越高,建模的复杂度就越大。在三种模型中,神经网络方法的建模复杂度最高。多元线性回归建模其次,季节性指数平滑法最容易。这主要和各个模型的结构有关系。由于仅根据负荷的历史值作预测,指数平滑法建模上相对简单。同时,在平滑系数通过计算机实现自动寻优后,平滑模型的通用性大大增强,用平滑模型建立的针对某个建筑物的负荷预测系统几乎可以不加修改的应用到另外一幢建筑物。神经网络方法建模则不能实现自动化,在选择网络结构和训练网络时相当一部分工作需要借助于人的分析,也就是存在大量的试算过程,增大了建模的难度。同时,神经网络模型通用性非常差;神经网络是通过输入与输出来调整自身的结构和参数的,它对输入与输出有强烈的依赖关系。用神经网络方法建立的负荷预测系统要想应用到另一幢建筑物上,除了重新训练网络外,别无它途。多元线性回归方法也存在同样的问题。总的来说,指数平滑法建模代价最小,神经网络方法建模代价最大,这给神经网络方法的应用带来不便。
选择合适的预测模型需要考虑的另一个因素是工程上的可行性。复杂的模型引入的参数较多,模型预测精度也比较高。但相应也带来不少问题。参数越多,需要的传感器数量也就越多,带来了工程成本的增加;在计算机上开展预测工作时需要的存储量也就越大。另外,传感器本身的测量误差(也即数据噪声)又造成了模型预测精度的下降。还可能会出现因某一个传感器出现故障而使负荷预测工作无法开展局面。所以,需要在模型的参数个数与预测精度之间寻求一个好的平衡点。也即希望模型引入的参数尽可能的少,同时预测精度也足够的高。
表3 表明,改进的季节性指数平滑法是三种方法种引入参量最少的一个,仅2 个参变量(历史负荷值与室外日平均温度),同时模型的精度也足够的高。这说明改进的季节性指数平滑法正是具有上述平衡点的预测模型,具有良好的工程应有可行性。
另外,模型的在线性能也是需要考虑因素。良好的在线性能是进一步提高预测精度的有效手段。从表3-6 不难看出,季节性指数平滑法具有较好的在线性能。多元线性回归基本上不具备在线调整性能,因为当前的新值对整个模型的回归系数产生的影响微乎其微。引入适当的参数,神经网络方法也将会具有一定的在线性能。
还有一个值得关注的问题是新系统的负荷预测问题。由于新系统是没有历史数据的,而神经网络方法和多元线性回归方法均需要通过历史数据来训练网络,然后才能预测,所以就不能运用这两种方法了。季节性指数平滑法则不一样,根据季节性指数平滑法计算过程,理论上只要有两个周期(也即2 天)的数据,就可以应用指数平滑了。所以对新系统的负荷预测问题,指数平滑法是一个好的解决方案。
6 结论
三种负荷预测方法中神经网络方法预测精度最高,改进的季节性指数平滑法对于一般的工程应用也足以胜任,而多元线性回归方法在大多数情况下都将是不可取的。
在预测精度有保证的情况下,相对于其它两种方法,改进的季节性指数平滑法具有更优越的工程应用价值。改进的季节性指数平滑法属于时间序列分析方法中的一类,运用季节性的时间序列分析方法解决建筑物负荷预测问题是有效的。
|