非线性耦合随机数据模型在水位信息处理中的应用

打开文本图片集

摘要：依据黄河下游冲淤河道水沙过程的历史数据，对黄河下游冲淤河道的水位进行信息处理，给出了构建非线性耦合随机数据模型的分析过程。考虑到冲淤河道水位过程自身的复杂性，为使模型更有效，引入了自回归项和随机扰动项——维纳过程，从而有效降低信息处理模型误差。

关键词：非线性；随机数据模型；水位信息处理

中图分类号：TP391 文献标识码：A 文章编号：1009-3044（2018）04-0237-03

Application of Nonlinear Stochastic Coupling Model in Water Level Fitting

PAN Zhong-jian

（Jiangsu Vocational College of Business， Nantong 226011， China）

Abstract： Based on the Yellow River water sediment historical data of erodible-bed channel， fitted the water level， given the construction of coupled nonlinear stochastic hydrological model analysis. We considered the own complexity of the water level of erodible-bed channel， in order to make model effective we has joined in the auto regression item and Wiener process ， thus reduces the fitting model error effectively.

Key words： nonlinear； stochastic model； the water level fitting

1 概述

自然界中的水體运动是一个非线性系统，是一个复杂的不确定过程。水文学和水力学主要是研究水体的运动、循环和时空变化规律，揭示水的自然属性和社会属性，以及人类合理利用水资源，防治水灾害问题[1]。黄河下游是冲淤性河道，冲淤河道的水沙过程受到很多因素的共同作用，各因素本身及因素间的变化规律复杂。若对黄河水系统进行有效控制和支配，以及精确的预测黄河的水位，就必须用数学方法对水体进行分析，建立合理科学的水文模型[2]。依据黄河下游冲淤河道水沙过程的历史数据，对黄河下游冲淤河道的水位进行信息处理，给出了构建非线性耦合随机数据模型的分析过程。考虑到冲淤河道水位过程自身的复杂性，引入耦合项、自回归项等方法，逐步有效降低了最终模型的随机误差，引入了；其次，黄河下游水沙质点的运动受许多随机力的作用，水沙过程中的随机扰动具有维纳过程特性，在原模型基础上引入刻画水沙过程中的随机扰动，从而有效降低了信息处理模型误差。

2 初始模型的构建

依据水文学科相关理论，水体的下游水位相应的影响因素主要有：该水体上断面出现的水位，含沙量，流量，和下游同时水位，含沙量，流量。为得到合理的初始模型，首先需最大限度的考虑水位变化的影响因素，给出全因素的非线性模型即：

在模型的基础上，分析各个影响因素的相关程度，逐步的替代或剔除弱影响因素。

2.1 影响因素线性分析、非线性分析

在解决工程问题时，耦合影响因素越来越受到重视，水文过程的影响因素复杂，仅靠单纯的几个单因素难以符合实际物理背景，简单的多元线性关系仅仅反映的是单因素的片面结果，所以要找出潜在的影响因素，就要注重耦合因素的交互影响。选取黄河花园口-夹河滩1980-1993年与、、、、、的对应值，把看作随机影响的白噪声过程，确定信息处理分析模型。由于影响因素较多，分析过程较长。这里仅给出一个耦合项及二阶单因素变量与因变量的散点图和信息处理模型过程。

从图1中可以看到，下游水位的变化与上游水位的变化的平方近似有非线性抛物线的关系，在较短的期间内变动，且这一区间离坐标原点较远，在这一区间上该抛物线曲率已非常小，可以得到简单的信息处理模型：

，

经过对影响因素的初步分析，逐步筛选出有价值的影响因素，并在原有基础上进行因素替代，非线性转化为线性替代，剔除单因素和的单因素影响，组成初始的复合非线性耦合方程，其初始模型可以表示为：

其中，为待定参数，为随机误差。

2.2 因素的共线性分析

根据水文预报的要求，构建的模型在于信息处理的精度高，并非模型越复杂越好，因此这里主要分析模型中因素间的共线性，从而剔除模型中的重复因素，得到简化的模型。

从复合非线性项两两之间的关系，可以得到与、与有较强的共线关系，所以在简化模型过程中，可以逐步的剔除、两项。经过线性转化之后的与和与有着强线性关系，所以可以剔除、，同样与具有近似的共线性关系，可以剔除含有的项。同时引入对因变量的自回归项，得到改进模型：

从水文学和水力学的理论分析，在水位变化的过程中，其随机变量可以看成一个随机过程。每一个变量可以认为有其变动的随机空间，基于此可以简化非线性模型为：

其中，为期望函数，为相应的回归向量或是自变量向量，可以看作随机变量的白噪声过程。维纳过程是工程中布朗运动的数学描述，水沙过程中的随机扰动具有维纳过程特性，适合使用维纳过程刻画。为了尽可能在预测模型中做到科学合理，且能从实际物理背景中反映水文的变化，从而假定这个白噪声过程为维纳过程，设：

引入的滞后项构成的信息处理模型。即

其中为待定参数，表示为维纳过程。

3 参数的率定

针对模型的参数率定，由于考虑到共线性的问题，运用岭估计对参数进行率定。因为岭估计是在自变量信息矩阵的主对角线元素上人为加入一个非负因子，从而使回归系数的估计稍有偏差、而估计的稳定性却可能明显提高的一种估计方法，它是最小二乘法的一种补充，岭估计可以修复病态矩阵，达到较好的效果。

3.1 值的选择

根据文献岭估计的参数估计方法，适当的值选取直接影响着回归的结果，表1是六个回归系数在取0～0.0228的一些岭迹，由表1可知，随着的增加，回歸系数有的逐渐增大，有的逐渐减小，取0.02之后的数据已经基本稳定，变化比较小，所以取k=0.02。

一般认为如果的值低于10，则认为信息处理精度较高。由以上公式计算得到：，，可见模型的信息处理效果比较高。

信息处理误差绝对值的最大值为0.17632，误差绝对值的平均值为0.048156。可见所构建的复合非线性随机信息处理模型是有效的，该构建模型的方法是科学合理的。因为该模型考虑的因素比较全面，且加入了对的分析，信息处理误差绝对值最大值符合工科学中的精度要求。

5 结论

介绍了复合非线性随机数据模型的构建过程，其理论依据是建立在多元回归模型、逐步回归模型、自回归模型、岭估计以及维纳过程的基础上；从科学的角度出发，综合多个模型的特点，构建合理的复合非线性随机数据模型。从对模型的分析来看，模型是在前人研究的基础上引入自回归项和随机扰动项——维纳过程，逐步深化模型的适用程度，提高模型的信息处理检验精度。水位的信息处理模型是为了进一步用于预测水位，所以对水位预测有一定的参考价值。

参考文献：

[1] 葛守西. 现代洪水预报技术[M]. 北京：中国水利水电出版社， 2000.

[2] 时政华. 复杂数据分类和EV模型应用研究[D]. 河海大学硕士学位论文， 2005.

[3] 芮孝芳，陈洁云，常星源，等. 黄河下游水位预报模型及其应用[J]. 水科学进展， 1998， 9（3）：245-250.

[4] 柳丽，魏庆诤，赵树安. 回归分析中多重共线性的诊断与处理[J]. 中国卫生统计， 1994，11（1）：5-7.