当前位置: 首页 > 期刊 > 《中国卫生统计》 > 1999年第3期
编号:10260030
线性回归预测模型有效超前期的确定方法
http://www.100md.com 《中国卫生统计》 1999年第3期
     作者:薛付忠 王洁贞 马希兰

    单位:薛付忠 王洁贞 山东医科大学公共卫生学院(210012); 马希兰 山东省平邑县卫生防疫站

    关键词:

    中国卫生统计990310 线性回归预测模型是应用线性回归技术,根据历史数据建立回归方程,用此回归方程进行超前预测。然而,建立了一个线性回归模型能否用其做无限期的超前预测呢?显然,一个预测模型的预测精度随着超前期的增加而逐渐降低,即预测误差越来越大。当外推至某一期时,预测误差之大,使该模型继续作外推预测几乎不再有什么实际意义,此时的预测超前期的长度我们称之为有效超前期。下面讨论线性回归预测模型有效超前期的一种确定方法。

    对于一元线性回归预测模型

    yi12xi+ei;ei~N(0,σ2),(i=1,2,…n)
, http://www.100md.com
    (1)

    此模型参数的最小二乘估计为:

    (2)

    未来观察值

    因此

    (3)

    (4)
, 百拇医药
    这里:

    如果将来在第k+1期时,实际观察值超出了95%的预测置信区间,就认为该模型再继续做外推预测已没有意义,该模型有效超前期就为k期,换言之,上述条件等价于

    (5)

    或

    (6)

    这里需要指出的是,选择置信度为95%,是因为它在实际预测中应用最广,当然也可以根据实际需要选择其他置信度。

    以上结果不难推广到一般多元线性回归预测模型(包括可线性化模型)
, 百拇医药
    (7)

    (8)

    下面以某流行性出血热监测区流行性出血热(EHF)年发病率的预测为例,讨论线性回归预测模型有效超前期的确定方法:

    表1是该区EHF历年发病率及其相关因素。1993年时,为预测该监测区今后EHF年发病率,用1984~1993年数据建立直线模型和二元线性模型如下:

    直线模型:=8.9653+1.9888t

    s=1.9543 F=85.440 P<0.01 t=9.243 P<0.01
, 百拇医药
    二元线性模型:=-1.697982+18.295931x1-4.741959x2

    s=2.4489,F=26.255,P<0.01,t1=5.950,P<0.01;t2=4.456,P<0.01;

    表1 某流行性出血热监测区历年

    发病情况及其相关因素 年 份

    年度缩

    减值t

    年发病率

    (1/10万)y
, http://www.100md.com
    当年一季度平均

    鼠密度(%) x1

    去年第四季度平

    均人群阴性感

    染率(%) x2

    1984

    1

    10.02

    2.75

    8.41

    1985

    2
, http://www.100md.com
    13.02

    2.71

    7.00

    1986

    3

    16.06

    2.61

    6.31

    1987

    4

    14.05

    2.57

    6.02
, 百拇医药
    1988

    5

    22.98

    3.14

    6.49

    1989

    6

    20.90

    2.80

    6.03

    1990

    7

    22.01
, http://www.100md.com
    2.79

    6.39

    1991

    8

    24.00

    3.21

    6.51

    1992

    9

    28.01

    3.36

    6.91

    1993
, http://www.100md.com
    10

    27.99

    2.89

    5.61

    1994

    11

    27.96

    2.89

    4.37

    1995

    12

    11.15

    2.79
, 百拇医药
    8.12

    1996

    13

    13.52

    3.90

    5.91

    1997

    14

    52.97

    2.62

    8.32

    两模型的外推预测结果见表2。表2 两模型外推预测结果 年份

, 百拇医药     tt11-22-
, 百拇医药
    1994

    11

    27.96

    30.8421

    2.8821

    0.1031

    30.4549

    2.4949

    0.0892

    1995

    12

    11.15

    32.8309
, http://www.100md.com
    21.6809

    1.9445

    10.8430

    -0.3070

    0.0275

    1996

    13

    13.52

    34.8197

    21.2997

    1.5754

    41.6312

, 百拇医药     28.1112

    2.0792

    1997

    14

    52.97

    36.8085

    -16.161

    0.3051

    6.7843

    46.0057

    0.8715

    下面考察上述两模型的预测有效超前期:
, 百拇医药
    对于直线模型,据(6)、(7)式:

    当外推到1994年时

    同理,当外推到1995年时,t1995=8.7374>t0.05/2(8)

    或

    由此可见,当直线模型外推至1995年时,实际值已超出95%的置信区间。因此其预测有效超前期为1年。

    对于二元线性预测模型,据(9)、(10)式:

    当外推到1994年时
, 百拇医药
    c1994=1+(1 2.89 4.37)

    同理,当外推到1995年时 t1995=0.09930.05/2(7)

    当外推到1996年时 t1996=6.8274>t0.05/2(7)

    当外推到1997年时 t1997=11.1732>t0.05/2(7)

    或

    所以,二元线性预测模型的预测有效超前期为2年。

    本法对线性回归预测模型及可线性化的模型有效,有关非线性模型预测有效超前期的确定方法及线性预测模型有效超前期显著性检验方法作者将另文讨论。

    参考文献

    1.周概容.概率论与数理统计.高等教育出版社,1987,575~643., 百拇医药