概述
我们通过对数据的统计分析找出与数据拟合最好的模型。回归模型是用统计方法建立的最常用的一类模型。
回归模型是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。
统计模型
一元线性回归模型
步骤:问题背景及分析->参数估计->假设检验->一元线性回归分析
一元线性回归分析
一元线性回归模型:
随机变量 ~除x外,影响y的随机因素的总和,对于不同的x, 相互独立且服从 分布(正态分布)。
注:大多数模型的错误都出在上,因为往往不能保证相互独立,满足正态分布。
通过软件进行模型求解后,得到系数的估计值、置信区间、 、F、p以及 。以下表为例
系数的置信区间不应包含零点,若包含,说明该系数对应的因素对被解释变量的影响极小,可以将此项忽略;
置信区间越长,说明预测越不准确,模型精度较差;
决定系数 为0.2438,说明y中有24.38%可以由x确定,越小,精确度越差;
p小于 时说明该模型有效(通常取0.05,(1-)是模型的置信度)。
由上表可以得到 :x每增加1,y就增加约0.6;
:不是x=0时y的估计值,是只能在x的数据范围内的估计(要根据具体题目给出的数据确定)。