基础回顾
简单线性和多元线性回归理论基础请回顾:
-
相关与回归分析基础;
-
一元(简单线性)相关分析与回归分析;
-
回归参数的区间估计;
-
一元(简单线性)回归方程的假设检验;
-
范例分析:一元(简单线性)相关与回归分析;
-
多元线性回归分析;
线性回归的步骤不论是一元还是多元相同,步骤如下:
-
1、散点图判断变量关系(简单线性);
-
2、求相关系数及线性验证;
-
3、求回归系数,建立回归方程;
-
4、回归方程检验;
-
5、参数的区间估计;
-
6、预测;
范例分析
王某等人承包了某快递公司在某地的快递业务,一段时间后发现:有时候承接工作量大,完不成快递任务;有时候工作量不足,员工等待。为了制定最佳的工作计划表,王某希望估计快递员每天的工作时间(工资计件,没有偷懒现象),以便决定每天承接的快递数量。王某分析,快递员每天工作的时间与送货距离和送货次数相关。为此,他收集了由10项送货任务组成的简单随机样本数据,并根据这些数据建立二元线性回归方程。数据如下表:
项目分析
研究的目的是预测快递员运送任务所需要的时间,所以设时间为因变量;距离与次数为自变量。本题直接使用Excel计算结果。
解:1、相关次数;由于是二元回归分析,所以不做散点图,直接用回归系数判别因变量(时间)与自变量总体(距离与次数)之间的相关关系。Excel计算结果:
复相关系数R为0.9383,说明因变量时间与作为一个整体的所有自变量(距离和次数)高度线性相关。
2、回归系数及回归方程
通过Excel计算结果,可以得到回归系数及回归方程:
意义:回归系数0.042表示在固定次数的条件下,送货距离每增加1公里,行驶的时间平均增加0.042小时;同理,回归系数0.573表示在送货距离固定的条件下,送货次数每增加1次,送货的时间平均增加0.573小时。本例中,截距-0.01没有实际意义,只起调节数值的作用。
3、回归方程的检验
回归方程的检验有三种方法(回归方程显著性检验,回归系数显著性检验和相关系数显著性检验),效果相同,选择其一检验即可。Excel给出的是回归方程的显著性检验结果:
Significance F=0.000591表示统计量F=25.77422的概率值,通过与显著水平(设定为0.05)的比较,表示F值落在拒绝域,所以结论与上相同,即线性回归方程式显著的。
4、区间估计
从上表可知,在95%置信度条件下,回归系数b1的置信区间为(0.025,0.059),b2的置信区间为(0.069,1.077)。
5、预测
某个快递员某天的任务是快递3件货,最优送货路线总长为120公里,预测送货时间,并得到95%的时间区间。
通过回归方程可得预测的送货时间为6.749小时:
95%置信度下,送货时间的置信区间为:
Excei计算结果中有Se的值,但是没有包含t统计量:
t统计量值用公式:=T.INV.2T(0.05,7)得到2.365,所以该题中送货时间区间为:
(6.749-2.365*0.639,6.749+2.365*0.639)
(5.24,8.26)
所以该条件下送货时间区间为5.24小时~8.26小时。
数据分析网(***),国内领先的大数据门户,旨在帮助大数据从业人士、爱好者提供大数据新闻资讯、前沿技术、业界观点的信息平台。
本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:dandanxi6@qq.com