0 引言
初学者,对于一些运行结果不是很清楚,所以看了一些课本和资料,这里做一个记录而已。
1 线性回归模型的结果分析
结果的解释:
“call”:指出线性回归的公式
“Residuals”:之处从实际数据观测的残差
“Cofficients”:显示模型系数,以及系数的统计显著性
“R-squarted”:判决系数与调整的判决系数,用于刻画模型对数据分散的解释程度
“F”:表示模型的统计意义
2 自变量评估
下面是对自变量的评估:
“Estimate”:用于显示截距与系数的推测值。这里是V4=2.317699--0.015446*V1--0.024233*V2
“Pr(>|t|)”:显示p-value,通过t分布判断各变量的显著程度。此时,V1、V2均远小于0.05,否定零假设。
3 判定细数与F统计量
下面是判定系数的评估:
F统计量使用F分布检验MSR/MSE的比率,也用于查看V4=b1+b2*V1+b3*V2+e与V4=b1+e的残差平方和差异的显著程度。即检验“H0:b1=0,b2=0、H1:b1、b2不等于0”的结果。
4 方差分析及模型间比较
显示模型F统计量:
完整模型与简化模型的比较:
从结果看,F统计量为272.47,P值很小,说明两个模型之间有显著差异,即V1、V2列是有意义的解释变量。
5 模型诊断图形
可直接plot()函数画图,也可画表述更清楚的图。这里该函数会显示四种图(实际有6种),不做详细解释。
总结
学习在于积累。importance(坚持)>importance(努力)。