1、数据分析实验 在林业工程中,研究树干的体积Y与离地面一定高度的树干直径X1和树干高度X2之间的关系具有重要的实用意义。1 建立数据集,定义变量并输入数据并保存。【31棵树的相关数据】24题的数据选用树干直径做分析2 数据的描述,包括求均值、方差、中位数等统计量。统计量直径N有效31缺失1均值13.2484中值12.9000方差9.8483 画直方图,茎叶图,QQ图。4 数据正态性的检验:KS检验,W检验直径 Stem-and-Leaf Plot Frequency Stem & Leaf 3.00 0 . 888 20.00 1 . 00011111111222333444 7.00 1 .
2、6677788 1.00 2 . 0 Stem width: 10.00 Each leaf: 1 case(s)从上面的直方图、茎叶图、QQ图中的图形上看,数据比较好的服从正态分布,这也和下面正态性检验表中检验结果0.0890.05结果相吻合。正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量DfSig.直径.14131.117.94131.089a. Lilliefors 显著水平修正从表中看,这里分别利用K-S检验和S-W检验两种方法来确定变量是否服从正态分布。df代表自由度,Sig.代表显著性水平。表中Sig.0.05 则代表接受假设。5
3、多维正态数据的统计量。 案例处理摘要案例有效缺失合计N百分比N百分比N百分比直径3196.9%13.1%32100.0%高度3196.9%13.1%32100.0%体积3196.9%13.1%32100.0%描述统计量标准误直径均值13.2484.56363均值的 95% 置信区间下限12.0973上限14.39955% 修整均值13.1602中值12.9000方差9.848标准差3.13814极小值8.30极大值20.60范围12.30四分位距5.00偏度.553.421峰度-.435.821高度均值76.00001.14441均值的 95% 置信区间下限73.6628上限78.33725%
4、 修整均值76.1111中值76.0000方差40.600标准差6.37181极小值63.00极大值87.00范围24.00四分位距8.00偏度-.394.421峰度-.451.821体积均值30.17102.95232均值的 95% 置信区间下限24.1415上限36.20045% 修整均值29.0455中值24.2000方差270.203标准差16.43785极小值10.20极大值77.00范围66.80四分位距19.20偏度1.119.421峰度.773.8216 线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。7 残差分析。输入移去的变量模型输入的变量移去的变
5、量方法1高度, 直径a.输入a. 已输入所有请求的变量。上表是变量进入模型的基本情况。将高度、直径全部采用。模型汇总b模型RR 方调整 R 方标准 估计的误差1.974a.948.9443.88183a. 预测变量: (常量), 高度, 直径。b. 因变量: 体积对于多元线性回归模型,一般应采用其调整的决定系数来判断。在上表中,其值为0.944,说明其拟合程度还是可以接受的。Anovab模型平方和df均方FSig.1回归7684.16323842.081254.972.000a残差421.9212815.069总计8106.08430a. 预测变量: (常量), 高度, 直径。b. 因变量: 体积这是一个标准的方差分析表。回归模型的Sig.值为0,说明该模型有显著的统计意义。系数a模型非标准化系数标准系数tSig.B标准 误差试用版
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1