当前位置:党团工作 > 统计学期末大作业题目及答案

统计学期末大作业题目及答案

时间:2025-08-02 16:08:10 浏览次数:

 统计学实践作业

 参数估计练习题 1. 某大学为了解学生每天上网的时间,在全校 7500 名学生中采取不重复抽样方法随机抽取 36 人,调查他们每天上网的时间(单位:小时),得到的数据见book3.1 表。

 求该校大学生平均上网时间的置信区间,置信水平分别为 90%、95%和 99%。

  平均

 3.316666667 标准误差

 0.268224616 中位数

 3.25 众数

 5.4 标准差

 1.609347694 方差

 2.59 峰度

 -0.887704917 偏度

 0.211008874 区域

 5.9 最小值

 0.5 最大值

 6.4 求和

 119.4 观测数

 36 最大(1)

 6.4 最小(1)

 0.5

 平均

 3.316666667 标准误差

 0.268224616 中位数

 3.25 众数

 5.4 标准差

 1.609347694 方差

 2.59 峰度

 -0.887704917 偏度

 0.211008874 区域

 5.9 最小值

 0.5 最大值

 6.4 求和

 119.4 观测数

 36 最大(1)

 6.4 最小(1)

 0.5 置信度(90.0%)

 0.453184918

 置信区间 2.863481748 3.769851585

 置信度(95.0%)

 0.544524915

 置信区间 2.772141751 3.861191582

 平均

 3.316666667 标准误差

 0.268224616 中位数

 3.25 众数

 5.4 标准差

 1.609347694 方差

 2.59 峰度

 -0.887704917 偏度

 0.211008874 区域

 5.9 最小值

 0.5 最大值

 6.4 求和

 119.4 观测数

 36 最大(1)

 6.4 最小(1)

 0.5 置信度(99.0%)

 0.730591706

 置信区间 2.58607496 4.047258373

  2. 某机器生产的袋茶重量(g)的数据见 book3.2。构造其平均重量的置信水平为 90%、95%和 99%的置信区间。

  平均

 3.32952381 标准误差

 0.05272334 中位数

 3.25 众数

 3.2 标准差

 0.241608696 方差

 0.058374762 峰度

 0.413855703 偏度

 0.776971476 区域

 0.95 最小值

 2.95 最大值

 3.9

 求和

 69.92 观测数

 21 最大(1)

 3.9 最小(1)

 2.95 置信度(90.0%)

 0.090932905 置信区间 3.238590905 3.420456714

 平均

 3.32952381 标准误差

 0.05272334 中位数

 3.25 众数

 3.2 标准差

 0.241608696 方差

 0.058374762 峰度

 0.413855703 偏度

 0.776971476 区域

 0.95 最小值

 2.95 最大值

 3.9 求和

 69.92 观测数

 21 最大(1)

 3.9 最小(1)

 2.95 置信度(95.0%)

 0.109978959 置信区间 3.21954485 3.439502769

 平均

 3.32952381 标准误差

 0.05272334 中位数

 3.25 众数

 3.2 标准差

 0.241608696 方差

 0.058374762 峰度

 0.413855703 偏度

 0.776971476 区域

 0.95 最小值

 2.95 最大值

 3.9

 求和

 69.92 观测数

 21 最大(1)

 3.9 最小(1)

 2.95 置信度(99.0%)

 0.150015812 置信区间 3.179507997 3.479539622

  3. 某机器生产的袋茶重量(g)的数据见 book3.3。构造其平均重量的置信水平为 90%、95%和 99%的置信区间。

 平均

 3.29 标准误差

 0.014798365 中位数

 3.29 众数

 3.3 标准差

 0.087548306 方差

 0.007664706 峰度

 1.781851265 偏度

 0.003904912 区域

 0.47 最小值

 3.05 最大值

 3.52 求和

 115.15 观测数

 35 最大(1)

 3.52 最小(1)

 3.05 置信度(90.0%)

 0.025022913

 置信区间 3.264977087 3.315022913

 平均

 3.29 标准误差

 0.014798365 中位数

 3.29 众数

 3.3 标准差

 0.087548306 方差

 0.007664706 峰度

 1.781851265

 偏度

 0.003904912 区域

 0.47 最小值

 3.05 最大值

 3.52 求和

 115.15 观测数

 35 最大(1)

 3.52 最小(1)

 3.05 置信度(95.0%)

 0.030073895

 置信区间 3.259926105 3.320073895

 平均

 3.29 标准误差

 0.014798365 中位数

 3.29 众数

 3.3 标准差

 0.087548306 方差

 0.007664706 峰度

 1.781851265 偏度

 0.003904912 区域

 0.47 最小值

 3.05 最大值

 3.52 求和

 115.15 观测数

 35 最大(1)

 3.52 最小(1)

 3.05 置信度(99.0%)

 0.040375775

 置信区间 3.249624225 3.330375775 资料整理练习题

 1. 为评价家电行业售后服务的质量,随机抽取了由 100 家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见表 book1.1。要求:

 (1)制作一张频数分布表; (2)绘制统计图,反映评价等级的分布。

 计数项:xt

 xt 汇总 A 14 B 21 C 32 D 18 E 15 (空白)

 总计 100

 2. 某行业管理局所属 40 个企业 2002 年的产品销售收入数据(单位:万元)见 book1.2。要求:

 (1)根据销售收入在 125 万元以上为先进企业,115~125 万元为良好企业,105~115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算出累积频数和累积频率;

 累计频数 累计频率 -104 9 22.50%

 (2)绘制统计图,反映分布情况。

  累计频数024681012落后 一般 良好 先进累计频数 3. 北方某城市 1 月~2 月份各天气温的记录数据见 book1.3。

 (1)对上面的数据进行适当的分组。

 (2)绘制统计图,说明该城市气温分布的特点. 接收 频率 累积 % -10 26 40.00% -5 15 63.08% 0 15 86.15% 5 5 93.85% 10 4 100.00% 其他 0 100.00% 105-114 9 45.00% 115-124 11 72.50% 125+ 11 100.00%

  说明:该城市气温在逐步回暖,整体偏冷。

 多变量资料整理练习题

 下面是有关“北京地区大学生掌上阅读状况调查”的部分题目, (1)性别:1 男

  2 女 (2)学级:

 1 大专

 2 大一

 3 大二

 4 大三

 5 大四

  6 研一

  7 研二

 8 博士生 (3)月生活费:

 1

 600 元以下

 2

 600—1000 元

  3

 1000—1500 元

 4

 1500—2000 元

 5

 2000 元以上 (4)手机类型:

 1 低端机

 2

 中端机

 3 高端机

 4 智能机 5 其他 (5)运营商:

 1 中国移动

 2 中国联通

 3 中国电信

 4 中国网通 被调查者对这 5 个题目的回答如数据表 book1.8。

 1.分析不同性别学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。

 2.分析不同学级的学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。

 3. 分析不同性别学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。

 4.分析不同学级的学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。

 求和项:手机类型 q4 手机类型 q4

 性别 q1 1 2 3 4 5 总计 1 22 66 156 240 10 494 2 11 92 213 236 15 567 总计 33 158 369 476 25 1061 [1]由题可知,男生选择智能机的比较多,而女生选择高端机的比较多。

 0501001502002503001 2 3 4 512 求和项:手机类型 q4 手机类型 q4

 学级 1 2 3 4 5 总计

 1 3 10 3 44 5 65 2 3 16 54 80

 153 3 10 52 102 88 5 257 4 6 40 63 88 5 202 5 3 14 114 68 10 209 6 6 18 21 60

 105 7 1 8 12 48

 69 8 1

  1 总计 33 158 369 476 25 1061 [2]专的孩子偏爱智能机 大一孩子偏爱智能机 大二孩子偏爱高端机 大三孩子偏爱智能机 大四孩子偏爱高端机 研一孩子偏爱智能机 研二孩子偏爱智能机 博士生只有一人使用低端机 求和项:运营商 q5 运营商 q5

  性别 q1 1 2 3 4 总计 1 135 66

 4 205 2 150 76 6

 232 总计 285 142 6 4 437 [3]男生偏爱中国移动

 女生偏爱中国移动 0204060801001201401601 2 3 412

 0204060801001201 2 3 4 5 6 7 812345

 求和项:运营商 q5 运营商 q5

  学级 1 2 3 4 总计 1 16 10

  26 2 35 28

  63 3 76 32 3

 111 4 54 32

  86 5 48 34 3 4 89 6 35 4

  39 7 20 2

  22 8 1

 1 总计 285 142 6 4 437 [4]专到博都是选择中国移动的人最多,其次是中国联通,选择电信和网通的用户较少 010203040506070801 2 3 4 5 6 7 81234 多元线性回归练习题 1. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近 8 个月的销售额与广告费用数据见book7.1 表。

 (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。

 (2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。检验回归方程的线性关系是否显著( 

 =0.05);检验各回归系数是否显著( 

 =0.05) 。

 SUMMARY OUTPUT

 回归统计

  Multiple R 0.958663444

 R Square 0.9190356

 Adjusted R Square 0.88664984

 标准误差 0.642587303

 观测值 8

  方差分析

 df SS MS F Significance F

 回归分析 2 23.43540779 11.7177039 28.37776839 0.001865242

 残差 5 2.064592208 0.412918442

 总计 7 25.5

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 83.23009169 1.573868952 52.88247894 4.57175E-08 79.18433275 87.27585063 电视广告费用

 /万元 2.290183621 0.304064556 7.531899313 0.000653232 1.508560797 3.071806445 报纸广告费用

  /万元 1.300989098 0.320701597 4.056696662 0.009760798 0.476599399 2.125378798

  SUMMARY OUTPUT

 回归统计

  Multiple R 0.807807408

 R Square 0.652552809

 Adjusted R Square 0.594644943

 标准误差 1.215175116

 观测值 8

  方差分析

 df SS MS F Significance F

 回归分析 1 16.64009662 16.64009662 11.26881134 0.015288079

 残差 6 8.859903382 1.476650564

 总计 7 25.5

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 88.63768116 1.582367131 56.01587609 2.174E-09 84.76576828 92.50959404 电视广告费用

 /万元 1.603864734 0.47778079 3.356905024 0.015288079 0.434777259 2.772952209

 [1]回归方程为:y=1.60x+88.64

 [2]回归方程:y=2.29x1+1.30x2+83.23

 F 值0.001865小于0.05,回归方程的线性关系显著

 对于 x1的系数:p 值0.00065小于0.05,显著

  2. 一家房地产评估公司想对某城市的房地产销售价格y1与地产的评估价值x1、房产的评估价值 x2 和使用面积 x3 建立一个模型,以便对销售价格作出合理预测。为此,收集了 20 栋住宅的房地产评估数据见 book7.2 表。

 (1)写出估计的多元回归方程。

 (2)检验回归方程的线性关系是否显著( 

 =0.05)。

 (3)检验各回归系数是否显著( 

 =0.05) 。

 SUMMARY OUTPUT

 回归统计

 Multiple R 0.947362461

  R Square 0.897495632

  Adjusted R Square 0.878276063

  标准误差 791.6823283

  观测值 20

  方差分析

  df SS MS F Significance F 回归分析 3 87803505.46 29267835.15 46.69696966 3.87913E-08 残差 16 10028174.54 626760.909

  总计 19 97831680

  Coefficients 标准误差 t Stat P-value Lower 95% Intercept 148.700454 574.421324 0.25887001 0.799036421 -1069.018347

 0.814738183 0.511988507 1.591321236 0.13109905 -0.270628958

 0.820979542 0.211176502 3.887646272 0.001307361 0.373305358

 0.135041012 0.065863312 2.050322204 0.057088036 -0.004582972

  回归方程:y=0.81x1+0.82x2+0.135x3+148.7

  对于回归方程:F 值远远小于0.05,所以回归方程式显著

  对于 x1:0.13大于0.05,不显著 对于 x2:0.001小于0.05,显著 对于 x3:0.057大于0.05,不显著

  所以回归方程为:y+=0.82x2+148.7

 3. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据见book7.3 表。

 对于 x2的系数:p 值0.009761小于0.05,显著

 (1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。解释回归系数的实际意义。

 (2)检验回归方程的线性关系是否显著( 

 =0.05)。

 (3)检验各回归系数是否显著( 

 =0.05) 。

 方差分析练习题 1.从 3 个总体中各抽取容量不同的样本数据,得到的数据见 book5.1 表。检验 3 个总体的均值之间是否有显著差异?( 

 =0.01) 方差分析:单因素方差分析

 SUMMARY OUTPUT

 回归统计

  Multiple R 0.995651103

 R Square 0.991321119

 Adjusted R Square 0.986981679

 标准误差 261.4310342

 观测值 7

  方差分析

 df SS MS F Significance F

 回归分析 2 31226615.26 15613307.63 228.4444623 7.5323E-05

 残差 4 273384.7425 68346.18563

 总计 6 31500000

  Coefficients 标准误差 t Stat P-value Lower 95% 上限 95.0% Intercept -0.590996232 505.0042289 -0.00117028 0.99912229 -1402.707516 1401.525523 x1 22.38646129 9.600543531 2.331791031 0.080094808 -4.268920799 49.04184339 x2

 327.6717128 98.79792462 3.31658498 0.029472413 53.36469864 601.978727

 回归方程为:y=22.39x1+327.67x2-0.59

  对于回归方程:F 值远远小于0.05,所以回归方程显著

  对于回归系数 x1:0.08大于0.05,不显著

  对于回归系数 x2:0.029小于0.05,显著

 SUMMARY

  组 观测数 求和 平均 方差

  列 1 5 790 158 61.5

  列 2 4 600 150 36.66666667

  列 3 3 507 169 121

  方差分析

  差异源 SS df MS F P-value F crit 组间 618.9166667 2 309.4583333 4.657399666 0.040877239 4.256494729 组内 598 9 66.44444444

  总计 1216.916667 11

 4.65739966555184>4.25649472914256

  0.040877238761821>0.01,不能拒绝原假设

  2. 某家电制造公司准备购进一批 5#电池,现有 A、B、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取 5 只电池,经试验得其寿命(小时)数据见 book5.2 表。试分析三个企业生产的电池的平均寿命之间有无显著差异? ( =0.05) 方差分析:单因素方差分析

 SUMMARY

  组 观测数 求和 平均 方差

  列 1 5 15 3 2.5

  列 2 5 222 44.4 28.3

  列 3 5 150 30 10

  列 4 5 213 42.6 15.8

  方差分析

  差异源 SS df MS F P-value F crit 组间 5475.6 3 1825.2 128.9893993 2.02553E-11 3.238871522 组内 226.4 16 14.15

  总计 5702 19

 128.989399293286>3.23887152236109

 2.02552624576458E-11<0.05

 拒绝原假设,有显著差异

 3.将 24 家生产产品大致相同的企业按资金分为三类,每个公司的每 100 元销售收入的生产成本(单位:元)如表 book5.3,。这些数据能否说明三类公司的市场生产成本有差异?(显著性水平为 0.05)

 方差分析:单因素方差分析

 SUMMARY

  组 观测数 求和 平均 方差

  列 1 8 569 71.125 8.410714286

  列 2 8 595 74.375 18.83928571

  列 3 8 641 80.125 21.55357143

  方差分析

  差异源 SS df MS F P-value F crit 组间 332.3333333 2 166.1666667 10.21441639 0.000797305 3.466800112 组内 341.625 21 16.26785714

  总计 673.9583333 23

  10.214416392243>3.46680011159428

 0.000797304599141931<0.05

 拒绝原假设

  4.某商店采用四种不同的方式推销商品。为检验不同方式推销商品的效果是否有显著差异,随机抽取样本得到表 book5.4 的数据,请在 0.05 的显著性水平下做出决策。

 方差分析:单因素方差分析

 SUMMARY

  组 观测数 求和 平均 方差

  列 1 5 415 83 20

  列 2 5 449 89.8 23.7

  列 3 5 374 74.8 27.7

  列 4 5 395 79 29

 方差分析

  差异源 SS df MS F P-value F crit 组间 610.95 3 203.65 8.113545817 0.001644272 3.238871522 组内 401.6 16 25.1

  总计 1012.55 19

 8.11354581673307>3.23887152236109

 0.00164427236100831<0.05

  拒绝原假设,不同方式推销商品的效果差异显著

  方式一的方差最小,应选方式一

 5.五个地区每天发生交通事故的次数如表 book5.5,由于是随机抽样,有一些地区的样本容量较多(如南部和西部),而有些地区样本容量较少(如东部)。试以 0.01 的显著性水平检验各地区平均每天交通事故的次数是否相等? 方差分析:单因素方差分析

 SUMMARY

 组 观测数 求和 平均 方差

 列 1 4 57 14.25 6.25

 列 2 5 66 13.2 6.7

 列 3 5 64 12.8 3.7

 列 4 6 55 9.166666667 6.966666667

 列 5 6 67 11.16666667 4.566666667

 方差分析

 差异源 SS df MS F P-value F crit

 组间 82.63717949 4 20.65929487 3.676134944 0.020228804 4.368815174

 组内 118.0166667 21 5.61984127

  总计 200.6538462 25

 3.67613494399965<40368815

 0.0202288037227386>0.01

 不能拒绝原假设,没有足够证据证明验各地区平均每天交通事故的次数相等

  分布特征分析 第一部分

 1. 某百货公司 6 月份各天的销售额数据(单位:万元)

 见 book2.1。

 (1)计算该百货公司日销售额的均值、中位数、众数; (2)计算日销售额的标准差。

 某百货公司

  平均 274.1 标准误差 3.86595812 中位数 272.5 众数 #N/A 标准差 21.17472469 方差 448.3689655 峰度 -0.211917734 偏度 0.195086998 区域 86 最小值 236 最大值 322 求和 8223 观测数 30 最大(1) 322 最小(1) 236 置信度(95.0%) 7.906772022

  2. 将某地区 120 家企业按利润额进行分组,结果如表 book2.2,计算 120 家企业利润额的均值、标准差和离散系数。

 平均 426.6666667 标准误差 10.63352695 中位数 450 众数 450 标准差 116.4844515 方差 13568.62745 峰度 -0.624699913 偏度 0.208442033 区域 400 最小值 250 最大值 650 求和 51200 观测数 120 最大(1) 650 最小(1) 250 置信度 21.05544515

 (95.0%)

  离散系数 0.273010433

  3. 25 个网络用户的年龄(单位:周岁)数据如表 book2.3,计算网民年龄的众数、中位数、均值和标准差。

 平均 24 标准误差 1.33041347 中位数 23 众数 19 标准差 6.652067348 方差 44.25 峰度 0.772705131 偏度 1.080110357 区域 26 最小值 15 最大值 41 求和 600 观测数 25 最大(1) 41 最小(1) 15 置信度(95.0%) 2.745838427

  第二部分

 1. 某地区粮食生产情况如表 book2.4 所示,计算该地区粮食平均亩产量、亩产量的标准差。

 平均 286 标准误差 8.027100562 中位数 325 众数 325 标准差 80.27100562 方差 6443.434343 峰度 -0.393495826 偏度 -0.128212443 区域 300 最小值 125 最大值 425

 求和 28600 观测数 100 最大(1) 425 最小(1) 125 置信度(95.0%) 15.9275086

  2. 某公司下属的三个企业计划完成情况如表 book2.5,计算该公司的平均计划完成程度。

 实际产量/件 计划产值 1.2 450 375 1.05 315 300 0.95 361 380

 1126 1055

 平均计划完成程度

  1.067298578

 3. 某工业企业某车间工人加工零件情况如表 book2.6,要求确定该车间工人加工零件数的众数、中位数、均值和标准差。

  平均 44.3 标准误差 1.208179196 中位数 45 众数 45 标准差 12.08179196 方差 145.969697 峰度 1.049323481 偏度 0.452252788 区域 60 最小值 15 最大值 75 求和 4430 观测数 100 最大(1) 75 最小(1) 15 置信度(95.0%) 2.397289579

  4.两个生产车间工人按某产品日产量(件)分组资料如表 book2.7,分析两个车间日产量的平均水平,并说明其代表性的优劣。

  车间总产量

 340

 356

  车间日产量平均值

 8.5

 11.86666667

  第二车间的产量平均值高,因此第二车间生产好于第一车间。

 假设检验练习题 1.经验表明,一个矩形的宽与长之比等于 0.618 的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了 20 个框架测得比值数据见 book4.1 表。

 在显著性水平  =0.05 时能否认为该厂生产的工艺品框架宽与长的平均比例为 0.618?

 列1

 平均 0.6583 标准误差 0.020855783 中位数 0.6215 众数 0.606 标准差 0.093269897 方差 0.008699274 峰度 3.362449574 偏度 1.777452646 区域 0.38 最小值 0.553 最大值 0.933 求和 13.166 观测数 20 最大(1) 0.933 最小(1) 0.553 置信度(95.0%) 0.043651655 H0:u=0.618,H1:u≠0.618

 0.0403 0.020855783 1.932317766

 2.093024054 2.09302404985486> 1.932317766 不能拒绝原假设

  2.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者在面积相等、土壤等条件相同的 20 块田地,分别施用新旧两种肥料,得到新肥料所生产的产量数据见 book4.2 。通过计算得出对应旧肥料所生产的平均产量为 100公斤,检验新肥料的产量是否显著高于旧肥料。(显著性水平 =0.05)

 平均 100.7 标准误差 1.098084457 中位数 101 众数 98 标准差 4.91078298 方差 24.11578947 峰度 1.126259505 偏度 -0.610870917 区域 21 最小值 88 最大值 109 求和 2014 观测数 20 最大(1) 109 最小(1) 88 置信度(95.0%) 2.298317176 H0:u≤100,H1>100

 0.7 1.098084457 1.729132812

 1.729133>0.637474

 不能拒绝原假设

  3.某种电子元件的寿命服从正态分布,现测得 16 只元件的寿命见 book4.3,问是否有理由认为元件的平均寿命显著地低于 240 小时?(显著性水平为 0.05)

 平均 235.4736842 标准误差 21.02273462 中位数 222 众数 #N/A 标准差 91.63597572 方差 8397.152047 峰度 1.974300177 偏度 1.300917624 区域 384 最小值 101 最大值 485 求和 4474 观测数 19 最大(1) 485 最小(1) 101 置信度(95.0%) 44.16712644 H0:u≥240,H1:u<240

  4.526315789 21.02273462 0.215305757 1.734063607

  0.215305756905094<

 1.734064

 不能拒绝原假设

 4.从某大学经济系国际贸易专业 2008 级学生的统计学考试成绩见 book4.4,在显著性水平 0.05 下能否认为该班统计学成绩显著地高于 75 分。

 平均 76.22807018 标准误差 1.435107941 中位数 78 众数 81 标准差 10.83482735 方差 117.3934837 峰度 -0.071588364 偏度 -0.515379994 区域 50 最小值 46 最大值 96 求和 4345 观测数 57 最大(1) 96 最小(1) 46 置信度(95.0%) 2.874866642 H0:u≤75,H1:u>75

  15 9.006820028 1.665404655 Z<Za

  不能拒绝原假设

 时间序列分析练习题 1. 1981 年~2000 年我国财政用于文教、科技、卫生事业费支出额数据见book8.1 表。

 (1)用绘制时间序列图描述其趋势。

 (2)选择一条适合的趋势线拟合数据,并根据趋势线预测 2001 年的支出额。

 (3)用 5 期移动平均法预测 2001 年用于该项的支出额.

  年份与费用支出额呈正相关

 234.35

 276.06

 317.22

 369.73

 427.76 104.1116523 487.88 113.2792545 553.49 124.2932618 631.54 138.5540035 725.87 165.0585911 870.84 239.3241507 1040.79 300.4450033 1240.04 358.5947871 1462.17 402.9255552 1701.49 438.8792421 1927.47 453.4573278 2181.43 480.6115934 2001年的预测值为2181.43

 SUMMARY OUTPUT

 回归统计

  Multiple R 0.942823394

 R Square 0.888915952

 Adjusted R Square 0.882744616

 标准误差 276.2009589

 观测值 20

  方差分析

 df SS MS F Significance F

 回归分析 1 10988334.47 10988334.47 144.0394671 5.03539E-10

 残差 18 1373165.455 76286.96972

 总计 19 12361499.92

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept -363.6092632 128.3040336 -2.833965955 0.011004682 -633.1660348 -94.0524915 年份 t 128.5449774 10.71061379 12.00164435 5.03539E-10 106.0428129 151.047142

  回归方程:y=128.54t-363.61

 当 t=21时,y=2335.73

 2. 1981 年~2000 年我国油菜籽单位面积产量数据(单位:kg/hm)见 book8.2 表。

 (1)根据绘制时间序列图描述其形态。

 (2)用 5 期移动平均法预测 2001 年的单位面积产量。

 (3)建立一个趋势方程预测各年的单位面积产量

  年份增长,单位面积产量基本保持持平 1293.6

 1243.4

 1221

 1191.4

 1164 89.33698003 1167 96.11713687 1170 96.26417818 1174.2 106.0369747 1232 80.95707505 1272.2 75.5985185 1303.4 80.7532538 1333.8 79.60236177 1373.4 79.2815237 1366 82.86712255 1400.6 87.68913274 1421.2 84.06307156

  2001年估计值时1421.2 SUMMARY OUTPUT

 回归统计

  Multiple R 0.45173525

 R Square 0.204064736

 Adjusted R Square 0.15984611

 标准误差 119.2106022

 观测值 20

 方差分析

 df SS MS F Significance F

 回归分析 1 65583.18195 65583.18195 4.614904523 0.045555718

 残差 18 255801.018 14211.16767

 总计 19 321384.2

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 1192.026316 55.3770746 21.52562815 2.6977E-14 1075.683399 1308.369232 年份 9.930827068 4.622788871 2.148232884 0.045555718 0.218708057 19.64294608

 回归方程:y=9.93x1+1192.02631578947

 3. 一家旅馆过去 18 个月的营业额数据见 book8.3 表。

 (1)根据绘制时间序列图描述其形态。

 (2)用 3 期移动平均法预测第 19 个月的营业额。

 (3)建立一个趋势方程预测各月的营业额

  营业额与月份正相关 300

 320

 321 31.27299154 340 36.38223009 348.6666667 35.5501732 397 35.22520142

 412 27.96095161 442.6666667 27.20362176 455.6666667 20.57146531 474.6666667 19.71181259 466.6666667 13.63410756 491.3333333 32.28002478 531.3333333 51.4436045 577.3333333 50.73022329 610.6666667 44.93699293 630.3333333 26.36074523 第19个月的预测值为630.33万元 SUMMARY OUTPUT

 回归统计

  Multiple R 0.967257104

 R Square 0.935586306

 Adjusted R Square 0.93156045

 标准误差 31.66276183

 观测值 18

  方差分析

 df SS MS F Significance F

 回归分析 1 232982.4567 232982.4567 232.3943857 5.99425E-11

 残差 16 16040.48779 1002.530487

 总计 17 249022.9444

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 239.7320261 15.57054955 15.39650386 5.16349E-11 206.7239359 272.7401164 月份 21.92879257 1.438473625 15.24448706 5.99425E-11 18.87936473 24.97822041

 回归方程:y=21.9287925696594x1+239.732026143791

  统计指数练习题 1.某商店三种商品的销售情况如下表,

 商品名称 计量单位 销售量 销售价格(元)

 基期 报告期 基期 报告期 甲 件 40000 60000 10 8 乙 米 80000 88000 8 8 丙 千克 60000 30000 3 4.5 (1)分析该商店三种商品的销售量总指数及由于销售量变动引起的销售额的增加额; (2)分析该商店三种商品的价格总指数及由于价格变动引起的销售额的增加额; (3)分析该商店三种商品的销售额总指数及报告期较基期的销售额的增加额; 商品名称 计量单位 销售量 销售价格(元)

 基期 q0 报告期q1 基期 p0 报告期p1 p0q1 p0q0 p1q1 甲 件 40000 60000 10 8 600000 400000 480000 乙 米 80000 88000 8 8 704000 640000 704000 丙 千克 60000 30000 3 4.5 90000 180000 135000

  1394000 1220000 1319000

 [1] 销售量指数 1.142622951

 销售额的增加额 174000

 [2] 价格总指数 0.946197991

 销售额的增加额 -75000

 [3] 销售额总指数 1.081147541

  报告期较基期的销售额的增加额 99000

 2.某企业三种商品的成本情况如下表, 商品名称 计量单位 产量 产品单位成本(元)

 基期 报告期 基期 报告期 甲 件 90 110 10 9 乙 箱 48 60 5 4.2 丙 千克 160 240 8 6.4 (1)分析三种商品的产量总指数及由于产量变动引起的总成本的增加额; (2)分析三种商品的产品单位成本总指数及由于产品单位成本变动引起的总成本的增加额; (3)分析三种商品的总成本指数及报告期较基期的总成本的增加额。

 商品名称 计量单位 产量 产品单位成本(元)

 基期 q0 报告期q1 基期 p0 报告期p1 p0q1 p0q0 p1q1

 甲 件 90 110 10 9 1100 900 990 乙 箱 48 60 5 4.2 300 240 252 丙 千克 160 240 8 6.4 1920 1280 1536

  3320 2420 2778

 [1] 产量总指数 1.371900826

 总成本的增加额 900

 [2] 单位成本总指数 0.836746988

 总成本的增加额 -542

 [3] 总成本指数 1.147933884

 总成本的增加额 358

 3.某工厂工人产量统计分组资料如下表, 工人按生产技术熟练程度分组 工人数(人)

 每天平均产量(件)

 基期 报告期 基期 报告期 第一组 100 120 100 110 第二组 300 400 70 75 第三组 100 280 40 42 (1)计算固定构成指数及由于各组工人每天平均产量变动引起的所有工人平均产量的增加额; (2)计算结构影响指数及由于工人熟练程度结构分配变动引起的所有工人平均产量的增加额; (3)计算可变构成指数及报告期较基期的所有工人每天平均产量的增加额。

 工人按生产技术熟练程度分组 工人数(人)

 每天平均产量(件)

  基期 f0 报告期f1 基期 x0 报告期x1

 x1f1 x0f1 x0f0 第一组 100 120 100 110

 13200 12000 10000 第二组 300 400 70 75

 30000 28000 21000 第三组 100 280 40 42

 11760 11200 4000

 500 800 210 227

 54960 51200 35000

 [1] 固定构成指数 1.0734375

 平均产量的增加额 4.7

  [2] 结构影响指数 0.914

 平均产量的增加额 -6

  [3] 可变构成指数 1.57

 每天平均产量的增加额 19960

  一元线性回归练习题 1. 各地区城镇居民2007年的人均消费水平和人均可支配收入的统计数据见book6.1 表。

 (1)人均可支配收入作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。

 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

 (4)检验回归方程线性关系的显著性 ( 

 =0.05)。

 (5)如果某地区的人均可支配收入为 25000 元,预测其人均消费水平。

 人均可支配收入与人均消费水平呈正相关

  人均消费支出(元) 人均可支配收入(元) 人均消费支出(元) 1

 人均可支配收入(元) 0.976025367 1 相关系数为0.971098,接近于1,相关性很强 SUMMARY OUTPUT

 回归统计

  Multiple R 0.976025367

 R Square 0.952625517

 Adjusted R Square 0.950991914

 标准误差 559.3304731

 观测值 31

  2. 某随机抽取的 10 家航空公司,对其最近一年的航班正点率和顾客投诉次数进行了调查,所得数据见 book6.2 表。

 (1)绘制散点图,说明二者之间的关系形态。

 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

 (3)用航班正点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义。

 (4)检验回归系数的显著性 ( 

 =0.05)。

 (5)如果航班正点率为 80%,估计顾客的投诉次数。

 航班正点率与投诉次数负相关 航班正点率/% 投诉次数/次 航班正点率/% 1

 方差分析

 df SS MS F Significance F

 回归分析 1 182436901.4 182436901.4 583.1438845 9.38075E-21

 残差 29 9072666.765 312850.5781

 总计 30 191509568.1

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 450.3340782 388.9055916 1.157952181 0.256331528 -345.0671538 1245.73531 人均可支配收入 0.691971456 0.028654994 24.14837229 9.38075E-21 0.633365415 0.750577498 回归方程:y=0.692x+450.334

  相关系数的意义:人均可支配收入每增加1元,人均消费增加0.692元

  F 值远远小于0.05,方程相关性显著

  x=25000时,估计值为17750.334

 投诉次数/次 -0.868642626 1

  接近于-1,相关性强

 SUMMARY OUTPUT

  回归统计

 Multiple R 0.868642626

 R Square 0.754540012

 Adjusted R Square 0.723857513

 标准误差 18.88721792

 观测值 10

  方差分析

 df SS MS F Significance F

 回归分析 1 8772.583994 8772.583994 24.5918699 0.001108261

 残差 8 2853.816006 356.7270008

 总计 9 11626.4

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% 下限 95.0% 上限 95.0% Intercept 430.1892329 72.15483219 5.962029428 0.000337402 263.7998916 596.5785742 263.7998916 596.5785742 航班正点率/% -4.700622632 0.947893644 -4.959019047 0.001108261 -6.886469292 -2.514775972 -6.886469292 -2.514775972

 回归方程:

 y=-4.7x+430.189

 回归系数的意义:航班正点率每增加百分之1,投诉数减少4.7

 p 值小于0.05,相关性强

  x=80%时, 426.429

 3. 随机抽取 7 家超市,得到其广告费支出和销售额数据见 book6.3 表。

 (1)用广告费支出作自变量,销售额为因变量,绘制散点图,并说明二者之间的关系形态。

 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。

 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

 (4)检验广告费支出与销售额之间的线性关系是否显著 ( 

 =0.05)。

  广告支出费用与销售额呈正相关

 广告费支出/万元 销售额/万元 广告费支出/万元 1

  销售额/万元 0.830868141 1 相关系数0.83接近于1,相关性强

 方差分析

 df SS MS F Significance F

 回归分析 1 691.7225519 691.7225519 11.146839 0.020582051

 残差 5 310.2774481 62.05548961

 总计 6 1002

  Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 29.39910979 4.807253405 6.115573138 0.001694771 17.04167151 41.75654807 广告费支出/万元 1.547477745 0.463498729 3.338688216 0.020582051 0.356016331 2.738939158

 回归方程:y=1.547x+29.40

 系数的意义:表示广告费支出每增加1万元,销售额增加1.547万元

 F 值0.02小于0.05,所以广告费支出与销售额之间的线性关系是显著的

相关热词搜索: 作业 题目 答案