第4章 统计数据的概括性描述.docx

上传人:b****1 文档编号:10679822 上传时间:2023-05-27 格式:DOCX 页数:16 大小:64.46KB
下载 相关 举报
第4章 统计数据的概括性描述.docx_第1页
第1页 / 共16页
第4章 统计数据的概括性描述.docx_第2页
第2页 / 共16页
第4章 统计数据的概括性描述.docx_第3页
第3页 / 共16页
第4章 统计数据的概括性描述.docx_第4页
第4页 / 共16页
第4章 统计数据的概括性描述.docx_第5页
第5页 / 共16页
第4章 统计数据的概括性描述.docx_第6页
第6页 / 共16页
第4章 统计数据的概括性描述.docx_第7页
第7页 / 共16页
第4章 统计数据的概括性描述.docx_第8页
第8页 / 共16页
第4章 统计数据的概括性描述.docx_第9页
第9页 / 共16页
第4章 统计数据的概括性描述.docx_第10页
第10页 / 共16页
第4章 统计数据的概括性描述.docx_第11页
第11页 / 共16页
第4章 统计数据的概括性描述.docx_第12页
第12页 / 共16页
第4章 统计数据的概括性描述.docx_第13页
第13页 / 共16页
第4章 统计数据的概括性描述.docx_第14页
第14页 / 共16页
第4章 统计数据的概括性描述.docx_第15页
第15页 / 共16页
第4章 统计数据的概括性描述.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

第4章 统计数据的概括性描述.docx

《第4章 统计数据的概括性描述.docx》由会员分享,可在线阅读,更多相关《第4章 统计数据的概括性描述.docx(16页珍藏版)》请在冰点文库上搜索。

第4章 统计数据的概括性描述.docx

第4章统计数据的概括性描述

第四章统计数据的概括性描述

4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:

台)排序后如下:

24710101012121415

要求:

(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:

Statistics

汽车销售数量

N

Valid

10

Missing

0

Mean

9.60

Median

10.00

Mode

10

Std.Deviation

4.169

Percentiles

25

6.25

50

10.00

75

12.50

4.2随机抽取25个网络用户,得到他们的年龄数据如下:

单位:

周岁

19

15

29

25

24

23

21

38

22

18

30

20

19

19

16

23

27

22

34

24

41

20

31

17

23

要求;

(1)计算众数、中位数:

1、排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄

Frequency

Percent

CumulativeFrequency

CumulativePercent

Valid

15

1

4.0

1

4.0

16

1

4.0

2

8.0

17

1

4.0

3

12.0

18

1

4.0

4

16.0

19

3

12.0

7

28.0

20

2

8.0

9

36.0

21

1

4.0

10

40.0

22

2

8.0

12

48.0

23

3

12.0

15

60.0

24

2

8.0

17

68.0

25

1

4.0

18

72.0

27

1

4.0

19

76.0

29

1

4.0

20

80.0

30

1

4.0

21

84.0

31

1

4.0

22

88.0

34

1

4.0

23

92.0

38

1

4.0

24

96.0

41

1

4.0

25

100.0

Total

25

100.0

 

 

从频数看出,众数Mo有两个:

19、23;从累计频数看,中位数Me=23。

(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;

Mean=24.00;Std.Deviation=6.652

(4)计算偏态系数和峰态系数:

Skewness=1.080;Kurtosis=0.773

(5)对网民年龄的分布特征进行综合分析:

分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

为分组情况下的直方图:

为分组情况下的概率密度曲线:

分组:

1、确定组数:

,取k=6

2、确定组距:

组距=(最大值-最小值)÷组数=(41-15)÷6=4.3,取5

3、分组频数表

网络用户的年龄(Binned)

Frequency

Percent

CumulativeFrequency

CumulativePercent

Valid

<=15

1

4.0

1

4.0

16-20

8

32.0

9

36.0

21-25

9

36.0

18

72.0

26-30

3

12.0

21

84.0

31-35

2

8.0

23

92.0

36-40

1

4.0

24

96.0

41+

1

4.0

25

100.0

Total

25

100.0

 

 

分组后的均值与方差:

Mean

23.3000

Std.Deviation

7.02377

Variance

49.333

Skewness

1.163

Kurtosis

1.302

分组后的直方图:

4.3某银行为缩短顾客到银行办理业务等待的时间。

准备采用两种排队方式进行试验:

一种是所有颐客都进入一个等待队列:

另—种是顾客在三千业务窗口处列队3排等待。

为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。

得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。

第二种排队方式的等待时间(单位:

分钟)如下:

5.56.66.76.87.17.37.47.87.8

要求:

(1)画出第二种排队方式等待时间的茎叶图。

第二种排队方式的等待时间(单位:

分钟)Stem-and-LeafPlot

FrequencyStem&Leaf

1.00Extremes(=<5.5)

3.006.678

3.007.134

2.007.88

Stemwidth:

1.00

Eachleaf:

1case(s)

(2)计算第二种排队时间的平均数和标准差。

Mean

7

Std.Deviation

0.714143

Variance

0.51

(3)比较两种排队方式等待时间的离散程度。

第二种排队方式的离散程度小。

(4)如果让你选择一种排队方式,你会选择哪—种?

试说明理由。

选择第二种,均值小,离散程度小。

4.4某百货公司6月份各天的销售额数据如下:

单位:

万元

257

276

297

252

238

310

240

236

265

278

271

292

261

281

301

274

267

280

291

258

272

284

268

303

273

263

322

249

269

295

要求:

(1)计算该百货公司日销售额的平均数和中位数。

(2)按定义公式计算四分位数。

(3)计算日销售额的标准差。

解:

Statistics

百货公司每天的销售额(万元)

N

Valid

30

Missing

0

Mean

274.1000

Median

272.5000

Std.Deviation

21.17472

Percentiles

25

260.2500

50

272.5000

75

291.2500

4.5甲乙两个企业生产三种产品的单位成本和总成本资料如下:

产品

单位成本

总成本(元)

名称

(元)

甲企业

乙企业

A

B

C

15

20

30

2100

3000

1500

3255

1500

1500

要求:

比较两个企业的总平均成本,哪个高,并分析其原因。

产品名称

单位成本(元)

甲企业

乙企业

总成本(元)

产品数

总成本(元)

产品数

A

15

2100

140

3255

217

B

20

3000

150

1500

75

C

30

1500

50

1500

50

平均成本(元)

19.41176471

18.28947368

调和平均数计算,得到甲的平均成本为19.41;乙的平均成本为18.29。

甲的中间成本的产品多,乙的低成本的产品多。

4.6在某地区抽取120家企业,按利润额进行分组,结果如下:

按利润额分组(万元)

企业数(个)

200~300

300~400

400~500

500~600

600以上

19

30

42

18

11

合计

120

要求:

(1)计算120家企业利润额的平均数和标准差。

(2)计算分布的偏态系数和峰态系数。

解:

Statistics

企业利润组中值Mi(万元)

N

Valid

120

Missing

0

Mean

426.6667

Std.Deviation

116.48445

Skewness

0.208

Std.ErrorofSkewness

0.221

Kurtosis

-0.625

Std.ErrorofKurtosis

0.438

4.7为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。

请回答下面的问题,并解释其原因。

(1)两位调查人员所得到的样本的平均身高是否相同?

如果不同,哪组样本的平均身高较大?

(2)两位调查人员所得到的样本的标准差是否相同?

如果不同,哪组样本的标准差较大?

(3)两位调查人员得到这l100名少年儿童身高的最高者或最低者的机会是否相同?

如果不同,哪位调查研究人员的机会较大?

解:

(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。

(2)不一定相同,样本量少的标准差大的可能性大。

(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。

4.8一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。

请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?

为什么?

女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。

(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。

都是各乘以2.21,男生的平均体重为60kg×2.21=132.6磅,标准差为5kg×2.21=11.05磅;女生的平均体重为50kg×2.21=110.5磅,标准差为5kg×2.21=11.05磅。

(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间?

计算标准分数:

Z1=

=

=-1;Z2=

=

=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?

计算标准分数:

Z1=

=

=-2;Z2=

=

=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。

4.9一家公司在招收职员时,首先要通过两项能力测试。

在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。

一位应试者在A项测试中得了115分,在B项测试中得了425分。

与平均分数相比,该应试者哪一项测试更为理想?

解:

应用标准分数来考虑问题,该应试者标准分数高的测试理想。

ZA=

=

=1;ZB=

=

=0.5

因此,A项测试结果理想。

4.10一条产品生产线平均每天的产量为3700件,标准差为50件。

如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。

下面是一周各天的产量,该生产线哪几天失去了控制?

时间

周一周二周三周四周五周六周日

产量(件)

3850367036903720361035903700

时间

周一

周二

周三

周四

周五

周六

周日

产量(件)

3850

3670

3690

3720

3610

3590

3700

日平均产量

3700

日产量标准差

50

标准分数Z

3

-0.6

-0.2

0.4

-1.8

-2.2

0

标准分数界限

-2

-2

-2

-2

-2

-2

-2

2

2

2

2

2

2

2

周六超出界限,失去控制。

4.11对10名成年人和10名幼儿的身高进行抽样调查,结果如下:

成年组

166169l72177180170172174168173

幼儿组

686968707l7372737475

要求:

(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?

为什么?

均值不相等,用离散系数衡量身高差异。

(2)比较分析哪一组的身高差异大?

成年组

幼儿组

平均

172.1

平均

71.3

标准差

4.201851

标准差

2.496664

离散系数

0.024415

离散系数

0.035016

幼儿组的身高差异大。

4.12一种产品需要人工组装,现有三种可供选择的组装方法。

为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。

下面是15个工人分别用三种方法在相同的时间内组装的产品数量:

单位:

方法A

方法B

方法C

164

167

168

165

170

165

164

168

164

162

163

166

167

166

165

129

130

129

130

131

]30

129

127

128

128

127

128

128

125

132

125

126

126

127

126

128

127

126

127

127

125

126

116

126

125

要求:

(1)你准备采用什么方法来评价组装方法的优劣?

(2)如果让你选择一种方法,你会作出怎样的选择?

试说明理由。

解:

对比均值和离散系数的方法,选择均值大,离散程度小的。

方法A

方法B

方法C

平均

165.6

平均

128.7333333

平均

125.5333333

标准差

2.131397932

标准差

1.751190072

标准差

2.774029217

离散系数:

VA=0.01287076,VB=0.013603237,VC=0.022097949

均值A方法最大,同时A的离散系数也最小,因此选择A方法。

4.13在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。

预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。

下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。

在股票市场上,高收益率往往伴随着高风险。

但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计量来反映投资的风险?

标准差或者离散系数。

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

选择离散系数小的股票,则选择商业股票。

(3)如果进行股票投资,你会选择商业类股票还是高科技类股票?

考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2