数据的收集.docx

上传人:b****2 文档编号:2876440 上传时间:2023-05-04 格式:DOCX 页数:18 大小:179.84KB
下载 相关 举报
数据的收集.docx_第1页
第1页 / 共18页
数据的收集.docx_第2页
第2页 / 共18页
数据的收集.docx_第3页
第3页 / 共18页
数据的收集.docx_第4页
第4页 / 共18页
数据的收集.docx_第5页
第5页 / 共18页
数据的收集.docx_第6页
第6页 / 共18页
数据的收集.docx_第7页
第7页 / 共18页
数据的收集.docx_第8页
第8页 / 共18页
数据的收集.docx_第9页
第9页 / 共18页
数据的收集.docx_第10页
第10页 / 共18页
数据的收集.docx_第11页
第11页 / 共18页
数据的收集.docx_第12页
第12页 / 共18页
数据的收集.docx_第13页
第13页 / 共18页
数据的收集.docx_第14页
第14页 / 共18页
数据的收集.docx_第15页
第15页 / 共18页
数据的收集.docx_第16页
第16页 / 共18页
数据的收集.docx_第17页
第17页 / 共18页
数据的收集.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据的收集.docx

《数据的收集.docx》由会员分享,可在线阅读,更多相关《数据的收集.docx(18页珍藏版)》请在冰点文库上搜索。

数据的收集.docx

数据的收集

北京四中

编 稿:

张 杨  审 稿:

辛文升  责 编:

姚一民

数据的收集

  知识要点:

  1.数据收集的过程:

明确调查问题,确定调查对象,选择调查方法,展开调查,记录结果(一般以表格形式),得出结论。

  2.在一次实验统计中,某个对象出现的次数称为它的频数;这个次数与总次数的比值(或百分比),称为它出现的频率。

频数和频率能反映出该对象出现的频繁程度。

  3.随着实验次数增加,频数也会跟着增加,但频率始终在0和1之间。

  例题解析:

  例1建国以来,我国已经进行了五次人口普查,下表是历次普查得到的全国人口数量统计表:

普查年份

1953

1964

1982

1990

2000

人口数(亿)

5.94

6.95

10.08

11.34

12.95

  请问:

  

(1)1953年我国人口数量是______亿,2000年我国人口数量是______亿;

  

(2)从1953年至2000年,我国人口数量增加了________亿。

  解:

(1)5.94,12.95;

  

(2)7.01.

  例2下面是几次投掷硬币的试验结果,仔细观察并回答下列问题:

  

(1)第一次试验中,正面朝上的频数为  ,反面朝上的频率为  。

  

(2)第二次试验中,反面朝上的频数为  ,出现正面的频率为  。

  (3)第三次试验中,正面朝上的频率为  ,反面朝上的频率为  ,两种频率的和为 。

  (4)第四次试验中,正面朝上的频率为  ,反面朝上的频率为 ,两种频率的和为  。

  (5)四次试验中抛掷硬币的总次数为  ,出现反面朝上的总次数为  。

  分析:

注意频数表示该对象出现的次数,而频率则表示频数与总数的比。

  解:

(1)正面朝上的频数为14,反面朝上的频率为

=

  

(2)反面朝上的频数为20,出现正面的频率为

  (3)正面朝上的频率为

=

,反面朝上的频率为

=

,两种频率的和为

  (4)正面朝上的频率为

,反面朝上的频率为

,两种频率的和为

  (5)四次试验中抛掷硬币的总次数为30+40+50+60=180,出现反面朝上的总次数为16+20+24+31=91。

  例3以下图表为某小学五年级的体育成绩统计表,观察表中数据并回答下列问题:

学号

成绩

学号

成绩

学号

成绩

学号

成绩

1

78

6

85

11

86

16

83

2

86

7

66

12

94

17

96

3

67

8

90

13

84

18

75

4

54

9

89

14

79

19

62

5

91

10

77

15

48

20

71

学号

成绩

学号

成绩

学号

成绩

学号

成绩

21

88

26

100

31

91

36

65

22

78

27

85

32

86

37

59

23

65

28

79

33

87

38

92

24

88

29

84

34

84

39

76

25

63

30

52

35

78

40

87

  问:

(1)这个班的学生成绩分布在90~100的频数为多少,频率为多少?

  

(2)这个班的学生成绩分布在80~89的频数为多少,频率为多少?

  (3)这个班的学生成绩分布在70~79的频数为多少,频率为多少?

  (4)这个班的学生成绩分布在60~69的频数为多少,频率为多少?

  (5)这个班的学生不及格的频数为多少,频率为多少?

  (6)综上所得结果,这个班的成绩分布在哪个分数段的人数最多?

  分析:

可以采用画“正”的方法进行统计。

结果如下:

分数段

90~100

80~89

70~79

60~69

不及格

结果

  解:

(1)这个班的学生成绩分布在90~100的频数为7,频率为

  

(2)这个班的学生成绩分布在80~89的频数为14,频率为

  (3)这个班的学生成绩分布在70~79的频数为9,频率为

  (4)这个班的学生成绩分布在60~69的频数为6,频率为

  (5)这个班的学生不及格的频数为4,频率为

  (6)观察在这五个频数中14最大,而相应的频率

也是最大的频率,所以这个班的成绩分布在80~89分数段的人数最多。

  例4下面是某工厂工人的生日情况统计方格图,试回答下列问题:

图5-1

  问:

生日分布在1~3月份的频数为多少?

4~6月份的呢?

7~9月份的呢?

10~12月份的呢?

它们的频率又分别为几?

  分析:

看条形图,首先要注意各个长方形分别代表哪一项,要求某时间段内的频数,只要把相应的长方形的数据相加即可。

  解:

生日分布在1~3月份的频数为:

  2500+1100+3300=6900

  生日分布在4~6月份的频数为:

  5300+2200+1500=9000

  生日分布在7~9月份的频数为:

  4500+3500+1200=9200

  生日分布在10~12月份的频数为:

  2100+3600+2200=7900

  总数为:

6900+9000+9200+7900=33000

  故各自的频率为:

1~3月份为:

6900÷33000=20.91%

  4~6月份为:

9000÷33000=27.27%

  7~9月份为:

9200÷33000=27.88%

  10~12月份为:

7900÷33000=23.94%

  练习:

  1.请设计一张关于全班同学早上起床时间的统计表,将其分成5:

30之前,5:

30~5:

59,6:

00~6:

29,6:

30~6:

59,7:

00之后,这五个时间段,看看落在哪个时间段的频数最多。

 

5:

30之前

5:

30~5:

59

6:

00~6:

29

6:

30~6:

59

7:

00之后

频数

 

 

 

 

 

频率

 

 

 

 

 

  2.拿一个骰子,假设连续抛掷30次为一组,对每一组记录下得到点数为4的频数,算出频率,再多做两组看看得到的结果有没有规律。

 

30次

60次

90次

出现点数为4的频数

 

 

 

相应的频率

 

 

 

  3.取两个硬币,每一次都同时抛出,连续抛20次,记下两次都是正面朝上的次数,计算出频率。

再把试验重做四遍,看看五次得到的频率是否相近,如果是,都接近哪个数?

 

20次

40次

60次

80次

100次

都是正面朝上的频数

 

 

 

 

 

相应的频率

 

 

 

 

 

  4.拿一副扑克牌(52张)。

每次取出一张,然后放回去,连续做30次,记录下得到的是红桃或梅花之一的频数,计算出频率。

再将试验重做三次,看看得到的频率是否接近,如果是,都接近于几?

 

30次

60次

90次

120次

抽到红桃或梅花的频数

 

 

 

 

相应的频率

 

 

 

 

  5.以下是某数的前105位数,计算其中数字0出现的频率:

  1001110000111110000001111111000000001111111110000000000111111111110000000000001111

11111111100000000000000

  练习答案:

  1.2.3.4略。

  5.解:

0出现的频数为:

2+4+6+……+14=(2+14)÷2×7=56,从而频率为:

56÷105=53.3%。

北京四中

打字机或电脑键盘上的字母为何不作顺序排列?

  想一想

  在输入这段文字时,键盘上哪些字母与手指会有较多的接触的机会?

指头与字母键接触的频数分布与字母在键盘上的排列有何关系?

  为了提高把资料输入打字机或电脑的效率,键盘上字母位置的设计须考虑到手指移动的灵活特性。

根据指头与键接触时的活动情况,可把键盘上的字母划分为八个区域,并由不同的手指负责“管辖”。

从上图可见,两只灵活的食指须控制的字母键共有12个之多。

  在初学打字时,小甘曾抱怨键盘字母位置为何不作顺序排列,浪费了他在幼儿园时学习26个英文字母的记忆。

因此,当数学老师要求同学们作专题研习时,小甘决定以统计方法去探讨键盘字母位置的设计。

  首先,小甘利用从图书馆拿回来的一份宣传道路安全的刊物作为分析的材料。

然后随意地选取其中一段文字,并将组成每个字的字母频率(frequency)记录下来。

为了方便显示这些频数分布的情况,小甘采用了图D10.1的记号。

小甘统计到字母出现的总频数为531。

将每一个字母本身的频数除以此数,可计算出其相对频率(relativefrequency)。

然后小甘再把相对频率化作百分数,并以整数表示于字母键的记号内。

  小甘发现字母出现的相对频率(以百分数表示)介乎0至14(准确至最接近的整数)之间;而相对频率的平均数(mean)为4。

当字母的相对频率fr≥4,小甘在频率分布图上以较大的圈表示;低于4,则以小圈显示出来。

图5-19

  根据图D10.2频数分布的情况分析,小甘得到以下的结论:

键盘上字母位置的排列大致上是符合以指头的不同灵活程度作为设计上的考虑。

若字母以顺序排列,似乎不大适合“手指分工”的操作方式;但对于惯用“独孤一指”去接触字母键的人,也许是提供另类方便的选择。

  频数(frequency):

出现的次数。

计算这平均数(mean)是将全部字母的相对频率(fr)加起来再除以26。

北京四中

  知识梳理:

  一.普查、总体、个体、抽样调查、样本的概念.

  为了一定的目的而对考察的对象进行全面的调查,称为普查。

在统计中,我们把所要考察的对象的全体叫做总体.总体中每一个考察对象叫做个体.从总体中所抽取的一部分个体叫做总体的一个样本.样本中个体的数目叫做样本容量.要注意:

这里所谓“考察对象”是指数据,不是指事物本身.例如:

要考察“某市全体学生的身高”,总体是指“全体学生的身高”而不是“全体学生”.样本中的个体也是指数据.

  二.频率分布的几个概念:

  每个小组内数据的个数叫做这个小组的频数.组距是指每个小组的两个端点的距离。

每个小组的频数与数据总数的比值叫做这一小组的频率.用表格的形式把各小组的频数、频率表示出来,可以知道一组数据在各个小组内所占的比例大小,这样的表格称为频率分布表.

  三.求频率分布的步骤:

  

(1)计算极差;

(2)决定组距和组数;(3)决定分点;(4)列频率分布表;(5)画频率分布直方图.

  例题解析

  例1.为了让人们感受丢弃塑料袋对环境造成的影响,某班环保小组的六名同学记录了自己家中一周内丢弃的塑料袋的数量,结果如下(单位:

个):

33 25 28 26 25 31.如果该班有45名学生,那么根据提供的数据估计本周全班同学各家总共丢弃塑料袋的数量约为( )

  A、900个  B、1080个  C、1260个  D、1800个

  答案:

C

  例2.某班同学参加环保知识竞赛,将学生的成绩(得分取整数)进行整理后分成五组,绘成频率分布直方图.图中从左到右各小组的小长方形的高的比是1:

3:

6:

4:

2,最右边一组的频数是6.结合直方图提供的信息,解答下列问题:

  

(1)该班共有多少名同学参赛?

  

(2)成绩落在哪组数据范围内的人数最多,是多少?

  (3)求成绩在60分以上(不含60分)的学生占全班参赛人数的百分率.

图14-3

  考点:

频率分布

  评析:

此题分三问,根据给出的长方形的高的比和频数的比是一样的,由最右边一组的频数是6,可求出各组频数是3,9,18,12,6,则第一问可求,结果为48;第二问根据直方图可知落在70.5~80.5的人数最多,结果是18;第三问60以上的是45人,占百分率为

×100%=93.75%.解题过程如下:

  解:

  

(1)由直方图的意义可知:

小长方形高的比等于频数的比

  由最右边一组的频数为6可得:

  各组频数依次是3,9,18,12,6.

  3+9+18+12+6=48,共有48个数据,即有48名学生参赛.

  

(2)成绩落在70.5~80.5数据范围内的人数最多,人数为18.

  (3)60分以上的人数是45.

  所占全班参赛人数的百分率为:

×100%=93.75%.

  例3.为增强学生的身体素质,某校坚持长年的全员体育锻炼,并定期进行体能测试.下面是将某班学生的立定跳远成绩(精确到0.01米)进行整理后,分成5组,画出的频率分布直方图的一部分.已知从左到右4个小组的频率分别是0.05,0.15,0.30,0.35,第5小组的频数是9.

图14-4

  

(1)请将频率分布直方图补充完整;

  

(2)该班参加这次测试的学生有多少人?

  (3)若成绩在2.00米以上(含2.00米)的为合格,问该班成绩的合格率是多少?

  (4)这次测试中,你能肯定该班学生成绩的众数和中位数各落在哪一小组内吗?

(只需写出能或不能,不必说明理由)

  考点:

频率分布直方图的应用

  评析:

因为一个样本的频率总和为1,所以易知,第五组的频率为0.15和第二组相同,因此直方图与它相同.又因为第五组的频数是9,所以参加测试人数为9÷0.15=60人,因为后三组的频率之和为0.80,所以该班成绩合格率为80%.虽然在第四组的人数多,但不能确定中位数或众数.根据直方图不能确定中位数和众位数在哪一组内.解题过程如下:

图14-5

  解:

  

(1)把直方图补充完整(如图所示).

  

(2)因为第5小组的频率是0.15,频数是9,所以该班参加这次测试学生的人数是:

9÷0.15=60(人)

  (3)因为第3、4、5各小组的频率之和为0.80,所以该班成绩的合格率是80%.

  (4)不能肯定众数和中位数各在哪一小组内.

  真题专练

  1.(北京朝阳区)甲乙二人参加某体育项目训练,为了便于研究,把最近五次训练成绩分别用实线和虚线连结,如图14-6所示,下面的结论错误的是( )

图14-6

  A、乙的第二次成绩与第五次成绩相同

  B、第三次测试甲的成绩与乙的成绩相同

  C、第四次测试甲的成绩比乙的成绩多2分

  D、五次测试甲的成绩都比乙的成绩高

  2.(重庆市)如图14-7所示的是初三某班60名同学参加初三数学毕业会考所得成绩(成绩均为整数)整理后画出的频率分布直方图,根据图中可得出该班及格(60分以上)的同学的人数为  人.

图14-7

  3.(黑龙江省哈尔滨市)为了解某中学初中三年级300名男学生的身体发育情况,从中对20名男学生的身高进行了测量,结果如下:

(单位:

厘米)

  175 161 171 176 167 181 161 173 171 177 

  179 172 165 157 173 173 166 177 169 181

  下表是根据上述数据填写的频率分布表的一部分:

  

(1)请填写表中未完成的部分.

  

(2)样本数据中,男生身高的众数是多少厘米?

  (3)根据表中数据整理与计算回答:

该校初中三年级男学生身高在171.5~176.5(厘米)范围内的人数为多少

分 组

频数累计

频数

频率

156.5~161.5

3

0.15

161.5~166.5

2

0.10

166.5~171.5

4

0.20

171.5~176.5

正-

 

0.30

176.5~181.5

5

 

合 计

 

20

1.00

  4.(安徽省)随机抽取某城市30天的空气质量状况统计如下:

污染指数(w)

40

70

90

110

120

140

天数(t)

3

5

10

7

4

1

  其中,w≤50时,空气质量为优;50

  5.(福建福州)为了了解中学生的体能情况,某校抽取了50名初三学生进行一分钟跳绳次数测试,将所得数据整理后,画出部分频率分布直方图.如图所示,已知图中从左到右前四个小组的频率分别为0.04、0.12、0.4、0.28.根据已知条件填空或画图:

  

(1)第四小组频数为   ;

  

(2)第五小组频率为   ;

  (3)在这次测试中,跳绳次数的中位数落在第   小组中;

  (4)补全频率分布直方图.

图14-8

  6.(山西省)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图如下.已知从左到右各长方形的高的比为

2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:

  

(1)本次活动共有多少件作品参加评比?

  

(2)哪组上交的作品数量最多?

有多少件?

  (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?

图14-9

  7.(上海市)小李通过对某地区域1998年至2000年快餐公司发展情况的调查,制成了该地区快餐公司个数情况的条形图(如图14-10图2)和快餐公司盒饭年销量的平均数情况条形图(如图14-10图3).利用图14-10图2、

图14-10图3共同提供的信息.

  解答下列问题:

  

(1)1999年该地区销售盒饭共  万盒.

  

(2)该地区盒饭销量最大的年份是  年,这一年的年销量是  万盒.

  (3)这三年中该地区每年平均销售盒饭多少万盒?

图14-10

  答案:

  1、D  2、45

  3、

  (1)6,0.25(见表)

  (2)样本数据中,男生身高的众数是173厘米.

  (3)∵男学生身高在171.5~176.5厘米范围内的人数是6人,频率是0.30,

  ∴300×0.30=90(人)

  答:

300名男学生中,身高在171.5~176.5厘米范围内的人数为90人.

  4、解:

根据题意,随机抽取的30天中,空气质量达到良以上的是:

  3+5+10=18(天)

  随机抽取的30天中,空气质量达到良以上的天数所占比例是:

  

=0.6

  估计全年365天中空气质量达到良以上的天数为:

  365×0.6=219(天).

  5、

(1)4  (2)0.16  (3)三.  (4)略.

  6、解:

(1)

=

=

  12÷

=60(件).

  答:

本次活动共有60件作品参加评比.

  

(2)60×

=18(件)

  答:

第四组上交的作品数量最多,有18件. 

  (3)第四姐获奖率为

=

,第六组获奖率为

=

  答:

第六组获奖率较高.

  7、

(1)118

  

(2)2000,120

  (3)解:

=

=96(万盒)

  这三年中,该地区每年平均销售盒饭96万盒.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2