统计函数的统计分析功能doc.docx
《统计函数的统计分析功能doc.docx》由会员分享,可在线阅读,更多相关《统计函数的统计分析功能doc.docx(12页珍藏版)》请在冰点文库上搜索。
![统计函数的统计分析功能doc.docx](https://file1.bingdoc.com/fileroot1/2023-5/15/f237d3cf-20b9-4303-9c07-9be9260061ac/f237d3cf-20b9-4303-9c07-9be9260061ac1.gif)
统计函数的统计分析功能doc
统计函数的统计分析功能
EXCEL中提供了78个统计函数用于•这些统计函数的统计分析功能包括:
(1)频数分布处理
频数分布处理:
FREQUENCY
(2)描述统计量计算
%1集中趋势计算
算术平均数:
AVERAGE,AVERAGEA
几何平均数:
GEOMEAN
调和平均数:
HARMEAN
中位数:
MEDIAN
众数:
MODE
四分位数:
QUARTILE
K百分比数值点:
PERCENTILE
内部平均值:
TRIMMEAN
%1离散程度计算
平均差:
AVEDEV
样本标准差:
STDEVA,STDEV
总体的标准偏差:
STDEVP,STDEVPA
样本方差:
VAR,VARA
总体方差:
VARP,VARPA
样本偏差平方和:
DEVSQ
%1数据分布形状测度计算
偏斜度:
SKEW
峰度:
KURT
标准化{ilz:
STANDARDIZE
%1数值计算
计数:
COUNT,COUNTA
极值:
MAX,MAXA,MTN,MTNA,LARGE,SMALL
排序:
RANK,PERCENTRANK
(3)概率计算
%1离散分布概率计算
排列:
PERMUT
概率之和:
PROB
二项分布:
BINOMDIST,CRITBINOM,NEGBINOMDIS
超几何分布:
HYPGEOMDIST
泊松分布:
POISSON
%1连续变量概率计算
正态分布:
NORMDTST,NORMTNV
标准止态分布:
NORMSDIST,NORMSINV
对数正态分布:
LOGINV,LOGNORMDIST
卡方分布:
CHIDIST,CHIINV
t分布:
TDIST,TINV
F分布:
FDTST,FTNV
B概率分布:
BETADIST,BETAINV
指数分布:
EXPOND1ST
韦伯分布:
WEIBULL
r分布:
GAWADIST,GAWAINV,GAMMALN,GAMMALN
(4)参数估计
均值极限误差计算:
CONFIDENCE
(5)假设检验
方差假设检验:
FTEST
均值假设检验:
TTEST,ZTEST
(6)卡方检验
拟合优度和独立性检验:
CHITEST
(7)相关,回归分析
相关分析:
COVAR,CORREL,PEARSON,FISHER,FISHERINV
线性冋归分析:
FORECAST,RSQ,LINEST,INTERCEPT,SLOPE,STEYX,TREND
曲线回归:
LOGEST,GROWTH
EXCEL统计数据分析函数简介
[大][中][小]发布人:
圣才学习网发布日期:
2013-08-1518:
20共444人浏览
在介绍统计函数乙前,请大家先看一下附表中的函数名称。
是不是发现有些函数是很类似的,只是在名称中多了一个字母A?
比如,AVERAGE与AVERAGEA:
COUNT与COUNTA。
基本上,名称屮带A的函数在统计时不仅统计数字,而且文本和逻辑值(如TRUE和FALSE)也将计算在内。
一、用于求平均值的统计函数AVERAGE、TRIMMEAN
1、求参数的算术平均值函数AVERAGE
语法形式为AVERAGE(numberl,number2,...)
其中Numberl,number2,...为要计算平均值的1〜30个参数。
这些参数可以是数字,或者是涉及数字的名称、数组或引用。
如果数组或单元格引用参数屮有文字、逻辑值或空单元格,则忽略其值。
但是,如果单元格包含零值则计算在内。
2、求数据集的内部平均值TRIMMEAN
函数TRIMMEAN先从数据集的头部和尾部除去一定百分比的数据点,然后再求平均值。
当希望在分析中剔除一部分数据的计算时,可以使用此函数。
比如,我们在计算选手平均分数中常用去掉一个最高分,去掉一个最低分,XX号选手的最后得分,就可以使用该函数來计算。
语法形式为TRIMMEAN(array,percent)
其中Array为需要进行筛选并求平均值的数组或数据区域。
Percent为计算时所要除去的数据点的比例,例如,如果percent=0.2,在20个数据点的集合中,就耍除去4个数据点(20x0.2),头部除去2个,尾部除去2个。
函数TRIMMEAN将除去的数据点数日向下舍为最接近的2的倍数。
3、举例说明:
示例屮也列举了带A的函数AVERAGEA的求解方法。
求选手Annie的参赛分数。
在这里,我们先假定已经将该选手的分数进彳亍了从高到底的排序,在后面的介绍屮我们将详细了解排序的方法。
A
B
c
1
1
选手Annie的参赛分数
2
编号
评委
分数
3
1
评委為
9.98
4
2
评委B
9.65
5
3
评委C
9.55
6
4
评委D
9.50
7
5
评委E
9.40
8
6
评委F
9.35
9
7
评委G
评分无效
10
8
评委H
9.30
11
9
评委I
9.10
12
10
评委J
8.60
13
AVERAGE
AVERAGE(C3:
C12)
9.38
14
AVERAGEA
AVERAGEA(C3:
C12)
8.44
15
TRIMMEAN
TRIMMEAN(C3:
C12,0.4)
9.41
图1
二、用于求单元格个数的统计函数COUNT
语法形式为COUNT(valuel,value2,・・・)
其中Valuel,value2,...为包含或引用各种类型数据的参数(1〜30个),但只有数字类型的数据才被计数。
函数COUNT在计数时,将把数字、空值、逻辑值、H期或以文字代表的数计算进去;但是错误值或其他无法转化成数字的文字则被忽略。
如果参数是一个数组或引用,那么只统计数组或引用屮的数字;数组屮或引用的空单元格、逻辑值、文字或错误值都将忽略。
如果要统计逻辑值、文字或错谋值,应当使用函数COUNTAo举例说明COUNT函数的用途,示例中也列举了带A的函数COUNTA的用途。
仍以上例为例,要计算一共有多少评委参与评分(用函数COUNTA),以及有儿个评委给出了有效分数(用函数COUNT)。
选手Amrie的参赛分数
编号
评委
分数
备注
1
评委血
9.98
2
评委E
9.65
3
评委C
9.55
4
评委D
9.50
5
评委E
9.40
6
评委F
9.35
7
评委G
FALSE
指评分无效
8
评委H
9.30
9
评委I
9.10
10
评委J
8.60
COUNT
COUNT(C3:
C12)
9
求有效分数的个数
|COUNTA
COUNTA(P3:
C1?
)
10
求讦娶訊3
图2
三、求区域中数据的频率分布FREQUENCY
山于函数FREQUENCY返冋一个数组,必须以数组公式的形式输入。
语法形式为FREQUENCY(dataarray,binsarray)
蔑中Data.array为一数组或对一组数值的引用,用來计算频率。
如果data.array«|'不包含任何数值,函数FREQUENCY返冋零数组。
Bins_array为一数组或对数组区域的引用,设定对data_array进行频率计算的分段点。
如果bins_array中不包含任何数值,函数FREQUENCY返冋data.array元素的数目。
看起來FREQUENC丫的用法蛮复杂的,但其用处很大。
比如可以计算不同工资段的人员分布,公司员工的年龄分布,学生成绩的分布情况等。
这里以具体示例说明其基本的用法。
以计算某公司的员工年龄分布情况为例说明。
在工作表里列出了员工的年龄。
这些年龄为28、25、31、21、44、33、22和35,并分别输入到单元格C4:
C11□这一列年龄就是data_array□Bins_array是另一列用來对年龄分组的区间值。
在本例中,bins_array是指C13:
C16单元格,分别含有值25、30、35、和40。
以数组形式输入函数FREQUENCY,就可以计算出年龄在25岁以下、26〜30岁、31〜35岁、36〜40岁和40岁以上各区间中的数本例屮选择了5个垂直相邻的单元格后,即以数组公式输入下面的公式。
返冋的数组中的元索个数比bins’gy(数组)屮的元素个数多1。
第五个数字1表示大于最高间隔(40)的数值(44)的个数。
函数FREQUENCY忽略空白单元格和文本值。
{=FREQUENCYC11,C13:
C16)}等于{2;2;2;1;1}
A
B
c
1
大连XX公司员工年龄分布昔况统计表
2
3
员工姓名
岀生日期
年龄
4
Annie
1972年10月25日
28
5
Jacky
1974年12月25日
26
|6
Michael
1970年5月25日
31
7
Hewy
1980年3月12日
21
8
David
1956年12月31日
44
9
Rebecca
1968年7月8日
33
|10
Luxia
1979年8月25日
22
|11
Brade
1964年1月5日
37
112
13
25岁以下
2
25
14
26®岁
2
30
15
31-35岁
2
35
16
36-40#
1
40
17
40岁以上
1
18
19
公式写法:
{=FREQUENCY(C4:
C11.C13C;6)}
20
图3
四、一组用于求数据集的满足不同要求的数值的函数
1、求数据集的最人值MAX与最小值MlN
这两个函数MAX、MIN就是用來求解数据集的极值(即最大值、最小值)。
函数的用法非常简单。
语法形式为函数(numbeiM,number2,...),其中Numberl,number2,...为需要找出最大数值的1到30个数值。
如果要计算数组或引用屮的空白单元格、逻输值或文本将被忽略。
因此如果逻输值和文本不能忽略,请使用带A的函数MAXA或者MINA來代替。
2、求数据集中第K个最大值LARGE与第k个最小值SMALL
这两个函数LARGE、SMALL与MAX、MIN非常想像,区别在于它们返冋的不是极值,而是笫K个值。
语法形式为:
函数(array,k),其'I'Array为需耍找到第k个最小值的数组或数字型数据区域。
K为返冋的数据在数纽或数据区域里的位置(如果是LARGE为从大到小排,若为SMALL函数则从小到大排)。
说到这,大家可以想得到吧。
如果K=1或者K=n(假定数据集中有n个数据)的时候,是不是就可以返冋数据集的最大值或者最小值了呢。
3、求数据集屮的屮位数MEDIAN
MEDIAN函数返冋给定数值集合的屮位数。
所谓中位数是指在一组数据屮居于中间的数,换句话说,在这组数据中,有一半的数据比它大,有一半的数据比它小。
语法形式为MEDIAN(number1,number2,...)其中Numberl,number2,...是需要找出中位数的1到30个数字参数。
如果数组或引用参数中包含有文字、逻辑:
值或空白单元榕,则忽略这些值,但是其值为零的单元格会计算在内。
需要注意的是,如果参数集合中包含有偶数个数字,函数MEDIAN将返回位于屮间的两个数的平均值。
4、求数据集中出现频率最多的数MODE
MODE函数用來返冋在某一数组或数据区域中出现频率最多的数值。
跟MEDIAN一样,MODE也是一个位置测id函数。
语法形式为MODE(numbe门,number2,...)其中Numberl,number2,...是用于众数(众数指在一组数值屮出现频率最高的数值)计算的1到30个参数,也可以使用单一数组(即对数组区域的引用)來代替山逗号分隔的参数。
5、以上函数的示例
以某单位年终奖金分配表为例说明。
在示例中,我们将利用这些函数求解该单位年终奖金分配屮的最高金额、最低金额、平均金额、中间金额、众数金额以及第二高金额等。
详细的公式写法可从图中淸楚的看出,在此不再赘述。
A
B
C
D
E
「1
大连XXX公司2000年年终奖金分配表
2
編号
部门
职位
员工姓名
年终奖金额
|3
A001
业务部
经理
Annie
¥50,000
4
A002
业务部
副经理
Jacky
¥35,000
|5
A003
业务部
职员
Henry
¥18,000
|6
A004
业务部
职员
Michael
¥15,000
7
A005
管理部
经理
David
¥35,000
|8
A006
管理部
职员
Rebecca
¥20,000
9
A007
管理部
职员
Linda
¥15,000
|10
A008
技术部
经理
Ben
¥40,000
11
A009
技术部
职员
Lucky
¥15,000
|12
A010
技术部
职员
Mary
¥18,000
13
A011
后勤
职员
John
¥6,000
14
A012
后勤
职员
Mike
¥8,000
15
盘高奖金额
¥50,000
MAX(E3:
E14)
16
盘高奖金额算法二
¥50,000
LARGEE14,1)
17
盘低奖金额
¥6,000
MIN(E3:
E14)
L
18
第二高奖金赖
¥40,000
LARGE:
E3:
E14,2)
19
平均奖金赖
¥22,917
AVERAGE(E3:
E14)
20
中间金额
¥18,000
MEDIAN(E3:
E14)
21
众数金额
¥15,000
MODE(E3:
E14)
22
92
图4
五、用来排位的函数RANK、PERCENTRANK
1、一个数值在一组数值中的排位的函数RANK
数值的排位是与数据淸单屮其他数值的相対大小,当然如果数据清单已经排过序了,则数值的排位就是它当前的位置。
数据淸单的排序可以使用Excel提供的排序功能完成。
语法形式为RANK(number,ref,order)其中Number为需要找到排位的数字:
Ref为包含一纽数字的数纽或引用。
Order为一数字用來指明排位的方式。
如果order为0或省略,则Excel将ref当作按降序排列的数据清单进行排位。
如果order不为零,MicrosoftExcel将ref当作按升序排列的数据清单进行排位。
需要说明的是,函数RANK对重复数的排位相同。
但重复数的存在将影响后续数值的排位。
嗯,这就好像并列第儿的概念啊。
例如,在一列整数里,如果整数10出现两次,其排位为5,则11的排位为7(没有排位为6的数值)。
2、求特定数值在一个数据集中的百分比排位的函数PERCENTRANK
此PERCENTRANK函数可用于查看特定数据在数据集中所处的位置。
例如,可以使用函数PERCENTRANK计算某个特定的能力测试得分在所有的能力测试得分中的位置。
语法形式为PERCENTRANK(array,x,significance)其'|«Array为彼此间相对位置确定的数字数组或数字区域。
X为数组中需要得到其排位的值。
Significance为可选项,表示返冋的百分数值的有效位数。
如果省略,函数PERCENTRANK保留3位小数。
3.与排名有关的示例
仍以某单位的年终奖金分配为例说明,这里以员工Annie的排名为例说明公式的写法。
奖金排名的公式写法为:
=RANK(C3,$C$3:
$C$12)
百分比排名的公式写法为:
=PERCENTRANK($C$3:
$C$12,C3)
A
B
I.c
D
E」
|1
大连XXX公司2000年年纬奖金分配表
2
0-w*Q
E1
年终奖金姦
奖金排名
百另比徘名
3
A001
Annie
¥50,000
i
1
4
A002
Jacky
¥35,000
3
0.666
5
A003
Heruy
¥18,000
6
0.333
16
A004
Michael
¥15,000
8
0222
17
A005
David
¥35,000
3
0666
8
A006
Rebecca
¥20,000
5
0555
9
A007
Lindt
¥14#000
9
0.Ill
R10
Ben
*40,000
2
0888
111
A009
Lucky
¥12,000
10
0
12
A010
Mary
¥18,000
6
0.33
作者:
不详來源:
网络