统计函数的统计分析功能doc.docx

资源描述

统计函数的统计分析功能doc.docx

《统计函数的统计分析功能doc.docx》由会员分享，可在线阅读，更多相关《统计函数的统计分析功能doc.docx（12页珍藏版）》请在冰点文库上搜索。

统计函数的统计分析功能doc.docx

统计函数的统计分析功能doc

统计函数的统计分析功能

EXCEL中提供了78个统计函数用于•这些统计函数的统计分析功能包括:

（1）频数分布处理

频数分布处理:

FREQUENCY

（2）描述统计量计算

%1集中趋势计算

算术平均数:

AVERAGE,AVERAGEA

几何平均数:

GEOMEAN

调和平均数:

HARMEAN

中位数:

MEDIAN

众数:

MODE

四分位数:

QUARTILE

K百分比数值点:

PERCENTILE

内部平均值:

TRIMMEAN

%1离散程度计算

平均差:

AVEDEV

样本标准差:

STDEVA,STDEV

总体的标准偏差:

STDEVP,STDEVPA

样本方差:

VAR,VARA

总体方差:

VARP,VARPA

样本偏差平方和:

DEVSQ

%1数据分布形状测度计算

偏斜度:

SKEW

峰度:

KURT

标准化｛ilz:

STANDARDIZE

%1数值计算

计数:

COUNT,COUNTA

极值:

MAX,MAXA,MTN,MTNA,LARGE,SMALL

排序:

RANK,PERCENTRANK

（3）概率计算

%1离散分布概率计算

排列:

PERMUT

概率之和:

PROB

二项分布:

BINOMDIST,CRITBINOM,NEGBINOMDIS

超几何分布:

HYPGEOMDIST

泊松分布:

POISSON

%1连续变量概率计算

正态分布:

NORMDTST,NORMTNV

标准止态分布：

NORMSDIST,NORMSINV

对数正态分布:

LOGINV,LOGNORMDIST

卡方分布:

CHIDIST,CHIINV

t分布:

TDIST,TINV

F分布:

FDTST,FTNV

B概率分布:

BETADIST,BETAINV

指数分布:

EXPOND1ST

韦伯分布:

WEIBULL

r分布:

GAWADIST,GAWAINV,GAMMALN,GAMMALN

（4）参数估计

均值极限误差计算:

CONFIDENCE

（5）假设检验

方差假设检验:

FTEST

均值假设检验:

TTEST,ZTEST

（6）卡方检验

拟合优度和独立性检验:

CHITEST

（7）相关，回归分析

相关分析:

COVAR,CORREL,PEARSON,FISHER,FISHERINV

线性冋归分析:

FORECAST,RSQ,LINEST,INTERCEPT,SLOPE,STEYX,TREND

曲线回归:

LOGEST,GROWTH

EXCEL统计数据分析函数简介

［大］［中］［小］发布人：

圣才学习网发布日期:

2013-08-1518:

20共444人浏览

在介绍统计函数乙前，请大家先看一下附表中的函数名称。

是不是发现有些函数是很类似的，只是在名称中多了一个字母A?

比如，AVERAGE与AVERAGEA：

COUNT与COUNTA。

基本上，名称屮带A的函数在统计时不仅统计数字，而且文本和逻辑值（如TRUE和FALSE）也将计算在内。

一、用于求平均值的统计函数AVERAGE、TRIMMEAN

1、求参数的算术平均值函数AVERAGE

语法形式为AVERAGE（numberl,number2,...）

其中Numberl,number2,...为要计算平均值的1〜30个参数。

这些参数可以是数字，或者是涉及数字的名称、数组或引用。

如果数组或单元格引用参数屮有文字、逻辑值或空单元格，则忽略其值。

但是,如果单元格包含零值则计算在内。

2、求数据集的内部平均值TRIMMEAN

函数TRIMMEAN先从数据集的头部和尾部除去一定百分比的数据点,然后再求平均值。

当希望在分析中剔除一部分数据的计算时，可以使用此函数。

比如，我们在计算选手平均分数中常用去掉一个最高分，去掉一个最低分，XX号选手的最后得分，就可以使用该函数來计算。

语法形式为TRIMMEAN（array,percent）

其中Array为需要进行筛选并求平均值的数组或数据区域。

Percent为计算时所要除去的数据点的比例,例如，如果percent=0.2，在20个数据点的集合中，就耍除去4个数据点（20x0.2）,头部除去2个，尾部除去2个。

函数TRIMMEAN将除去的数据点数日向下舍为最接近的2的倍数。

3、举例说明：

示例屮也列举了带A的函数AVERAGEA的求解方法。

求选手Annie的参赛分数。

在这里，我们先假定已经将该选手的分数进彳亍了从高到底的排序，在后面的介绍屮我们将详细了解排序的方法。

选手Annie的参赛分数

编号

评委

分数

评委為

9.98

评委B

9.65

评委C

9.55

评委D

9.50

评委E

9.40

评委F

9.35

评委G

评分无效

评委H

9.30

评委I

9.10

评委J

8.60

AVERAGE

AVERAGE（C3:

C12）

9.38

AVERAGEA

AVERAGEA（C3:

C12）

8.44

TRIMMEAN

TRIMMEAN（C3:

C12,0.4）

9.41

图1

二、用于求单元格个数的统计函数COUNT

语法形式为COUNT（valuel,value2,・・・）

其中Valuel,value2,...为包含或引用各种类型数据的参数（1〜30个），但只有数字类型的数据才被计数。

函数COUNT在计数时，将把数字、空值、逻辑值、H期或以文字代表的数计算进去；但是错误值或其他无法转化成数字的文字则被忽略。

如果参数是一个数组或引用，那么只统计数组或引用屮的数字;数组屮或引用的空单元格、逻辑值、文字或错误值都将忽略。

如果要统计逻辑值、文字或错谋值，应当使用函数COUNTAo举例说明COUNT函数的用途，示例中也列举了带A的函数COUNTA的用途。

仍以上例为例,要计算一共有多少评委参与评分（用函数COUNTA）,以及有儿个评委给出了有效分数（用函数COUNT）。

选手Amrie的参赛分数

编号

评委

分数

备注

评委血

9.98

评委E

9.65

评委C

9.55

评委D

9.50

评委E

9.40

评委F

9.35

评委G

FALSE

指评分无效

评委H

9.30

评委I

9.10

评委J

8.60

COUNT

COUNT（C3:

C12）

求有效分数的个数

|COUNTA

COUNTA（P3:

C1?

）

求讦娶訊3

图2

三、求区域中数据的频率分布FREQUENCY

山于函数FREQUENCY返冋一个数组，必须以数组公式的形式输入。

语法形式为FREQUENCY（dataarray,binsarray）

蔑中Data.array为一数组或对一组数值的引用，用來计算频率。

如果data.array«|'不包含任何数值,函数FREQUENCY返冋零数组。

Bins_array为一数组或对数组区域的引用，设定对data_array进行频率计算的分段点。

如果bins_array中不包含任何数值，函数FREQUENCY返冋data.array元素的数目。

看起來FREQUENC丫的用法蛮复杂的，但其用处很大。

比如可以计算不同工资段的人员分布，公司员工的年龄分布,学生成绩的分布情况等。

这里以具体示例说明其基本的用法。

以计算某公司的员工年龄分布情况为例说明。

在工作表里列出了员工的年龄。

这些年龄为28、25、31、21、44、33、22和35,并分别输入到单元格C4：

C11□这一列年龄就是data_array□Bins_array是另一列用來对年龄分组的区间值。

在本例中，bins_array是指C13：

C16单元格，分别含有值25、30、35、和40。

以数组形式输入函数FREQUENCY,就可以计算出年龄在25岁以下、26〜30岁、31〜35岁、36〜40岁和40岁以上各区间中的数本例屮选择了5个垂直相邻的单元格后，即以数组公式输入下面的公式。

返冋的数组中的元索个数比bins’gy（数组）屮的元素个数多1。

第五个数字1表示大于最高间隔（40）的数值（44）的个数。

函数FREQUENCY忽略空白单元格和文本值。

｛=FREQUENCY

C11,C13：

C16）｝等于｛2；2；2；1；1｝

大连XX公司员工年龄分布昔况统计表

员工姓名

岀生日期

年龄

Annie

1972年10月25日

Jacky

1974年12月25日

Michael

1970年5月25日

Hewy

1980年3月12日

David

1956年12月31日

Rebecca

1968年7月8日

|10

Luxia

1979年8月25日

|11

Brade

1964年1月5日

112

25岁以下

26®岁

31-35岁

36-40#

40岁以上

公式写法：

{=FREQUENCY（C4:

C11.C13C；6）}

图3

四、一组用于求数据集的满足不同要求的数值的函数

1、求数据集的最人值MAX与最小值MlN

这两个函数MAX、MIN就是用來求解数据集的极值（即最大值、最小值）。

函数的用法非常简单。

语法形式为函数（numbeiM,number2,...）,其中Numberl,number2,...为需要找出最大数值的1到30个数值。

如果要计算数组或引用屮的空白单元格、逻输值或文本将被忽略。

因此如果逻输值和文本不能忽略，请使用带A的函数MAXA或者MINA來代替。

2、求数据集中第K个最大值LARGE与第k个最小值SMALL

这两个函数LARGE、SMALL与MAX、MIN非常想像，区别在于它们返冋的不是极值，而是笫K个值。

语法形式为：

函数（array,k）,其'I'Array为需耍找到第k个最小值的数组或数字型数据区域。

K为返冋的数据在数纽或数据区域里的位置（如果是LARGE为从大到小排，若为SMALL函数则从小到大排）。

说到这，大家可以想得到吧。

如果K=1或者K=n（假定数据集中有n个数据）的时候，是不是就可以返冋数据集的最大值或者最小值了呢。

3、求数据集屮的屮位数MEDIAN

MEDIAN函数返冋给定数值集合的屮位数。

所谓中位数是指在一组数据屮居于中间的数，换句话说，在这组数据中，有一半的数据比它大，有一半的数据比它小。

语法形式为MEDIAN（number1,number2,...）其中Numberl,number2,...是需要找出中位数的1到30个数字参数。

如果数组或引用参数中包含有文字、逻辑:

值或空白单元榕，则忽略这些值，但是其值为零的单元格会计算在内。

需要注意的是，如果参数集合中包含有偶数个数字，函数MEDIAN将返回位于屮间的两个数的平均值。

4、求数据集中出现频率最多的数MODE

MODE函数用來返冋在某一数组或数据区域中出现频率最多的数值。

跟MEDIAN一样，MODE也是一个位置测id函数。

语法形式为MODE（numbe门，number2,...）其中Numberl,number2,...是用于众数（众数指在一组数值屮出现频率最高的数值）计算的1到30个参数，也可以使用单一数组（即对数组区域的引用）來代替山逗号分隔的参数。

5、以上函数的示例

以某单位年终奖金分配表为例说明。

在示例中，我们将利用这些函数求解该单位年终奖金分配屮的最高金额、最低金额、平均金额、中间金额、众数金额以及第二高金额等。

详细的公式写法可从图中淸楚的看出，在此不再赘述。

「1

大连XXX公司2000年年终奖金分配表

編号

部门

职位

员工姓名

年终奖金额

A001

业务部

经理

Annie

¥50,000

A002

业务部

副经理

Jacky

¥35,000

A003

业务部

职员

Henry

¥18,000

A004

业务部

职员

Michael

¥15,000

A005

管理部

经理

David

¥35,000

A006

管理部

职员

Rebecca

¥20,000

A007

管理部

职员

Linda

¥15,000

|10

A008

技术部

经理

Ben

¥40,000

A009

技术部

职员

Lucky

¥15,000

|12

A010

技术部

职员

Mary

¥18,000

A011

后勤

职员

John

¥6,000

A012

后勤

职员

Mike

¥8,000

盘高奖金额

¥50,000

MAX（E3:

E14）

盘高奖金额算法二

¥50,000

LARGE

E14,1）

盘低奖金额

¥6,000

MIN（E3:

E14）

第二高奖金赖

¥40,000

LARGE：

E3:

E14,2）

平均奖金赖

¥22,917

AVERAGE（E3:

E14）

中间金额

¥18,000

MEDIAN（E3:

E14）

众数金额

¥15,000

MODE（E3:

E14）

图4

五、用来排位的函数RANK、PERCENTRANK

1、一个数值在一组数值中的排位的函数RANK

数值的排位是与数据淸单屮其他数值的相対大小，当然如果数据清单已经排过序了，则数值的排位就是它当前的位置。

数据淸单的排序可以使用Excel提供的排序功能完成。

语法形式为RANK（number,ref,order）其中Number为需要找到排位的数字：

Ref为包含一纽数字的数纽或引用。

Order为一数字用來指明排位的方式。

如果order为0或省略，则Excel将ref当作按降序排列的数据清单进行排位。

如果order不为零，MicrosoftExcel将ref当作按升序排列的数据清单进行排位。

需要说明的是，函数RANK对重复数的排位相同。

但重复数的存在将影响后续数值的排位。

嗯，这就好像并列第儿的概念啊。

例如，在一列整数里，如果整数10出现两次，其排位为5,则11的排位为7（没有排位为6的数值）。

2、求特定数值在一个数据集中的百分比排位的函数PERCENTRANK

此PERCENTRANK函数可用于查看特定数据在数据集中所处的位置。

例如，可以使用函数PERCENTRANK计算某个特定的能力测试得分在所有的能力测试得分中的位置。

语法形式为PERCENTRANK（array,x,significance）其'|«Array为彼此间相对位置确定的数字数组或数字区域。

X为数组中需要得到其排位的值。

Significance为可选项，表示返冋的百分数值的有效位数。

如果省略，函数PERCENTRANK保留3位小数。

3.与排名有关的示例

仍以某单位的年终奖金分配为例说明，这里以员工Annie的排名为例说明公式的写法。

奖金排名的公式写法为：

=RANK（C3,$C$3：

$C$12）

百分比排名的公式写法为：

=PERCENTRANK（$C$3：

$C$12,C3）

I.c

E」

大连XXX公司2000年年纬奖金分配表

0-w*Q

年终奖金姦

奖金排名

百另比徘名

A001

Annie

¥50,000

A002

Jacky

¥35,000

0.666

A003

Heruy

¥18,000

0.333

A004

Michael

¥15,000

0222

A005

David

¥35,000

0666

A006

Rebecca

¥20,000

0555

A007

Lindt

¥14#000

0.Ill

R10

Ben

*40,000

0888

111

A009

Lucky

¥12,000

A010

Mary

¥18,000

0.33

作者：

不详來源：

网络

展开阅读全文