统计学名词解释Word格式文档下载.docx

资源描述

统计学名词解释Word格式文档下载.docx

《统计学名词解释Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《统计学名词解释Word格式文档下载.docx（28页珍藏版）》请在冰点文库上搜索。

统计学名词解释Word格式文档下载.docx

根据总体分布特征而计算的总体统计指标。

统计量（statistic）：

由总体中随机抽取样本而计算的相应样本指标。

频数表（frequencytable）：

将各变量值及其相应的频数列出表格形式，用来表示一批数据各观察值出现的频繁程度。

算术均数（arithmeticmean）：

描述一组数据在数量上的平均水平。

总体均数用μ表示，样本均数用

表示。

几何均数（geometricmean）：

描述对数正态分布或数据呈倍数变化资料的水平，记为G.

中位数（median），将一组观察值由小到大排列，n为奇数时取位次居中的变量值，为偶数时，取位次居中的两个变量的平均值。

极差（range）：

又称全距，为最大值与最小值之差，用于资料的粗略分析，计算简便但稳定性较差。

符号R.

百分位数（percentile）：

将n个观察值从小到大依次排列，再把它们的位次转化为百分位。

四分位数间距（interquarnlerange）：

表示百分位数P75和百分位数P25之差，定义为Q=P75-P25.。

方差（variance）：

表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

标准差（standarddeviation）：

是描述反映正态分布计量资料离散程度的指标。

是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大小样本均可，最为常用。

变异系数（coefficientofvariation）：

用于量纲不同和变量间或均数相差较大的变量间变异程度的比较，其计算公式为：

CV=

正态曲线（normalcurve）是函数f（X）=

对应的曲线，此曲线是一条高峰位于中央，两侧逐渐下降并完全对称，曲线两端永远不与横轴相交的钟形曲线。

正态分布（normaldistribution）：

若指标X的频率曲线对应于正态曲线，则称该指标服从正态分布，通常用记号N（μ,σ2）表示均数为标准差为的正态分布。

标准正态分布（standardnormaldistribution）：

均数为0标准差为1的正态分布为标准正态分布，记为N（0,1）.

标准化转换（standardizedtransformation）：

若随机变量X服从正态分布N（μ,σ2），经过标准化转换Z=

就服从标准正态分布。

统计推断（statisticalinference）：

通过样本指标来说明总体特征，这种从样本获取有关总体信息的过程为统计推断。

抽样误差（samplingerror）：

由个体差异产生，由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差，无倾向性，不可避免。

均数的标准误（standarderrorofmeanSEM）：

用于表示均数抽样误差的指标，反映样本均数之间的离散程度和样本均数抽样误差的大小。

可信区间（confidenceintervalCI）：

为按预先给定的概率确定的包含未知总体参数的可能范围，含义是包含总体参数的可能性是1-a。

自由度：

n个变量中，可自由取值的变量的个数。

参数估计：

用样本指标（统计量）估计总体指标（参数），有点估计和区间估计两种。

假设检验中P的含义：

指从H0规定的总体随机抽得的等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。

I类错误：

拒绝了实际上成立的H0这类弃真的错误称为I类错误，概率大小用alfa表示。

II类错误：

接受了实际上不成立的H0这类存伪的错误称为II类错误，概率大小用β表示。

检验效能：

是指当两总体确有差别，按规定的检验水准所能发现该差异的能力。

数值表示：

1-β

检验水准：

是预先规定的，当假设检验结果拒绝H0接受H1下有差别的结论时犯错误的概率称为检验水准，记为α

均方：

有离均差平方和被自由度相除而得。

方差分析：

根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个或某几个因素的作用加以解释，通过各变异来源地均方与误差均方比值的大小，借助F分布做出统计推断，判断各因素对观测指标有无影响。

总变异：

样本中全部实验单位差异称为总变异，其大小可用全部观察值的均方表示。

组间变异：

各处理组间观察值大小不等，这种变异称为组间变异，可用组间均方表示。

组内变异：

各处理组内部观察值大小不等，这种变异称为组内变异，可用组内均方表示。

完全随机设计：

只考虑一个处理因素，将全部受试对象随机分配到各处理组，然后观察实验效应。

随机区组设计：

事先将全部受试对象按自然属性分为若干区组，原则是各区组内的受试对象的特征相同或相近，且受试对象数与处理因素的水平相等，然后将每个区组内的观察对象随机地分配到各处理组。

相对数：

是两个有联系的指标之比，是分类变量常用的描述性统计指标，常用相对数有“率，构成比，比”等。

率：

频率指标，说明一定时期内某现象发生的频率或强度，计算公式为发生某现象的观察单位数除以可能发生某现象的观察总体值*100%表示方式有百分率%，千分率。

构成比：

构成指标。

说明某一事物内部的各组成部分所占的比重或分布，计算公式为：

某一组分的观察单位数除以同一事物各组分的观察单位总数*100%，表示方法有百分数等。

比相对比。

是AB两个有关指标之比，说明A是B的若干倍或百分之几，计算公式为比等于

。

标准化法：

常用于内部构成不同的两个或多个率比较的一种方法，基本思想是指定一个统计标准，按指定标准计算调制率，使之具备可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。

定基比：

统一用某个时间的指标作为基数，其它各时间的指标与之相比。

环比：

以前一个时间的指标作基数，以相邻的后一个时间的指标与之相比。

平均增长速度：

用于概括某一时期的平均速度变化，即该时期环比的几何均数减1。

计算公式为平均增长速度=平均发展速度-1=

粗死亡率（crudedeathrateCDR）：

或死亡率（mortalityrate），指某地某年平均每千人口中的死亡数，它反映居民总的死亡水平。

发病率（incidencerateIR）：

表示一定时期内，可能发生某病的一定人群中新发生某病的强度。

患病率（prevalenceratePR）：

又称现患率，指某时刻点上受检人群中现患某种疾病的频率，通常用于描述病程较长或发病时间不明确的疾病的患病情况。

动态数列（dynamicseries）按一定的时间顺序，将一系列描述事物的统计指标依次排列起来，就可以观察和比较该事物在时间上的变化和发展趋势。

标化死亡率（standardizedmortalityrateSMR）:

寻找一个统一的分布作为标准组，然后每个比较组均按照该分布标准计算相应的死亡率，所得到的死亡率是相对于标准组的，故称为标化死亡率，由于采取了统一的标准，消除了内部分布不同对总死亡率的影响，使算得的标化死亡率具有可比性。

二项分布（Binomialdistribution）：

如果每一次实验只有阳性或阴性两种可能的结果，每次实验阳性结果的发生概率均为π，阴性结果均为1-π，每次实验结果是相互独立的，那么重复n次实验，发生阳性结果次数X的概率分布称为二项分布。

拟合优度：

指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

非参数统计：

不依赖于总体分布类型，也不对总体参数进行统计推断的假设检验。

参数统计：

通常要求样本来自总体分布型是已知的，在这种假设的基础上，对总体参数进行估计和检验。

秩次：

变量值按从小到大顺序所编的秩序号。

秩和：

各组秩次的合计称为秩和，是非参数检验的基本统计量。

直线回归：

建立一个描述应变量依自变量而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。

回归系数：

即直线的斜率，直线回归方程中用b表示，其统计意义为X每增减一个单位，Y平均改变b个单位。

直线相关：

用于双变量正态分布资料，有正相关，负相关和零相关等关系。

零相关表示两变量之间美欧直线相关系数。