生物统计学简答题Word下载.docx
《生物统计学简答题Word下载.docx》由会员分享,可在线阅读,更多相关《生物统计学简答题Word下载.docx(8页珍藏版)》请在冰点文库上搜索。
平均数与标准差在统计分析中有何用处?
他们各有哪些特性?
平均数的用处:
①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;
②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:
①离均差之和为零;
②离均差平方和为最小。
标准差的用处:
①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;
②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;
如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;
③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s
内的观测值个数占总个数的%。
标准差的特征:
①表示变量分布的离散程度;
②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;
③估计平均数的标准差;
④进行平均数区间估计和变异数的计算。
5.
什么是正态分布?
什么是标准正太分布?
正态分布曲线有什么特点?
μ和σ对正态分布曲线有何影响?
正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ²
=1的正态分布为标准正态分布。
正态分布具有以下特点:
标准正态分布具有以下特点:
①、正态分布曲线是以平
均数μ为峰值的曲线,当x=μ时,f(x)取最大值;
②、正态分布是以μ
为中心向左右两侧对称的分布③、的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);
④、正态分布曲线完全由参数μ和来决定⑤、正态分布曲线在x=μ±
处各有一个拐点;
⑥、正态分布曲线与x轴所围成的面积必定等于1。
正态分布具有两个参数μ和,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;
决定正态分布曲线的展开程度,越小曲线展开程度越小,曲线越陡,越大曲线展开程度越大,曲线越矮宽。
6.
什么是统计推断?
统计推断有哪两种?
其含义是什么?
统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。
统计推断主要包括参数统计和假设检验两个方面。
假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的那种假设的推断。
参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。
参数估计包括点估计和区间估计
7.
什么是小概率原理?
他在假设检验中有何作用?
小概率原理是指概率很小的事件再一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于或的时间作为小概率事件。
他是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于或,说明无效假设成立,则接受H0,否定HA;
,如果某时间的概率小于或,说明无效假设不成立,则否定H0,接受HA
8.
假设检验中的两类错误是什么?
如何才能少犯两类错误?
在假设检验中如果H。
是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;
如果H。
不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。
为了减少犯两类错误的概率,要做到以下两点:
一是显著水平α的取值不可太高也不可太低,一般取作为小概率比较合适,这样可使得犯两类错误的概率都比较小;
二是尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减少标准误,减少两类错误。
假设检验中的两类错误是取证错误和取伪错误。
为了减少犯两类错误的概率要做到:
①显著水平a的取值不可以太高也不可太低,一般去作为小概率比较合适,这样可以使犯两类错误的概率都比较小;
②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。
9.
什么叫区间估计?
什么叫点估计?
置信度与区间估计什么联系?
区间估计指根据一个样本的观测值给出总体参数的估计范围给出总体参数落在这一区间的概率。
点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。
置信度与区间估计的关系为;
对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。
10.
检验主要有几种用途?
各自用于什么情况下的假设检验?
x2检验主要有三种用途:
一个样本方差的同质性检验,适合性检验和独立性检验。
一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;
独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。
11.
检验的主要步骤有哪些?
什么情况下需进行连续性矫正?
检验的步骤为:
(1)提出无效假设H0:
观测值与理论值的差异由抽样误差引起即观测值=理论值
备择假设HA:
观测值与理论值的差值不等于0,即观测值≠理论值
(2)确定显著水平a.一般可确定为或
(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算出样本的x2。
(4)进行统计推断
12.
什么是方差分析?
方差分析的基本思想是什么?
进行方差分析一般有哪些步骤?
(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。
(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。
(3)方差分析的基本步骤如下:
a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。
b.列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。
c.若F检验显著,对个处理平均数进行多重比较。
13.
什么是多重比较?
多重比较有哪些方法?
多重比较的结果如何表示?
1)多个平均数两两间的相互比较称为多重比较。
(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和q检验法。
(3)多重比较的结果常以标记字母法和梯形法表示。
标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相差显著的则标以字母b。
再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。
然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较。
如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。
这样各平均数间,凡有一个相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。
差异极显著标记方法同上,用大写字母标记。
梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。
差数>
LSD(LSR)说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;
LSD(LSR)说明处理平均数间的差异达到极显著水平,在差数的右上角标上“**”号。
差数<
LSD(LSR),说明差异不显著。
14.
方差分析有哪些基本假定?
(进行方差分析的条件)方差分析的数学模型(类型)与基本原理。
方差分析有3个基本假定,即正态性、可加性和方差同质性。
方差分析有效性是建立在3个基本假定的基础上的
15.
为什么有些数据需经过转换后才能进行方差分析?
数据转换的方式有哪些?
方差分析有效性是建立在3个基本假定的基础上的。
在研究中会出现一些样本,其所来自的总体和方差分析的基本假设相抵触,这些数据在进行方差分析之前必须经过适当的处理即数据转换来测量标尺。
16.
什么叫回归分析?
回归截距和回归系数的统计意义是什么?
回归分析是用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量,表示结果的变量为因变量。
回归截距是当自变量为零时,因变量的取值,即回归线在y轴上的截距;
回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量y平均增加或减少的单位数。
17.
什么叫相关分析?
相关系数和决定系数各具有什么意义?
相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。
相关系数表示变量x与变量y相关的程度和性质,决定系数是相关系数的平方,表示变量x引起y变异的回归平方和和占y变异总平方和的比率,它只能表示相关的程度而不能表示相关的性质。
18.
简述回归和相关的异同。
1.线性相关分析涉及到变量之间的呈线性关系的密切程度,线性回归分析是在变量存在线性相关关系的基础上建立变量之间的线性模型;
2.线性回归分析可以通过回归方程进行控制和预测,而线性相关分析则无法完成;
3.线性相关分析中的变量地位平等,都是随机变量,线性回归分析中的变量有自变量和因变量之分,而自变量一般属确定性变量,因变量是随机变量。
19.
什么叫抽样调查?
常用的抽样调查有哪些基本方法?
是比较其特点及适用对象?
抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并对全部调查研究对象作出估计和推断的一种调查方法。
常用的抽样调查方法有随机抽样,顺序抽样和典型抽样。
随机抽样是指在抽样过程中,总体内所有个体都具有相同的被抽取的概率。
由于抽样的随机性,可以正确的估计试验误差,从而推出科学合理的结论。
随机抽样可分为以下几种方法:
简单随机抽样,分层随机抽样,整体抽样和双重抽样。
⑴简单随机抽样的结果可用统计方进行分析,从而对总体作出推断,并对推断的可靠性作出度量。
适用于个体间差异较小,所需抽取的样本单位数较小的情况。
对于那些具有某种趋向或差异明显和点片式差异的总体不宜使用。
⑵分层随机抽样是一种混合抽样。
其特点是将总体按变异原因或程度划分成若干区层,然后再用简单随机抽样方法,从各区层按一定的抽样分数抽选抽样单位。
分层随机抽样具有以下优点:
①若总体内各抽样单位间的差异比较明显,可以把总体分为几个比较同质的区层,从而提高抽样的准确度;
②分层随机抽样类似于随机区组设计,既运用了随机原来,也运用了局部控制原理,这样不仅可以降低抽样误差,也可以运用统计方法来估算抽样误差。
⑶整体抽样是把总体分成若干群,以群为单位,进行随机抽样,对抽到的样本作全面调查,因此也称为整群抽样。
整体抽样具有以下优点:
①一个群只要一个编号,因而减少了抽样单位编号数,且因调查单位数减少,工作方便;
②与简单随机抽样相比较,它常常提供较为准确的总体估计值,特别是害虫危害作物这类不均匀的研究对象,采用整体抽样更为有利;
③只要各群抽选单位相等,整体抽样也可提供总体平均数的无偏估计。
⑷双重抽样是在抽样调查时要求随机抽出两个样本,涉及两个变量。
双重抽样具有以下两个优点:
①对于复杂性状的调查研究可以通过仅测量少量抽样单位而获得相应于大量抽样单位的精确度;
②当复杂性状必须通过破坏性测定才能调查时,则仅有这种双重抽样方法可用。
顺序抽样是按某种既定顺序从总体中抽取一定数量的个体构成样本。
抽样顺序的优点表现在:
①可避免抽样时受人们主观偏见的影响,而简便易行;
②容易得到一个按比例分配的样本;
③如果样本的观察单位在总体分布均匀,其取样个体在总体内分布较均匀,这时采用顺序抽样的抽样误差较小。
其缺点表现在:
①如果总体内存在周期性变异或单调增﹙减﹚趋势时,则很可能会得到一个偏差很大的样本,产生明显的系统误差;
②顺序抽样得到的样本并不是彼此独立的,因此,对抽样误差的估计只是近似的。
通过顺序抽样的方法,不能计算抽样误差,估计总体平均数的置信区间。
典型抽样是根据初步资料或经验判断,有意识,有目的的选取一个典型群体作为样本进行调查记载,以估计整个总体。
这种抽样方法完全依赖于调查工作者的经验和技能,结果不稳定,且没有运用随机原理,因而无法估计抽样误差。
典型抽样多用于大规模社会经济调查,而在总体相对较小或要求估算抽样误差时,一般不采用这种方法
20.
何为实验设计?
生物学实验设计的基本要求是什么?
试验设计包括广义的试验设计和狭义的试验设计。
广义的试验设计是指整个研究课题的设计,包括试验方案的拟订,试验单位的选择,分组的排列,试验过程中试验指标的观察记载,试验资料的整理,分析等内容;
而狭义的试验设计则仅是指试验单位的选择,分组与排列方法。
生物统计学中的试验设计主要指狭义的试验设计。
生物学试验的基本要求是:
①试验目的要明确;
②试验条件要有代表性;
③试验结果要可靠;
④试验结果要重演
试解释什么是处理、处理效应、主效应、互作?
实验误差的来源有哪些?
如何进行控制?
处理是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素。
处理因素是指处理因素作用于受试对象的反应,是研究结果的最终体现。
主效应是指由于因素水平的改变而造成因素效应的改变。
互作是指两个或两个以上处理因素间的相互作用产生的效应。
试验误差的来源主要有:
①试验材料固有的差异;
②试验条件不一致;
③操作技术不一致;
④偶然性因素的影响。
针对试验误差来源,控制试验误差的途径主要有:
①选择纯合一一致的试验材料;
②改进操作管理制度,使之标准化;
③精心选择试验单位;
④采用合适的试验设计。
21.
实验设计的基本要素?
基本原则?
实验设计的作用是什么?
试验设计有3项基本原则:
重复,随机和局部控制。
重复原则的主要作用是估计试验误差,降低试验误差;
随机原则的主要作用是提供无偏的试验误差估计。
局部控制原则的主要作用是降低试验误差。
总之,只有遵循重复,随机,局部控制3项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的,最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。