(生统与田试) 统计假设检验6PPT文档格式.ppt

上传人:wj 文档编号:3526157 上传时间:2023-05-01 格式:PPT 页数:147 大小:3.91MB
下载 相关 举报
(生统与田试) 统计假设检验6PPT文档格式.ppt_第1页
第1页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第2页
第2页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第3页
第3页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第4页
第4页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第5页
第5页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第6页
第6页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第7页
第7页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第8页
第8页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第9页
第9页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第10页
第10页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第11页
第11页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第12页
第12页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第13页
第13页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第14页
第14页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第15页
第15页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第16页
第16页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第17页
第17页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第18页
第18页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第19页
第19页 / 共147页
(生统与田试) 统计假设检验6PPT文档格式.ppt_第20页
第20页 / 共147页
亲,该文档总共147页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

(生统与田试) 统计假设检验6PPT文档格式.ppt

《(生统与田试) 统计假设检验6PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《(生统与田试) 统计假设检验6PPT文档格式.ppt(147页珍藏版)》请在冰点文库上搜索。

(生统与田试) 统计假设检验6PPT文档格式.ppt

概率的大小,是推断H0是否正确的依据。

在H0假设下,由于有可能大于,也有可能小于,因此需要考虑差异的正和负两个方面,所以一般计算的都是双尾概率。

(四)推断是否接受假设,根据小概率原理作出是否接受H0:

小概率原理指出:

如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生(“小概率事件实际上不可能发生”)。

统计学中,常把概率小于005或0.01作为小概率。

如果计算的概率大于0.05或0.01,则认为不是小概率事件;

H0的假设可能是正确的,应该接受,同时否定HA;

反之,所计算的概率小于0.05或0.01,则否定H0,接受HA。

通常把概率等于或小于0.05叫做差异显著标准,或差异显著水平(significancelevel);

等于或小于0.01叫做差异极显著标准,或差异极显著水平。

一般差异达到显著水平,则在资料的右上方标以“*”,差异达到极显著水平,则在资料右上方标以“*”。

上例中,所计算的概率为0.1142,大于0.05的显著水平,应接受H0,可以推断治疗前后的血红蛋白含量未发现有显著差异,其差值10(mgL-1)应归于误差所致。

在实际检验时,可将上述计算简化。

由例310已知P(|u|1.96)0.05,P(|u|2.58)0.01,因此,在用u分布进行检验时,如果算得|u|1.96,就是在0.05的水平上达到显著,如果|u|2.58,就是在0.0l的水平上达到显著,即达到极显著水平,勿须再计算u值的概率。

样本频率、变异数以及多个平均数的假设检验,都应根据试验目的提出无效假设和备择假设。

提出无效假设的目的:

可从假设的总体中推论其平均数的随机抽样分布,从而可以算出某一样本平均数指定值出现的概率,这样就可以根据样本与总体的关系,作为假设检验的理论依据。

综上所述,假设检验的步骤可概括为:

(1)对样本所属总体提出无效假设H0和备择HA;

(2)确定检验的显著水平;

(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;

(4)根据显著水平的u值临界值,进行差异是否显著的推断。

三、双尾检验与单尾检验Two-tailedtestandone-tailedtest,进行假设检验时,需要提出无效假设和备择假设。

提出的这种假设,其总体平均数可能大于0,也可能小于0。

在样本平均数的抽样分布中,对于0.05时,落在区间(-1.96,+1.96)的有95,落在这一区间之外(即-1.96和+1.96)的只有5。

同理,对于0.01时,落在区间(-2.58,+2.58)的有99,落在这一区间之外(即-2.58和+2.58)的只有1。

在进行假设检验时,前者相当于接受H0的区域,简称接受区(acceptanceregion);

后者相当于否定H0的区域,简称否定区(rejectionregion)(图41)。

一般将接受区和否定区的两个临界值写作u,即当在(-u,+u)内为H0的接受区,而-u和+u为H0的两个否定区;

x-u:

为左尾否定区,+u为右尾否定区。

上述假设检验的两个否定区,分别位于分布的两尾,称为双尾检验。

当假设检验的时,则,这时备择假设就有两种可能,或或,也就是说在的情况下,样本平均数有可能落入左尾否定区,也有可能落入右尾否定区,这两种情况都属于的情况。

例如,检验某种新药与旧药的治病疗效是否有差别,就是说新药疗效比旧药好还是旧药疗效比新药好,两种可能性都存在,相应的假设检验就应该用双尾检验。

在生物学研究中,双尾检验的应用是非常广泛的。

单尾检验但在某些情况下,双尾检验不一定符合实际。

例如,我们已经知道新药疗效不可能低于旧药,于是其无效假设,备择假设,这时仅有一种可能性,其否定区只有一个,相应的检验也只能考虑一侧的概率,这种具有左尾或右尾一个否定区的检验叫单尾检验。

单尾检验的步骤与双尾检验相同,查u分布表或t分布表时,需将一尾概率乘以2,再进行查表。

例如,进行0.05的单尾检验时,对,需进行左尾检验,其否定区为;

对,需进行右尾检验,其否定区为,同理,进行0.01的单尾检验时,对,其否定区为,对,其否定,假设检验是根据一定概率显著水平对总体特征进行推断。

否定了H0,并不等于已证明H0不真实;

接受了H0,也不等于已证明H0是真实的。

如果H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,这类错误叫第一类错误,或称错误,亦称弃真错误。

四、假设检验中的两类错误TypeIerrorandtypeIIerror,如对样本平均数的抽样分布,当取概率显著水平0.05时,x落在区间(-1.96,+1.96)的概率为0.95,x落在区间(-1.96,+1.96)之外的概率为0.05,当一旦落在区间(-1.96,+1.96)之外,假设检验时就会否定H0,接受HA,这样就会导致错误的结论。

不过,犯这类错误的概率很小,只有0.05。

如果取概率显著水平为0.01,则x落在区间(-2.58,+2.58)的概率为0.99,x落在区间(-2.58,+2.58)之外的概率只有0.01,即犯“错误的可能性更小,只有0.01。

如果H0不是真实的,假设检验时却接受了H0,否定了HA,这样就犯了接受不真实的错误,这类错误叫第二类错误,或称错误,亦称纳伪错误。

第一类错误和第二类错误既有区别又有联系。

二者的区别是,第一类错误只有在否定H0时才会发生,而第二类错误只有在接受H0时才会发生。

二者的联系是,在样本容量相同的情况下,第一类错误减少,第二类错误就会增加;

反之,第二类错误减少,第一类错误就会增加。

统计假设,正确,不正确,接受,没犯错误,否定,犯了错误,弃真错误,(第一类错误),(危险率以表示),接受,犯了错误,采伪错误,(第二类错误),(危险率以表示),否定,没犯错误,在假设检验时,一个假设的接受或否定,不可能保证百分之百的正确,肯定会出现一些错误的推断。

如何减少犯这两类错误的概率?

(1)概率显著水平的确定与犯两类错误有密切的关系,取值太高或太低都会导致某一种错误的增加。

一般的作法是,将概率显著水平不要定得太高,以取0.05作为小概率比较合适,这样可使犯两类错误的概率都比较小。

(2)在计算正态离差u时,总体平均数和样本平均数之间的差值不是随意能够进行主观改变的,但在试验研究中,却是可以减小的。

从理论上讲,可通过精密的试验设计和增大样本容量而减小到接近0的程度,这样正态分布中接受区就变得十分狭窄,和之间的差别就比较容易发现,所以减小是减少两类错误的关键。

因此,在试验和研究中应用假设检验时,要有合理的试验设计和正确的试验技术,尽量增加样本容量,以减小标准误。

第二节样本平均数的假设检验,一、大样本平均数的假设检验u检验,

(一)一个样本平均数的u检验,根据总体方差2是否已知,一个样本平均数的u检验分为两种情况。

1总体方差2已知时的检验当总体方差2为已知时,检验一个样本平均数的总体平均数是否属于某一指定平均数为0的总体,不论其样本容量是否大于30,均可采用u检验法。

例4.1某鱼场按常规方法所育某鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差异?

分析:

这里总体1.58cm,2为已知,故采用u检验;

又新育苗方法的鱼苗体长可能高于常规方法,也可能低于常规方法,故进行双尾检验。

检验步骤为:

(1)假设H0:

0=7.25cm,即新育苗方法与常规方法所育鱼苗一月龄体长相同。

对HA:

0;

(2)选取显著水平=0.05;

(3)检验计算:

(4)推断:

u分布中,当=0.05时,u0.05=1.96。

实得|u|1.96,P0.05,故在0.05显著水平上否定H0,接受HA,认为新育苗方法一月龄体长与常规方法有显著差异。

2总体方差2未知时的检验当总体方差2未知时,只要样本容量n30,可用样本方差S2来代替总体方差2,仍可用u检验法。

例4.2生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有一棉花品种,以n400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm,问该棉花品种的纤维长度是否符合纺织品的生产?

分析:

由题可知,30.0mm,30.2mm,s2.5mm,而2未知,但由于n400,属于大样本,故可用S2来代替2进行u检验;

又由于棉花纤维只有大于30.0mm才符合纺织品生产的要求,故用单尾检验。

30.0mm,即该棉花品种纤维长度达不到纺织品生产的要求。

30.0mm;

(2)确定显著水平0.05;

(3)检验计算:

当=0.05时,单尾检验临界值u0.051.645。

实得|u|1.645,P0.05,故接受H0,否定HA,认为该棉花品种纤维长度不符合纺织品生产的要求。

(二)两个样本平均数比较的u检验,两个样本平均数比较的u检验是要检验两个样本平均数和所属的总体平均数1和2是否来自同一个总体。

在两个样本方差和已知,或和未知,但两个样本都是大样本,即在n130和n230时,可用u检验法,在进行两个大样本平均数的比较时,需要计算样本平均数差数的标准误和u值。

当两样本方差和已知,两个样本平均数差数的标准误为:

(4.1,3.37),(4.2),(4.3),(4.4),(4.5),(4.6),(4.7),(4.8),例4.3根据多年的资料,某杂交黑麦从播种到开花的天数的标准差为6.9d,现在相同试验条件下采取两种方法取样调查,A法调查400株,得出从播种到开花的平均天数为69.5d;

B法调查200株,得出从播种到开花的平均天数为70.3d,试比较两种调查方法所得黑麦从播种到开花的天数有无显著差别。

根据题意,总体方差已知,,故用u检验;

又事先不知A、B两法所得从播种到开花的天数是否相同,需用双尾检验。

12,即A、B两法所得从播种到开花的天数相同。

12;

(2)取显著水平0.05;

由于实得|u|u0.051.96,P0.05,故在0.05显著水平上接受H0,否定HA,即A、B两种调查方法所得黑麦从播种到开花的天数没有显著差别。

例44为了比较“4267RRIM603”和“4267PB86”两个橡胶品种的割胶产量,两品种分别随机抽样55株和107株进行割胶,割胶平均产量分别为954mL.株-l和77.6mL.株-1,割胶产量的方差分别为93636(mL.株-1)2和80089(mL株-1)2试检验两个橡胶品种在割胶产量上是否有显著差别。

12即两品种的割胶产量没有显著差别。

对HA:

12;

(2)规定显著水平=0.01;

现实得|u|u0.012.58,P0.01,故否定H0,接受HA,即两个橡胶品种的割胶产量存在极显著的差别,由于,所以可以得出“4267RRIM603”的割胶产量显著高于“4267PB86”的结论。

二、小样本平均数的假设检验t检验,当样本容量n30且总体方差2未知时,就无法使用u检验法对样本平均数进行假设检验,这时,要检验样本平均数与指定总体平均数0的差异显著性,就必须使用t检验法。

在生物学研究中,由于试验条件和研究对象的限制,有许多研究的样本容量都很难达到30,因此,采用小样本平均数的t检验法在生物学研究中具有重要的意义。

(一)一个样本的假设检验,检验总体方差2未知,样本容量n30的平均数是否属于平均数为0的指定总体的一种t分布。

因为小样本的S2和2相差较大,故遵循自由度d=n-1的t分布。

例4.5某鱼塘水中的含氧量,多年平均为4.5mgL-1,现在该鱼塘设10个点采集水样,测定水中含氧量分别为:

4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26mgL-1,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。

此题2未知,且nl0,为小样本,故用t检验;

又该次测定的水中含氧量可能高于也可能低干多年平均值,故用双尾检验。

(1)假设H0:

0=4.5mg.L-1,即该次测定的水中含氧量与多年平均值没有显没有显著差别。

0;

查附表4,当dn-19时,t0.052.262,现实得|t|t0.05,故P0.05;

(4)推断:

接受H0,认为该次抽样测定的鱼塘水中含氧量与多年平均含氧量没有显著差别,与相差0.079mgL-1属于随机误差。

(二)两个样本平均数的假设检验成组数据的平均数比较,成组数据资料的特点:

是指两个样本的各个变量是从各自总体中抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立。

这样,不论两样本的容量是否相同,所得数据皆为成组数据。

两组数据以组平均数进行相互比较,来检验其差异的显著性。

当总体方差12和22已知,或总体方差12和22未知,但两个样本均为大样本时,采用u检验法检验两组平均数的差异显著性。

这里讨论当总体方差12和22未知,且两样本为小样本(n130,n230),进行两组平均数差异显著性检验的t检验法。

1两样本的总体方差12和22未知,但可假设12222时的检验,首先,用样本方差12和22进行加权求出平均数差数的方差e2,作为对2的估计,计算公式为:

(4.9,5.6),(4.10,5.7),(4.11,5.8),(4.12,5.9A),例4.6用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重量(g),两组的数据分别为:

(4.13,5.9B),高蛋白组:

134,146,106,119,124,161,l07,83,113,129,97,123;

低蛋白组:

70,118,101,85,107,132,94。

试问两种饲料饲养的大白鼠增重量是否有差别?

本题12和22未知,且为小样本,用t检验;

又事先不知两种饲料饲养的大白鼠增重量孰高孰低,故用双尾检验。

12,即两种饲料饲养的大白鼠体重没有显著差别。

(2)规定显著水平=0.05;

接令H0,认为两种饲料饲养大白鼠的增重量没有显著差别。

2两样本的总体方差12和22未知,且1222(可由F检验得知),但n1=n2时的检验。

这种情况仍可用t检验法,其计算也与可假设两总体方差12=22的情况一样,只是在查t值表时,所用自由度dn-1,而不是2(n-1)。

例4.7两小麦品种千粒重(g)的调查结果如下:

品种甲:

50,47,42,43,39,5l,43,38,44,37;

品种乙:

36,38,37,38,36,39,37,35,33,37。

试检验两品种的干粒重有无显著差异。

此题n1=n2=10,经F检验,得知两品种千粒重的方差有显著的不同。

12,即两品种的千粒重没有显著差别。

(2)取显著水平=0.05;

查附表4,d10-19,现实得|t|t0.05,故P0.05(4)推断:

否定H0,接受HA,认为两品种千粒重有显著差异,甲品种的千粒重显著高于乙品种。

73,3两样本的总体方差12和22未知,且1222,n1n2时的检验,这种情况所构成的统计数t不再服从相应的t分布,只能进行近似的t检验。

由于1222,所以两样本平均数差数的标准误不能使用加权方差,需用两个样本方差S12和S12分别估计总体方差12和22,即有:

(4.14,5.10),作t检验时,需先计算R和d:

式4.17的td近似服从于t分布,其自由度为d,查t值表得t(d),临界值。

(4.15,5.11),(4.16),(4.17,5.12A),例48测定冬小麦东方红3号的蛋白质含量()10次,得,S121.621;

测定农大193的蛋白质含量5次,得,S220.135。

试检验两品种蛋白质含量是否有显著差异。

经F检验,得知两品种蛋白质含量的方差有显著的不同,又由于n1n2,故需计算td,作近似的t检验。

使用双尾检验。

12即两品种蛋白质含量没有显著差别。

(2)取显著水平=0.01;

否定H0,接受HA,认为两品种蛋白质含量有极显著差异。

(三)成对数据平均数比较的假设检验,成对数据的比较要求两样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。

成对数据特点:

由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较高精确度。

设两样本的变量分别为x1和x2,共配成n对,各对的差数为dx1-x2,则样本差数平均数为:

(4.18),(4.19),(4.20,5.14),(4.21,5.15A),(4.22,5.15B),例49在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如表4-1,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。

此题为配对数据,因两组饲料对试验动物肝中维生索A含量的作用孰大孰小,事先并不明确,故用双尾检验。

d0,两组饲料对试验动物肝中维生索A含量的作用没有显著差别。

10;

(2)确定显著水平=0.01;

否定H0:

ud0,接受HA:

ud0,即两组饲料对试验动物肝中维生素A含量的作用有极显著差异,用正常饲料饲养的试验动物肝中的维生素A含量显著高于维生素E缺乏组饲养的试验动物肝中的维生素A含量。

第三节样本频率的假设检验,在生物学研究中,有许多试验或调查结果是用频率(或百分数、成数)表示的。

比如总体或样本中的个体分属两种属性,象药剂处理后害虫的死与活、种子的发芽与不发芽、动物的雌与雄、试验的成功与失败等,类似这些性状组成的总体通常服从二项分布,因此叫二项总体,即由“非此即彼”组成的总体。

有些总体中的个体有多个属性,但可根据研究目的经适当的统计处理分为“目标性状”和“非目标性状”两种属性,也可看作二项总体。

在二项总体中抽样,样本中的“此”性状出现的情况可用次数表示,也可用频率表示,因此频率的假设检验可按二项分布进行,即从二项式(p+q)n的展开式中求出“此”性状频率的概率,然后作出统计推断。

但是,如果样本容量n较大,0.1p0.9时,np和nq又均不小于5,(p十q)n的分布就趋于正态,因而可将频率资料作正态分布处理,从而作出近似的检验。

一、一个样本频率的假设检验,检验一个样本频率与某一理论频率p0的差异显著性。

根据n和p的大小,其检验方法是不一样的。

当np或nq5,则由二项式(p+q)n展开式直接检验。

当np或nq5时,二项分布趋近正态,可用u检验,但需进行连续性矫正。

如np或nq均大于30时,则可不进行连续性矫正。

(4.23,5.16),(4.24,5.17),(4.25,5.23),例4.10有一批蔬菜种子的平均发芽率p00.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。

本题中,p00.85,n500,由于np和nq都大于30,故不需进行连续性矫正。

pp0=0.85,即用种衣剂浸种后的发芽率仍为0.85。

pp0;

(2)确定显著水平=0.05;

两尾检验,(3)检验计算:

由于|u|u0.051.96,p0.05,故否定H0,接受HA,认为用种衣剂浸种能够显著提高蔬菜种子的发芽率。

例411规定种蛋的孵化率p00.80为合格,现对一批种蛋随机抽取100枚进行孵化检验,结果有78枚孵出,问这批种蛋是否合格?

本题中,np和nq都大于5,但nq30,故需进行连续性矫正。

又只有孵化率0.80才认为是不合格,故采作单尾检验。

pp0=0.80,即该批种蛋不合格。

由于|u|u0.051.645,p0.05,故接受H0,认为这批种蛋不合格。

二、两个样本频率的假设检验,检验两个样本频率和差异显著性,一般假定两个样本的方差是相等的,即p12p22。

这类检验在实际应用中具有更重要的意义。

由于在抽样试验中,其理论频率p为未知数,就不能对两样本某属性出现的次数进行比较,只能进行频率的比较。

和单个样本频率的假设检验一样,当np或nq5,则按二项分布直接进行检验;

当np或nq5时,用u检验,并需进行连续性矫正;

当np或nq均大于30时,则可不进行连续性矫正。

两个样本频率差数标准误为:

(4.26,5.18),(4.27,5.21),(4.28),(4.29,5.22),如果n130,n230,对式4.29,可用t代替u值;

对式4.30,可用tc代替uc值,进行t检验。

例4.12研究地势对小麦锈病发病的影响,调查低洼地麦田378株,其中锈病株342株,调查高坡地麦田396株,其中锈病株313株,试比较两块麦田锈病发病率是否有显著性差异。

(4.30),分析:

本题np和nq均大于30,不需进行连续性矫正。

又事先不知两块麦的锈病发病率孰高孰低,故进行双尾检验。

p1=p2,即两块麦田锈病发病率没有显著差异。

p1

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2