精选统计简答.docx

上传人:b****4 文档编号:13969020 上传时间:2023-06-19 格式:DOCX 页数:17 大小:44.13KB
下载 相关 举报
精选统计简答.docx_第1页
第1页 / 共17页
精选统计简答.docx_第2页
第2页 / 共17页
精选统计简答.docx_第3页
第3页 / 共17页
精选统计简答.docx_第4页
第4页 / 共17页
精选统计简答.docx_第5页
第5页 / 共17页
精选统计简答.docx_第6页
第6页 / 共17页
精选统计简答.docx_第7页
第7页 / 共17页
精选统计简答.docx_第8页
第8页 / 共17页
精选统计简答.docx_第9页
第9页 / 共17页
精选统计简答.docx_第10页
第10页 / 共17页
精选统计简答.docx_第11页
第11页 / 共17页
精选统计简答.docx_第12页
第12页 / 共17页
精选统计简答.docx_第13页
第13页 / 共17页
精选统计简答.docx_第14页
第14页 / 共17页
精选统计简答.docx_第15页
第15页 / 共17页
精选统计简答.docx_第16页
第16页 / 共17页
精选统计简答.docx_第17页
第17页 / 共17页
亲,该文档总共17页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

精选统计简答.docx

《精选统计简答.docx》由会员分享,可在线阅读,更多相关《精选统计简答.docx(17页珍藏版)》请在冰点文库上搜索。

精选统计简答.docx

精选统计简答

第一章

1、医学统计工作的步骤

(1)设计;

(2)搜集资料;来源:

医学领域的统计资料主要来自三个方面,统计报表,经常性工作记录,专题调查或专题实验;要求:

统计学对原始资料的要求是完整、准确、及时;贮存:

注意资料的时效性、磁盘备份等。

(3)整理资料:

检查核对准确性和完整性,设计分组,拟定整理表,归表。

(4)分析资料统计分析包括统计描述和统计推断(参数估计,假设检验)。

2、计量资料中,集中趋势和离散趋势分别包括

集中趋势:

算术均数、几何均数、中位数、百分位数

离散趋势:

极差(全距)、四分位数间距、方差(总体方差和样本方差)、标准差和变异系数。

第二章

1、试述频数分布表的用途

(1)描述频数分布的类型,

(2)描述频数分布的特征,(3)便于发现一些特大或特小的离群值,(4)便于进一步做统计分析和处理

2、频数表的步骤

(1)求出极差;

(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。

3、试述正态分布、标准正态分布及对数分布的联系和区别

(1)原始值X:

正态分布无需转换,标正分布作u=(X-μ)∕σ转换,对数正态分布作Y=lgX转换。

(2)分布类型:

正态分布对称,标正分布对称,对正分布正偏态

(3)集中趋势指标:

正态分布μ,标正分布μ=0,对正分布G

(4)均数与中位数的关系:

正态分布μ=M,标正分布μ=M,对正分布μ﹥M

4、正态分布的面积规律

(1)X轴与正态曲线所夹面积恒等于1或100%

(2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95%,区间μ±2.58σ的面积为99%

5、极差、四分位数间距、标准差及变异系数的适用范围

这四个指标均反映计量资料的离散程度。

极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料见度量衡单位不同或均数相差悬殊时的变异程度比较。

6、医学参考值范围的含义、确定的原则和方法

医学中常把绝大多数正常人的某项指标范围称为该指标的参考值范围。

所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

确定参考值范围的原则和方法是:

(1)定义“正常人”,不同指标“正常人”的定义也不同;

(2)选定足够数量的正常人作为研究对象;(3)用统一和准确的方法测定相应的指标;(4)根据不同的用途选定适当的百分界限,常用95%;(5)根据此指标的实际意义,决定用单侧范围还是双侧范围;(6)根据此指标的分布决定计算方法,常用的计算方法有:

正态分布法和百分位数法。

第三章

1、标准差与标准误是区别与联系

区别:

(1)含义不同:

标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。

标准误

估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

(2)与n的关系不同:

n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。

(3)用途不同:

标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。

联系:

二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

标准差:

标准误:

2、t分布与u分布的异同

相同点:

t分布和标准正态分布(u分布)都是以0为中心的正态分布。

标准正态分布是t分布的特例(自由度是无限大时)。

不同点:

t分布为抽样分布,u分布为理论分布;t分布比标准正态分布的峰值低,且尾部翘得更高;t分布受自由度大小的影响,随着自由度的增大,逐渐趋近于标准正态分布;t分布有无数条曲线,而u分布只有唯一一条曲线。

3、对两指标进行比较,是否必须做假设检验

(1)如果是由随机抽样资料计算得到的指标,在比较时应做统计推断。

因为此时存在抽样误差,直接由两样本统计量的大小比较结果对总体情况下结论是不合适的。

如果是由总体数据计算得到的指标进行比较,可以不必进行假设检验。

(2)统计推断的方法包括参数估计和假设检验,对两指标进行比较可以选择其中的任一方法进行。

参数的可信区间不仅能够进行指标大小的比较,还可以提示两指标的差别有无实际的专业意义,但其职能在预先规定的概率,即可信度(1-α)的前提下进行计算,而假设检验可以获得一个较为确切的概率P值。

4、如何合理设置检验水准α

(1)α值是在科研设计(调查设计或实验设计)中根据研究目的预先确定的,不应在算出P值之后再来选择。

(2)若假设检验的重点是减少I型错误(如一般的假设检验),一般取α=0.005;若中的年是减少II型错误(如方差齐性检验、正态性检验等),一般取α=0.10或α=0.020,甚至更高。

5、假设检验中α和P的区别

α和P均为概率,其中是指拒绝了实际上成立的H0所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准,P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量的概率。

在假设检验中通常是将P与α对比来得到结论,若P≤α,则拒绝H0,接受H1,有统计学意义,可以认为…不同或不等,否则,若P>α,则不拒绝H0,无统计学意义。

尚不能认为…不同或不等。

6、怎样正确选择单侧检验和双侧检验

单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。

若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。

在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。

若研究者对于低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。

一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能,故更易得出有差别的结论,但应慎用。

7、假设检验中如何确定P值?

简述P值的含义。

求出检验统计量后,可通过统计用表直接查出P值。

P值是指从H0所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验统计量的概率。

8、什么是两类统计学错误?

二者有何联系?

由于样本的随机性,假设检验中作出的结论可能会犯两类不同类型的错误:

I型错误和II型错误。

I型错误是拒绝了实际上成立的H0,即“弃真”;II型错误是不拒绝实际上不成立的H0,即“存伪”。

理论上犯第一类错误的概率为α,假设检验时可根据研究者的要求来确定;犯第二类错误的概率为β,它只有与特定的H1结合起来才有意义。

β值的大小很难确切地估计,但知道在样本含量不变的前提下,α越小,β越大,反之,α越大,β越小。

同时减少α和β的唯一方法是增加样本含量,因为增加了样本含量后,均数的抽样误差小,样本均数的代表性强,也就是样本均数较接近总体均数,因而可使犯第一类错误和第二类错误的概率同时减少。

(1-β)称为检验效能或把握度。

9、P﹤0.05,拒绝H0的理论依据

P值是指从H0规定的总体随机抽样得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。

当P﹤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。

在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

10、t检验的应用条件

对单样本t检验要求资料服从正态分布;对配对t检验要求差值服从正态分布;对两样本T检验要求两组数据均服从正态分布,且两样本对于的两总体方差相等,对两小样本尤其要求方差齐性。

11、t检验的注意事项

(1)要有严密的抽样设计,随机、均衡、可比。

(2)选用的检验方法必须符合其适用条件(注意:

t检验的前提是资料服从正态分布)。

(3)单侧检验和双侧检验,单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。

(4)假设检验的结论不能绝对化。

不能拒绝H0,有可能是样本数量不够,拒绝H0,有可能犯第Ⅰ类错误。

(5)正确理解P值与差别有无统计学意义。

P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。

(6)假设检验和可信区间的关系。

结论具有一致性,提供的信息不同。

区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。

12、假设检验时应注意的事项

(1)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的,要保证组间的均衡性和资料的可比性,可能影响结果的非处理因素在对比组间应尽可能相同或相近;

(2)正确选择检验方法;根据现有的资料类型、设计类型、分析目的、样本含量等因素选用适当的检验方法,如不符合条件可做适当转换;(3)正确理解“差别无显著性”的含义,差别有统计学意义,不能理解为两者差差大,也不能理解为所分析的指标在实际应用上就有“显著效果”。

(4)检验假设的推断结论为概率结论,不能绝对化:

检验水准人为规定,是相对的,报告结论时应列出检验统计量和P值的确切范围。

(5)注意是单侧检验还是双侧检验

13、假设检验的步骤

(1)建立假设和确定检验水准:

根据实际情况确定单、双侧检验,建立假设,确定检验水准;

(2)选定检验方法和计算统计量:

根据设计的类型及研究目的选择合适的检验方法并计算出对应的统计量;(3)确定P值并做出推断结论。

若t≥tα,v,则P≤α,按检验水准,拒绝H0,接受H1,尚可认为差异显著有统计学意义;相反则差异不显著,无统计学意义。

14、可信区间与参考值范围的区别

意义、计算公式和用途均不同。

(1)参考值范围是指同质总体内包括百分之几十个体值的估计范围。

而可信区间是指在百分之几十的可信度估计的总体参数的所在范围。

(2)同样的百分之几十,参考值范围是样本范围,可信区间是指可信度范围,二者有着本质的不同。

(3)从意义来看,95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。

(4)从计算公式看,若指标服从正态分布,95%参考值范围的公式是:

±1.96s。

总体均数95%可信区间的公式是:

前者用标准差,后者用标准误。

前者用1.96,后者用α为0.05,自由度为v的t界值。

(5)从用途上看,可信区间用来估计总体均数,参考值范围用来判断观察对象的某项指标是否正常。

15、简述检验假设与可信区间的联系与区别。

答:

(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。

前者估计总体参数的大小,后者推断总体参数有无质的不同。

(2)可信区间也可回答假设检验的问题。

但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计意义。

(3)可信区间还可提示差别有无实际意义。

16、U检验:

样本含量n足够大(n>50),或n虽小但总体标准差σ已知时的样本均数与总体均数的比较、成组设计两样本均数的比较。

第四章

1、方差分析的基本思想、应用条件、应用范围及工作步骤。

基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可有处理因素的作用加以解释。

通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。

应用条件:

(1)各样本是相互独立的随机样本,均服从正态分布;

(2)相互比较的各样本的总体方差相等,即具有方差齐性。

应用范围:

分析比较两个或多个样本均数;分析两个或多个研究因素的交互作用;回归方程线性假设检验;多元线性回归分析中偏回归系数的假设检验;两样本的方差齐性检验等。

工作步骤:

(1)建立检验假设,确定检验水准。

H0:

i组资料的总体均数相等,μ1=μ2=μiH1:

i组资料的总体均不等或不全相等,各μi不等或不全相等α=0.05

(2)计算统计量F值。

F=MS组间/MS组内(3)确定P值,并做出统计推断。

以V1和V2查F界值表,若F>F0.01(v1,v2),P<0.01,按α=0.05检验水准,拒绝H0,接受H1,可以为各总体均数不等或全相等。

当方差分析的推断结果为拒绝H0,接受H1,各总体均数不等或全相等时,需用N—K检验或最小显著差(LSD)检验进一步作多个样本均数间的两两比较

第五章

1、常用的相对数种类及其各自的含义、计算方法和特点

常用的相对数有强度相对数(率)、结构相对数(构成比)、相对比三种

率的含义是某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。

其特点是说明某现象发生的强弱。

公式是率=(某时期内发生某现象的观察单位数/同期可能发生某现象的观察单位总数)×比例基数。

构成比的含义是失误内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100%为比例基数,又称为百分比。

其特点为

①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化收到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其他部分数值变化的影响。

公式是构成比=(某一组成部分的观察单位数/同一事物各组成部分的观察单位总数)×100%。

相对比是两个有关指标之比,说明两指标间的比例关系。

其特点是两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。

公式是相对比=(甲指标/乙指标)×100%。

2、应用相对数时的注意事项有哪些?

(1)正确区分分子、分母,且计算相对数的分母不宜过小;观察例数过小时抽样误差较大,计算的相对数往往不稳定,可靠性差。

所以当观察例数较少(如少于30例)时,一般以绝对数表示为好,如以相对数表示,应给出其可信区间。

(2)分析时不能以构成比代替率;(3)对观察单位数不等的几个率,不能直接相加求其平均率;(4)资料的对比应注意可比性;(5)对样本率(或构成比)的比较应遵循随机抽样,要做假设检验;(6)要正确选择分子和分母的数值,要能说明事物的特点和性质;(7)计算构成比也可以是划分为各组间的定量指标资料,同一事物各组成部分的构成比之和应为1或100%。

第六章

1、二项分布的应用条件

(1)各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡。

(2)已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π,实际工作中要求π是从大量观察中获得比较稳定的数值。

(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立。

2、二项分布的性质

A,二项分布的均数和标准差在二项分布的资料中,

当π和n已知时,它的均数μ及其标准差

如下:

μ=nπ(3.11)

若均数和标准差不用绝对数表示,而是用率表示时,即对式(3.11)(3.12)分别除以n,得:

是样本率的标准误的理论值,当π未知时,常用样本率p作为π的估计值,则:

B,二项分布的累计概率二项分布的累计概率(cumulativeprobability)常用的有左侧累计和右侧累计2种方法。

从阳性率为π的总体中随机抽取n个个体,则

(1)最多有k例阳性的概率

(2)最少有k例阳性的概率

D,二项分布的形状取决于π和n的大小:

(1)当π=0.5时,分布对称;当π<0.5时,分布呈正偏态,且固定n时,π越小,分布越偏;当π>0.5时,分布呈负偏态,且固定n时,π越大,分布越偏。

(2)对固定的π,分布随n的增大趋于对称。

3、总体率的估计

总体率的估计也有点估计和区间估计,点估计是简单地用样本率来估计总体率;区间估计是求出总体率的可能范围。

样本率的理论分布和样本含量n、阳性率p的大小有关,所以需要根据n和p的大小不同,分别选用下列2种方法。

(一)查表法当样本含量n较小,如n≤50,特别是p很接近于0或1时,按二项分布的原理估计总体率的可信区间。

(二)正态近似法当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率的p的抽样分布近似正态分布,总体率

的可信区间可按下列式(3.17)进行估计。

4、Poisson分布应用条件:

A,要求事件的发生是相互独立

B,发生的概率相等

C,结果是二分类

5、Poisson分布的性质:

A,该分布是一种单参数的离散型分布,其参数为

,它表示单位时间或空间内某件事平均发生的次数,又称强度参数。

B,Poisson分布的方差

和均数μ相等,即

C,Poisson分布的累计概率

(1)最多为k次的概率

(2)最少为k次的概率

6、举例说明泊松分布的特征及应用。

答:

特征:

(1)泊松分布是一种单参数的离散型分布,其参数为μ,表示单位时间或空间内某事件平均发生的次数,又称强度参数。

(2)泊松分布的方差与均数相等,σ2=μ。

(3)概率累计;(4)泊松分布的形状取决于μ的大小。

μ值越小,分布越偏,随着μ的增大,分布越趋于对称,当μ=20时,分布接近正态分布,当μ=50时,可以认为分布呈正态分布。

(5)泊松分布具有可加性。

应用:

泊松分布是在发生率π很小,样本含量n趋于无穷大时,二项分布的极限形式。

其应用条件与二项分布相同,即要求事件的发生是相互独立的,发生的概率相等,结果是二分类的。

主要用于研究单位时间或单位空间内某事件发生的次数,用于研究单位人群中某疾病发生数的分布时,单位人群的人数要求大一些。

即泊松分布描述小概率事件出现规律性的一种重要的离散型分布。

总结:

u分布:

制定医学参考值(μσ);t分布:

总体均数可信区间估计(v→∞正态);二项分布:

总体率可信区间估计(π=0.5或n→∞正态);Poisson分布:

总体参数估计(μ>50正态)。

7、总体参数的估计

由样本均数(样本计数)X估计总体均数μ也有点(值)估计和区间估计,区间估计的方法,需视样本计数(样本均数)X的大小而定,X小时用查表法,X大时用正态近似法。

(一)查表法

当样本计数X≤50时,用X值查附表poisson分布μ的可信区间,可得总体均数μ的95%或99%可信区间。

(二)正态近似法

当样本计数X>50时,可用正态近似原理下面公式求总体均数μ的95%或99%可信区间

 

8、正态分布、二项式和泊松分布的关系:

二项分布(binomialdistribution):

对只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。

Poisson分布是在π很小,样本含量n趋于无穷大时,二项分布的极限形式。

当v=∞时,t分布即为u分布,趋向正态分布。

第七章

1、说明X2检验的用途

X2检验的用途较广。

通常多用于推断两个总体率或构成比之间有无差别;推断多个总体率或构成比之间有无差别;多个样本率比较的X2分割;两个分类变量之间有无关联性;频数分布拟合优度的X2检验。

2、两个样本率比较的u检验与X2检验有何异同?

两样本率比较时,若同一资料同时进行u检验与X2检验,在不校正的情况下X2=u2;但u检验通常用于大样本,而X2检验可用于大样本或小样本。

3、卡方检验的基本思想和用途

基本思想:

x2值反映了实际频数与理论频数的吻合程度,若检验假设H0成立,实际频数与理论频数的差值会小,则x2值也会小;反之,若检验假设H0不成立,实际频数与理论频数的差值会大,则x2值也会大。

主要用来推断两个总体率间或者构成比见有无差别;多个总体率间或构成比间有无差别;多个样本率比较的x2分割;两个分类变量之间有无关联性以及频数分布拟合优度的x2检验。

用途:

推断两个总体率间或者构成比见有无差别;多个总体率间或构成比间有无差别;多个样本率比较的x2分割;两个分类变量之间有无关联性以及频数分布拟合优度的x2检验。

4、行X列表卡方检验的注意事项:

答:

(1)X2检验要求理论频数不宜太小,否则将导致偏性。

一般认为行X列表资料中不宜有1/5以上的格子理论数小于5,或有一个格子理论数小于1。

处理方法:

最好的方法是增加样本例数,以增大理论频数;且精确概率法;进行合理的合并;删除理论频数太小的行和列,后两种方法将损失一定的信息并影响样本的随机性。

(2)单向有序列行X列表的统计处理:

当效应按强弱分为若干个级别,试验结果整理为单向有序行列表,在比较各处理组的效应有无差别时,宜用秩和检验或Ridit分析。

(3)当多个样本率比较的X2检验。

结论为拒绝H0,只能认为各总体率或总体构成比之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。

若要进一步解决此问题,可用卡方分割法。

第八章

1.什么叫做非参数检验?

它和参数检验有什么区别?

答:

非参数检验对总体分布不做严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。

如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

2.什么叫做秩转换的非参数检验?

它适用于哪些情况?

答:

秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。

它适用于:

不满足正态分布或(和)方差齐性的小样本计量资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料。

3.两组或多组等级资料的比较,为什么不能用χ2检验,而用秩转换的非参数检验?

答:

若选行×列表资料的χ2检验,只能推断两个或多个总体的等级构成比的差别,这一般不是推断的目的;而秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。

4.总体有n个秩:

1,2,…,n。

若n个秩中有相同秩(如1,2,4,4,4,6,7,…,n),其均数和方差是否会改变?

变大还是变小?

答:

均数不改变,方差改变。

方差变小。

5.两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?

答:

属于非参数检验。

因为这时的u检验是比较例数较小组秩和(T)与其总体均数(n1(N﹢1)/2))的差别,而秩和(T)不是参数。

6,随机区组设计多个样本比较的FriedmanM检验,备择假设H1如何写?

为什么?

答:

H1写为多个总体分布的位置不全相同。

H1不能写为多个总体分布不全相同。

因为FriedmanM检验对于多个总体分布的形状差别不敏感,只对其位置差别敏感。

第九章

1.试总结从样本数据判断总体回归关系是否成立的统计方法有哪些?

答:

用tb、tr作t检验;用F对b和R2做方差分析;直接查r界值表。

2.直线回归分析中应注意哪些问题?

答:

(1)两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强做回归分析,其中哪一个作为应变量主要是根据专业上的要求而定,同时直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量。

(2)进行直线回归分析前应绘制散点图,以检查数据是否满足模型基本假设,发现离群点并进行进一步的测量。

(3)对结果应有正确的解释。

反映两变量间数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。

P值越小只能说明越有理由认为变量间的直线关系存在,而不能说明关系越密切或越“显著”。

直线回归用于预测时应尽量避免不合理的外延。

结果中的决定系数可表示两

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2