食品试验设计与统计分析报告期末复习资料.docx
《食品试验设计与统计分析报告期末复习资料.docx》由会员分享,可在线阅读,更多相关《食品试验设计与统计分析报告期末复习资料.docx(35页珍藏版)》请在冰点文库上搜索。
食品试验设计与统计分析报告期末复习资料
第一早
1.统计学:
研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学的推断。
因而统计学是认识世界的重要手段。
2.食品试验设计与统计分析:
数理统计原理与方法在食品科学研究中的应用,是一门应用数学。
3.食品试验科学的特点:
1.食品原料的广泛性2.生产工艺的多样性3.质量控制的重要性4.不同学科的综合性
4.统计学发展概貌:
古典记录统计学、近代描述统计学、现代推断统计学。
第二早
5.总体:
根据研究目的确定的研究对象的全体。
6.个体:
总体中一个独立的研究单位。
7.样本:
根据一定方法从总体中抽取部分个体组成的集合。
8.样本含量n(样本容量):
即样本中个体的数目。
(n<30的样本叫小样本,n》30的样本叫大样本)
9.随机样本:
总体中的每一个个体都有同等机会被抽取组成样本。
10.参数:
由总体计算的特征数。
11.统计量:
由样本计算的特征数。
12.参数和统计量的关系:
由相应的统计量来估计参数,如样本平均数估计总体平均数,样本标准差估计总体标
准差。
13.准确性(准确度):
在调查或试验中某一实验指标或性状的观测值与真实值接近的程度。
(观测值与真实值之间)
14.精确性(精确度):
在调查或试验中同一实验指标或性状的重复观测值彼此接近的程度。
(观测值与观测值之间)
15.试样中的误差:
随机误差和系统误差。
16.随机误差(抽样误差):
由许多无法控制的内在和外在偶然因素所造成的误差,不可避免和消除,影响试验的精确性。
17.系统误差(片面误差):
由于试验对象相差较大,测量的仪器不准、标准试剂未经校正所引起,可以通过改进方法、正确试验设计来避免、消除,影响试验准确性。
18.资料的分类:
连续性资料:
对每个观测值单位使用仪器或试剂等量测手段来测定其某项指标的数值大小而得
至U的资料。
间断性资料:
用计数方式得到的数据资料。
分类资料:
可自然或人为地分为两个或多个不同类别的资料。
等级资料:
将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数
而得的资料。
19.连续性资料的整理:
采用组距式分组
1.求全距2.确定组数3.求组距4.确定组限和组中值(最小值为下限,最大值为上限。
第一组的组中值以接近于或等于资料中最小值为好。
)5.制作次数分布表
20.统计表的绘制原则:
结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和分析
21.统计表种类:
简单表,复合表
22.统计图:
用图形将统计资料形象化。
长条图、圆图、线图、直方图、折线图。
23.平均数、:
指出资料中数据集中较多的中心位置,描述资料的集中性。
反应了总体分布的集中趋势。
24.平均数的种类:
算术平均数、中数、众数、几何平均数、调和平均数。
25.算数平均数计算方法:
直接法、加权法
26.算数平均数的特性:
离均差为0,离均差平方和最小。
27.离均差:
每个观测值均有一个偏离平均数的度量指标。
算术平均数的离均差之和为零。
28.离均差平方和:
各个离均差平方后相加。
29.方差(MS:
也称均方,各数据与平均数的差的平方和与自由度的比。
样本方差用S2表示。
(无单位)
30.自由度df:
样本内独立而能自由变动的离均差个数。
31.标准差:
样本方差的算术平方根。
(有单位,与观测值单位相同)
32.标准差的特性:
1.标准差的大小受每个观测值的影响,若数值之间变异大,其离均差亦大,标准差必然大。
2.各观测值加或减同一常数,标准差的值不变。
3.每个观测值乘以或除以一个不等于0的常数A时,所得标准差是原标准差的A倍或1/A。
33.样本标准差:
EXCEL用STDEV函数计算。
34.变异系数CV:
标准差相对于平均数的百分数。
反映了总体的可比程度。
S
CV=*100%
X
35.变异系数的作用:
当资料所带的单位不同或单位虽然相同而平均数相差较大时,不能直接用标准差比较各个
样本资料的变异程度大小。
消除了不同单位和平均数的影响。
第二早
36.伯努利试验:
只有两种实验结果的随机试验。
37.N重伯努利试验:
伯努利试验在完全相同的实验条件下独立的重复n次,并作为一个随机试验。
38.二项分布XmB(n,p):
离散型随机变量分布。
P(x=k)=Ckpkqn“(k=0,1,2,3…,n)
39.二项分布的特征n
1.Pn(K)>02.(p+q)n=13.在一定范围内的总概率P等于被包含的几个概率之和。
4.当p值较小且n不大时,分布是偏倚的。
随着n的增大,分布逐渐趋于对称。
5.当p值趋于0.5时,分布趋于对称。
40.二项分布的应用条件:
(1)试验结果为两大类或两种可能的结果。
(2)每次试验的条件不变,每次试验A的发生概率均为n。
(3)各次试验独立,每个观察单位的观察结果不会影响到其他观察单位的结果。
41.二项分布的平均数:
上np
42.二项分布的方差:
^nnpq
43.泊松分布x*(k):
可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。
(即小概率事件
分布,意外事故、自然灾害都近似服从)
P(x=k)=
45.泊松分布的应用条件:
1.随机地发生在单位时间或空间里的稀有事件的概念分布。
2.在二项分布中,n很大,p很小时。
3.事件不随机时,不能用泊松分布。
46.正态分布x、N(j¥):
连续型随机变量的概率分布。
47.正态分布的特点:
1.正态分布曲线是以均数•为中心左右对称的单峰悬钟形曲线。
在平均数的左右两侧,只要(x」)绝对值相等,
f(x)值就相等。
2.f(X)在x='处达到最大值,且f(丄)=1/((T.2二)
3.f(x)是非负函数,以横轴为渐近线,分布从-g到:
+^,且曲线在j±t处各有一个拐点。
4.」是位置参数,t2是形状参数。
5.正态分布的次数多数集中于平均数」的附近,离均数越远,其相应的次数越少。
6.曲线f(x)与横轴之间所围成的面积等于1。
2
48.标准正态分布u=N(0,1):
p=O,c=1的正态分布。
49.标准正态变量(标准正态离差)u:
u=(x-.1)/d
50.三种分布的关系:
1.二项分布,当n很大,np、n(1-p)接近,该分布接近于正态分布。
2.在no、p)0.5时或p>0.1时可用二项分布代替正态分布。
3.当n_;g、p—;0,且np=■(较小常数)时,用泊松分布代替二项分布。
4.当pv0.1且n很大时,用泊松分布代替二项分布。
5.泊松分布,■>30时,用正态分布代替。
51.抽样分布:
统计量的分布概率。
|
52.抽样误差:
由随机抽样造成的误差。
53.标准误差(标准误,均数标准误):
样本平均数抽样总体的标准差。
反应精确性的高低,匚~x越大精确度越低。
\二J
CT
CT-=—7—Q"x
in
54.t分布:
在计算Sx时,由于米用
S来代替
;使得t变量不再服从标准正态分布,而是服从
t分布。
t=
(上…1)
/S了
第四章
55.统计推断:
根据抽样分布规律和概率理论,由样本结果去推断总体特征。
主要包括假设检验(显著性检验)
和参数估计。
56.表面效应:
样本平均数与总体平均数的差异。
包含两总体平均数的差异(处理效应)(-i-山)和试验误差一;。
"x-丄=」+一;…肛(丄儿)+一;
57.统计假设检验:
对研究总体提出假设,然后在此假设下构造合适的检验统计量,并由该统计量的抽样分布计
算出样本统计量的概率,再根据概率值的大小作出接受或否定假设的判断。
62.统计假设检验步骤:
1.建立假设2.确定显著水平a3.检验计算4.统计推断
63.
I型错误(第一
类错误):
指当H本身正确,但通过假设检验后却否定了它,也就是将非真实差异错判为真
实差异。
犯第一类错误的概率是
Oto(减少I型错误,可将显著水平定得小一点。
)
64.
n型错误(第二
一类错误):
当H本身错误时,通过假设检验后却接受了它,也即把真实差异错判为非真实差
异。
(减少H型错误,通常是通过减少均数标准误来减小第二类错误的概率。
而均数标准误的减小是通过精密的试验设计、严格的
试验操作和增大样本容量来实现的。
由于一般来说a大B就小,增大了犯第一类错误的概率时,犯第二类错误的可能性就小。
反之,
a小,B大。
因此在实践中可以根据试验目的,通过调整a的大小来控制检验时犯错误的概率。
)
65.两尾检验:
备择假设中,包含了卩<卩0和卩>卩0两种情况,因而这种检验有两个否定域,分别位于样本平均数分布曲线的两尾。
66.一尾检验:
否定域位于_x分布曲线某一尾的统计假设检验。
67.选用两尾检验还是一尾检验应根据专业的要求在试验设计时确定。
若事先不知道卩与卩0谁大谁小,为了检
验两者是否有差异就用两尾检验。
如果能凭借专业只是推测□不会小于(或大于)卩0时,为了检验□是否大于
(或小于)卩0应用一尾检验。
68.u检验:
在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。
69.u检验使用范围:
若样本资料总体方差已知,或样本含量》30时用u检验。
70.假设统计误差中试验误差:
随机误差
71.统计假设检验中应注意的问题:
1.试验要科学设计和正确实施2.选用正确的统计假设检验方法3.正确理解
由于常用显著水平a有工05和O.OU故柞统计推断时就有3种可能结果+毎次检验必御
且只能得其中之一j
①当计算岀的槪率出竺?
九说明表面敢应仅由谋差造成的槪車不很小*故炖接受尤
实用文档
差异显著性的统计意义
4.合理建设统计假设,正确计算检验统计量
单个样本平均数的假设检验
1)单个样本平均数的u检验:
某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。
某日
随机抽查10瓶罐头,测其净重见表。
分析装罐机当日工作是否正常?
编号
1
2
3
4
5
6
7
8
9
10
净重(g)
505
512
497
493
508
515
502
495
490
510
由聽意知•样本断属总体服从正怎分布•并II总休尿准誥。
二乩苻台杯检验的应用条件由于当日裳理机的每罐平均净匝可能商于或低尸正常工作状态下的标准净(战需作两尼检轨其育法修廉如八
1提岀假设.
汕屮=严=500gt即谏日装雄机毎雄平均净航与标准净朮一样.
7*•即该H装锻机的誓耀平均净重与标能净巫不同、装・
2确定址着水平.住00.05(两胚槪率几
3检购计算.
1IT*fb~|J.ftA-皿4\"I-\MWpUJLJIIvavffmv
均数标准误6二刃心=8"!
币=2.530
统计駄u值7-500)/2.53=k067
4统计推断亠由显著水平期=0.05査附表2得临界“值;%□=!
.9亿
由于实得|«|=L06?
0.05,故不能否定推断该百襄薙平药净直与标准净重芹界不显著■表明该日装罐机工作属正常状态。
2)单个样本平均数的t检验:
t检验:
在假设检验中利用t分布来进行统计量的概率计算的检验方法。
两个样本平均数的假设检验:
由两个样本平均数之差,去判断这两个样本所在的总体平均数有无显著差异。
成组资料平均数的假设检验:
1)U检验
1、如果两个样本资料都服从正态分布,且总体方差拧和二2已知。
2、总体方差未知,但两个样本都是大样本时,平均数差数的分布呈正态分布。
ijfflk£护暫U.J-HMF"+章~下
由【例4幻说轧W讥陈50。
恥理舉用-种新工
[例询用山播加工果嘛传噪I:
艺"禅1°°吧"」」f标准筮$.12,闽斯艺进存側工•测定了诃次•得毎耳山检出果冻$均数为u
工艺科100只山権出采冻址与传堰匸艺杠尢金辛氐累[埔同作』检齡亠柠臓涉W如厂
本例中总体右差”耒知*文垦水样卑•资料也星从正态分布・故m
乩卄糊=500"莎旧工艺蒔!
心山检出泉冻就I理孔
屮工円,即浙、旧工艺邮100輕山植出果冻■有差鼻.
②确定星善水平*&=0,01(两虧槪率匚
均敷标准溟S,-S/V»=12//16=3
貌计麓f值i=(X-^)/S,^(520-500)/3=6.667…
自由度町=用一1-16—】=15
④城计推斷.由自由度刃=W和显着水平0-01査附衷3得临界£值茲晰沽严£947.
由于实得"丨=6.667A/$.tnisji=2.947,故/>三的每100R山持出怡*胡丿井股显号•亦即采用新工艺可提高每100g山権出呆冻詁
2)t检验
1.如果两个样本资料都服从正态分布,且-1=^1时,不论是大样本还是小样本,都有下式服从具有
自由度df=ni+n2-2的t分布:
t=上匚卫―乙。
S—-
Xi必
【例4-5J海关检查某罐头厂生产的出口红烧花蛤罐头时发现,虽然罐头外规无胖听现象,但产品存在质量问题・于是从该厂随机抽取6个样品,同时随机抽取6个正常罐头测定其SO宇含量*测定结果如表4-3所示。
试检验腐种罐头的S(J?
含量是否有差异°
嗣ml
102+5
133,5
義4-3正常罐头与异常罐头SO』含.
正常罐头100.094*29&599.2
异常罐头(竝)130.2131,3130.5135.2
1建立假设乜
比讣=附,即两种罐头的SO,含量没有差异。
Ha心工阳*即两种罐头的SQ含量有差异。
2确定显著水平.口=0-01(两尾概率人
屁=59*767
S;=42.875
窃5=Jg+£巫■二』59・⑶犯+亿盯5/30=1.849
u=(^-^2-<65.833-59.767)/lt849-3,2S1-
④统计推新。
由0.01査附表?
得⑷e=?
品由于实际5U乳誓二;冷产纬故心皿应否定论接受Hz这说明两条生产线的日平均产量有极显著差和甲王厂袈日均产最高于乙生产线日均产量。
…一C3亠轴
3检验计算。
X|=98.467
Sf=8.327
吾=132,650
S;=5.235
本例的两个样本容量相等(山=71严6),所以:
f=7(Sf+Sf)/n=VC&327+5.235)/6=L503
f=(Tr一屁)/5.r.=(98.467-132.65)/1.503=_22・743
df=2(/t—1)—2X(6—1)=io
4统计推断.由_好=10和a-0.01查附表3得=3.169.由于实得:
/|=洗・心35:
丽=3.164故PV0.01,应否定接受即两种罐头的含量差异极显著。
异常的罅头0、含竜高于正常的•该批罅头已被硫化腐败菌感染变质。
二、成对资料平均数的假设检验:
【例4N】为研究电淫处理对草蔣果实屮钙离子含掀的彰响.选用10个览轟品种采进行
电灌处理与对照的对比试验•结果见a4-5,问电渗处理对祇特钙离子含*建否有影响?
表4-5电港处理草毒樂实钙鶴子含■
项目
1
2
3
4
5
6
7
8
9
10
电渗处理mg
22,23
23.42
23+25
21.38
24*45
22,42
24.37
21.75
19,82
22.56
对照(卍】mg
18,.04
20.32
19.64
16.38
2L37
20.43
18.45
20.04
17.38
18.42
差数一孔]mg
4・19
3.10
3.61
5.00
3,08
1.99
5.92
1.71
2.44
4.14
本例因每个品种实施了一对处理,所以试验资料为成对资料。
1建立假设°
血:
知=0・即电渗处理后草莓果实钙离子含量与对照的钙离子含量无差异。
H,:
屮H0*即电渗处理后草莓果实钙离子含量与对照的钙离子含量有差异・
2确定显著水平°口=乩01(两尾概率儿
3检验计算口
工d=4.19+3*10+…+4*14—35・18°
丫十=4.19?
+3.10’十…+4.142=139.708
d=,t/j?
n=35.18/10—3.518
Sj=\[工龙一(另乩严/乳]/〔皿一
=V(139.708-35.lS'/lOJ/LWXIW-1)J=()•421
i=dSj—3,518/0.421=8.356
值得皿心=3価5由于实得“1=&356二,认为电渗处理后草莓果实钙离子含量与对用
Q="—1=10—1=9
安人1统计推断。
由df=9和口=041査临界I
的钙离子含址差异极显著,即电渗处理能提高草莓果实钙离寸占就
%計舍=3,250.故p<0.0h应否定接受Ha
72.二项百分率的假设检验
1)单个二项百分率的假设检验
。
【例4胡某擞生物制品的企业标准为倚害做t物不准超过1%5匚现从一批产品中轴岀500件心),发现有害微生物超标的产品有7件J儿问谏批4品是否合格?
八本例关心的是该批产品中有害徽牛物是沓超标•向低于命业标准的都属于合格”所以本例采用一尾检验<,
1提出假设口
凤沖0=1%,即该批产品的有害微生物百分率未超企业标准*产品为合札Haw,即该批产品的有害微生物百分率超过了企业标检产品为不合札
2确定显著水平。
«=05(一尾概率儿
3检验计算°
$=工/乳=了/500=0・014
Cp=j/po(1po)/n=^0.01X(1—0.01)7500=0,00445m=Ip—Pdg=(0・014—0.01)/0,00445=0*的9
4统计推斯“由…尾概率a-0.05査附表2得一尾临界玮值%曲_窃=斑“胆=匕64氣由于实得|w|=0.899<^.,>.«>=1.645,所以/>>0.05,接受可以认为该批产品达到了企业标准•为合格产品.直曲
2)单个二项百分率的假设检验
他辿小包装贮藏葡萄试验*裝人規料袋不加保鲜片的葡萄詰5粒个月后发现有25粒©门菊萄腐烂;装人塑料袋并加保鲜片的葡萄5&8粒(叫―】个月后发现腐烂葡葡20粒(去人问加保鲜片与不加保鲜片的两种贮藏葡萄的腐烂率是否有显著差异?
1提岀假设。
H“:
曲=憩,即两种贮藏葡萄的腐烂率没有差异'也即两种方法的保鲜效果一致。
即两种贮藏葡萄的腐烂有差异•也即两种方法的保鲜效果不一致。
2确定显著水平。
左=0.05』.01(两尾概率儿
3检验计算。
Pi=25/385=60649
几=為/炖=肌/598=0・0334
万=(町+心)/(耐+打j=45+20)/(箱5+598)=0.0458
①rQ丿0(】一刃(#■+右)=Jo*0458X(1—0*0458)(磊+拓j=0*0137
4统计推断“由a=0-05和口=乩01査附表2猖临界曰值uo^=l-96.«r)t>i=2.58.因为实得L96氏代~r^
第五早
73.方差分析(变量分析):
关于观测值变异原因的数量分析。
(三个或三个以上水平的分析,小于3个用t检验。
)
74.试验设计的作用:
1.可以分析清楚试验因素对试验指标影响的大小顺序,找出主要因素,抓住主要矛盾2.
可以了解试验因素对试验指标影响的规律性3.可以了解试验因素之间相互影响的情况4.可较快地找出优化的
生产条件或工艺条件,确定优化方案5.可以正确估计、预测和有效控制、降低试验误差,提高试验精度6.可
以明确为寻找更优生产或工艺条件、深入揭示事物内在规律而进一步研究的方向。
75.试验指标:
根据研究目的而选定的用来衡量或考核试验效果的质量特性。
如:
考察加热对果胶酶活性的影响,果
胶酶活性是试验指标。
(单指标试验,多指标试验)
76.试验因素:
凡对试验指标可能产生影响的原因或要素。
如■酱油质量受原料、曲种、发酵时间等的影响,这些都
是影响酱油质量的因素。
77.因素水平:
试验因素所处的某种特定状态或数量等级。
女口:
比较3个大豆品种蛋白质含量高低,这3个品种就是
大豆品种这个试验因素的三个水平
78.试验处理:
事先设计好的实施在实验单位上的一种具体措施或项目。
女口:
单因素试验中,试验因素的一
个水平就是一个处理多因素:
水平组合
79.
平方和与自由度分解:
设一个试验共有k个处理n个重复,则该试验资料共有nk个观测值,其数据分组如
(叭一兀屮(5-1)
r*■Jj-I
+冲亍〜]跡*
因为SSf才”一孔=2Se(黄卜—天••)+5—龙“)了
i»Ij"1j11
#A
=S£[(芷-—耳屮4-2(X-些一蓝J+(孔—x,.
did】d■
*£«>n
=丹另(耳一TL)£+2£5*—孔)另f工“—為)+工(竝—齐)'
_dd■]—ii_j■*j■I
1i-————輛-
其中£(乜一耳)=Q
j-1
i■A*叩
所以SS5—乳「=n2―疋』+E
i*]j»a1r*I1|
-______—_二-一-_—_]二_亠
上式中的齐士(耳.一左">?
是各处理均数耳■与总平均数丘•.的离均差平方和与重复数K的桑积■反映了重上时次的处理间的变异*称为处理间平方和,记海「即
SSi=”Z(齐一无J’z
t-a
而2一"则是各处理内离均差平方和之和*反映了各处理内的变异即误差母!
文案大全山甲方村戎m匸*祁,&SI
SSt-ssY"创
80.F值:
两个方差之比。
F=St2/S;
81.F自由度:
两个。
df1=dft=k-1df2=dfe=k(n-1)
82.F检验:
用F值出现概率的大小推断两个方差是否相等的方法。
83.方差分析表:
变异来源
平方和(SS
自由度(df)
均分(MS
F值
处理间
SS
dft=k-1
MS=SS/dft
SS/SSe
处理内
SS=SS-SSt
dfe=df「dft
MS=SS/dfe
总变异
SS
dfT=nk-1
84.线性模型:
被分析的变量总体中每一个变数可以按其变异的原因分解成若干个线性组成部分。