5-精益六西格玛统计工具介绍-假设检验.pptx

上传人:精*** 文档编号:18680794 上传时间:2023-09-07 格式:PPTX 页数:143 大小:2.69MB
下载 相关 举报
5-精益六西格玛统计工具介绍-假设检验.pptx_第1页
第1页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第2页
第2页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第3页
第3页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第4页
第4页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第5页
第5页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第6页
第6页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第7页
第7页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第8页
第8页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第9页
第9页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第10页
第10页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第11页
第11页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第12页
第12页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第13页
第13页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第14页
第14页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第15页
第15页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第16页
第16页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第17页
第17页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第18页
第18页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第19页
第19页 / 共143页
5-精益六西格玛统计工具介绍-假设检验.pptx_第20页
第20页 / 共143页
亲,该文档总共143页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

5-精益六西格玛统计工具介绍-假设检验.pptx

《5-精益六西格玛统计工具介绍-假设检验.pptx》由会员分享,可在线阅读,更多相关《5-精益六西格玛统计工具介绍-假设检验.pptx(143页珍藏版)》请在冰点文库上搜索。

5-精益六西格玛统计工具介绍-假设检验.pptx

六西格玛统计工具介绍

(二)六西格玛统计工具介绍

(二)20142014年年22月月2精益六西格玛理论体系全景图客户客户流程描述流程描述控制计划控制计划测量系统测量系统控制控制过程能力过程能力分析分析多变量多变量分析分析实验设计实验设计VoC分析分析失效模式分析失效模式分析流程图流程图(I/O)因果矩阵因果矩阵统计过程统计过程控制控制定性分析定性分析定量分析定量分析头脑风暴头脑风暴+KJ失效树失效树鱼骨图鱼骨图Why-Why分析分析PFMEA对标分析对标分析访谈访谈现场调研现场调研流程观察流程观察回归分析回归分析软件使用软件使用项目管理项目管理精益六西格玛意识精益六西格玛意识统计基础统计基础精益工具精益工具基本图表基本图表精益六西格玛持续改进体系精益六西格玛持续改进体系精益六西格玛推行综合管理精益六西格玛推行综合管理3课程大纲n假设检验概述假设检验概述n相关与回归相关与回归4统计基础-数据类型n计数型数据(离散型数据,属性型数据):

通常表示事物的分类计数型数据(离散型数据,属性型数据):

通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器A,机器B,机器C白班/中班/夜班n计量型数据(连续型数据):

通常是通过测量仪器测量得到的数计量型数据(连续型数据):

通常是通过测量仪器测量得到的数据据压力时间长度重量5目录n假设检验相关基础概念假设检验相关基础概念总体参数及样本统计量推定置信区间n假设检验介绍假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T与配对T的区别n讨论及问答讨论及问答6假设检验相关基础概念n总体参数与样本统计量总体参数与样本统计量s=样本标准差X=样本平均值参数估计统计量=总体平均值=总体标准差抽样(Sampling)AABDDDCCCCBAAAAAAABBBBBBCCCCCCDDDDDDD总体标本7估计的概念n点估计:

通过抽样用一个具体的值估计总体的参数点估计:

通过抽样用一个具体的值估计总体的参数举例:

通过抽样调查中秋月饼的保质期是3个月点估计的种类:

平均的估计、标准差、方差的估计、比率的估计等n区间估计:

通过抽样用一个具体的值估计总体的参数区间估计:

通过抽样用一个具体的值估计总体的参数举例:

通过抽样调查中秋的月饼的保质期是1-6个月8置信区间n置信区间的概念(置信区间的概念(ConfidenceInterval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1-)%n置信水平(置信水平(ConfidenceLevel)是指区间估计时,能够包含总体参数的能力水平,即1-。

=0.5(50%)=0.1(10%)信赖水准信赖区间误差05.0z05.0z%90%5%5%1525.0z25.0z%50%25%259置信区间n90%的置信区间举例如下图的置信区间举例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均n95%置信区间的解释:

置信区间的解释:

大约100个置信区间中有95个会包含总体参数,或者我们有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间总体的平均样本1样本2样本1010置信区间n置信区间的计算置信区间的计算通用公式:

置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式(知道的时候):

样本的置信区间公式(不知道,只能计算S):

样本的平均遵循t分布nZX2/nStXn1,2/11置信区间nMinitab中置信区间的计算中置信区间的计算这些都可以计算出置信区间12假设检验n假设检验的目的假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。

是为了解决选择的困难性n假设检验的意义假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部门最需要的工具之一。

13假设检验n假设检验的概念假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法n假设检验术语假设检验术语假设设定:

对要进行判断的情况进行假设设定H0-NullHypothesis:

说明没有变化或者差异的设定Ha-AlternativeHypothesis:

说明有变化或者差异的设定n假设设定练习:

假设设定练习:

为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性14假设检验n假设检验的种类假设检验的种类单边检验One-sidedhypothesisOne-sidedhypothesis双边检验Two-sidedhypothesisTwo-sidedhypothesis15n假设检验的两种错误假设检验的两种错误第1种错误(TypeError,-风险)不顾NullHypothesis真实.NullHypothesis放弃的错误把良品判断为不良的时候(误判)既,可以说生产者危险1-就是置信区间第2种错误(TypeError,-风险):

不顾NullHypothesis假的.NullHypothesis接受的错误不良品当成良品的时候(漏失)即,可以说顾客危险1-是检定力,即检出能力16n假设检验的两种错误说明假设检验的两种错误说明你的判定接受接受HHoo真实情况HHoo对对HHoo错错I类错误(-风险)II类错误(-风险)正确正确正确正确拒绝拒绝HHoo17n假设检验的两种错误举例假设检验的两种错误举例陪审团的判决他无罪他无罪事实实际清白实际清白他有罪他有罪实际有罪实际有罪正确正确正确正确清白的人清白的人进监狱进监狱罪犯逍遥法外罪犯逍遥法外I类错误(-风险)后果:

II类错误(-风险)后果:

18假设检验n假设检验原理假设检验原理假设检验其实是个比较的过程两种假设的比较,是A还是B?

我们总是用H0来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0放弃H0的决策不会总是正确的,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0的决策的风险有多大?

于是我们通过抽样数据进行运算,算出放弃H0的决策的风险的大小就是我们长见的P值(P-value)19假设检验n假设检验原理假设检验原理(续续)知道了做出放弃H0的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0的决策呢?

于是我们需要提前设定一个风险判断标准而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01、0.05、0.1等但我们通常设定为0.05这也就是我们通常拿P值和0.05进行大小比较的原因。

如果P0.05接受H0;P0.05放弃H0(PLowH0Go)理解练习为什么正态检验,等方差检验P要大于0.05?

20假设检验n假设检验原理假设检验原理(续续)(SignificanceLevel)置信水平:

风险判断标准P-value做出放弃H0的决策犯错误的最大风险值p值Ho选择域选择域Ho弃却域弃却域Ho选择域选择域Ho弃却域弃却域p值P值值接受接受H0不能做决策,不能说有差异不能做决策,不能说有差异TPTTPT21假设检验n假设检验步骤假设检验步骤假设设定假设设定检定统计量选择检定统计量选择留意水准留意水准决定决定p-value计算计算(弃却域弃却域,检定统计量计算检定统计量计算)判定(统计结论)判定(统计结论)p-value0.05时Ho接受P-值0.05时Ho放弃正态数据标准偏差的置信区间一个总体两个以上的总体2Samplet(方差相等)2Samplet(方差不相等)1Samplet或者1SampleZHo:

m1=m(平均值)H1:

m1m(平均值)Stat-BasicStats-1Sample-t(s不知道时候)1SampleZ(s知道时候)1Sample-Sign或者1Sample-WilcoxonMann-WhitneyTest两个以上的总体两个母集团1-Proportion2-Proportion一个总体两个总体两个以上的总体非正态数据等方差YesNoKruskal-WallisTest一个总体一个总体两个以上的总体Ho:

M1=M2H1:

M1M2Stat-Nonparametric-Mann-WhitneyHo:

M1=M2=M3=.H1:

至少一个是不一样Stat-Nonparametric-Kruskal-WallisHo:

m1=m2H1:

m1m2Stat-BasicStats-2-Samplet“assumeequalvariances”“假定等方差选择按钮”不选择TestforEqualVariances(LevenesTest)TestforEqualVariances(FTestorBartlettsTest)Ho:

s1=s2=s3=.H1:

至少有一个不一样Stat-Anova-TestforEqualVariances两个总体比较的时候用F-testHo:

s1=s(标准差)H1:

s1s(标准差)标准差的置信区间使用Minitab路径Stat-BasicStatistics-DisplayDescriptiveStats计量型数据数据稳定性研究(控制图)配对T(PairedT)Ho:

D=0(差值)H1:

D0(差值)要对差值进行正态性检验Minitab路径Stat-BasicStatisticsPairedttest(配对T)假设检验-常用路径图23假设检验-单样本T检验24“单样本t检验”解决什么问题?

典型的问题为典型的问题为:

“我们抽取了新坐席员我们抽取了新坐席员Bob的的30通电话录音数据,想知道坐席员通电话录音数据,想知道坐席员A的话后整理时长的平均值是否刚好等于考核要求的的话后整理时长的平均值是否刚好等于考核要求的25秒?

”秒?

”当然问题也可以是“当然问题也可以是“Bob的平均整理时长大于的平均整理时长大于25秒吗?

”或秒吗?

”或者“者“Bob的平均整理时长刚好小于的平均整理时长刚好小于25秒吗?

”秒吗?

”251.建立零假设和备选假设:

平均整理时间等于目标值平均整理时间不等于目标值2.决定显著性水平:

=0.05(5%)3.随机抽取30通电话的整理时间数据作为样本4.选取适合方法计算P值(参考下页详细步骤)5.依据P值结果做出结论按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设H0n如果P值小于a,推翻零假设H0秒25:

0H秒25:

1H26选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25不是正态分布是正态分布单样本T检验单样本T检验单样本T检验先把数据转换为正态后再使用单样本T检验检验数据正态性数据不稳定应先解决稳定性问题NOYES算出P值样本数据n个27打开文件打开文件1-MakingComparison.JMP分析路线图单样本T28步骤1:

检验稳定性29步骤1:

检验稳定性我们得到什么结论?

我们得到什么结论?

是否有任何明显的变化趋势或模式,足以证明数据并非来自单一的总体/流程?

212223242526272829Bob3691215182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob的单个测量Bob的单个测量01234“Bob”的移动控制范围3691215182124273033样本平均数=1.20控制下限=0.00控制上限=3.91Bob的移动控制范围Bob的移动控制范围控制图控制图30步骤2:

检验正态性123431步骤2:

检验正态性P值值0.05,数据是正态,数据是正态32步骤3:

检验均值假设值实际估计值df标准差2524.8482290.86932检验统计量p值|t|p值tp值0.05),或者),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结说,由于均值的置信区间包含了目标值,我们可以作出下述结论:

论:

n我们没有足够的证据拒绝零假设。

我们没有足够的证据拒绝零假设。

n是否可以说零假设是正确的(是否可以说零假设是正确的(Bob的均值的均值=25秒)?

秒)?

不!

不!

n但是,我们通常在假定零假设是正确的情况下执行操作。

但是,我们通常在假定零假设是正确的情况下执行操作。

34延伸如果问题是如果问题是:

“Bob的平均整理时长大于25秒吗?

”或者“Bob的平均整理时长刚好小于25秒吗?

”如何构造零假设和备选假设?

你的结论是什么?

如何利用刚才的结果?

35假设检验-双样本t检验36“双样本t检验”解决什么问题?

典型的问题为典型的问题为:

“我们各抽取了坐席员我们各抽取了坐席员Bob和和Jane的的30通电话样本,想知道坐通电话样本,想知道坐席员席员A和和B的平均话后整理时长是否的平均话后整理时长是否相等相等?

”?

”当然问题也可以是“当然问题也可以是“Bob的平均整理时长的平均整理时长大于大于Jane的平均整理的平均整理时长吗?

”或者“时长吗?

”或者“Bob的平均整理时长的平均整理时长小于小于Jane的平均整理的平均整理时长吗?

”时长吗?

”371.建立零假设和备选假设:

Bob的平均值等于Jane的平均值Bob的平均值不等于Jane的平均值2.决定显著性水平:

=0.05(5%)3.随机抽取Bob和Jane各30通电话的整理时间数据作为样本4.选取适合方法计算P值(参考下页详细步骤)5.依据P值结果做出结论按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设H0n如果P值小于a,推翻零假设H0JaneBob:

1HJaneBob:

0Hmmm=m38选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n2539样本量n在获取数据并试图得出一些陈述之前在获取数据并试图得出一些陈述之前,我们需要确定进行这种检我们需要确定进行这种检验数要多少数据验数要多少数据.n记住记住,我们有一些基于估计值的抽样“经验方法我们有一些基于估计值的抽样“经验方法RulesofThumbn并不要求并不要求Bob和和Jane的两组样本量一定是相同的的两组样本量一定是相同的n注意注意:

我们将在以后的模块中讲解样本量的计算我们将在以后的模块中讲解样本量的计算40工具或统计工具或统计最小样本量最小样本量平均值5-10标准偏差25-30有缺陷的比例(P)100并且nP=5直方图或帕累托图50散点图25控制图20不同工具的样本量通常:

连续数据:

30属性数据10041步骤1:

检验稳定性42步骤1:

检验稳定性212223242526272829Bob3691215182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob的单个测量Bob的单个测量01234“Bob”的移动控制范围3691215182124273033样本平均数=1.20控制下限=0.00控制上限=3.91Bob的移动控制范围Bob的移动控制范围2223242526272829Jane3691215182124273033样本平均数=25.45控制下限=22.89控制上限=28.00Jane的单个测量Jane的单个测量-0.50.00.51.01.52.02.53.03.5“Jane”的移动控制范围3691215182124273033样本平均数=0.962控制下限=0.000控制上限=3.143Jane的移动控制范围Jane的移动控制范围43步骤2:

检验正态性12344步骤2:

检验正态性45步骤2:

检验正态性位置离差类型类型参数参数25.4460730.9880899估计估计25.0771140.786921795%下限95%下限25.8150321.328304395%上限95%上限参数估计参数估计Shapiro-WilkW检验0.974329WW0.6630p值Wp值W注:

Ho=数据来自正态分布。

小p值拒绝Ho。

拟合优度检验拟合优度检验正态拟合正态拟合位置离差类型类型参数参数24.8482070.8693181估计估计24.5235980.692330995%下限95%下限25.1728151.168637595%上限95%上限参数估计参数估计Shapiro-WilkW检验0.932453WW0.0571p值Wp值W注:

Ho=数据来自正态分布。

小p值拒绝Ho。

拟合优度检验拟合优度检验正态拟合正态拟合数据是否为正态分布?

小P-Value(Fp值F2.4882t检验t检验等方差检验等方差检验EqualVarianceNotequalvariance方差不等时的解决方法50步骤4:

均值检验51Ho:

Mean(Bob)=Mean(Jane)Ha:

Mean(Bob)=Mean(Jane)步骤4:

均值检验232425262728整理时长BobJane坐席员R平方调整R平方均方根误差响应均值观测值(或权重和)0.0964490.0808710.93060125.1471460拟合汇总拟合汇总Jane-Bob假定方差相等差分差的标准误差差的置信上限差的置信下限置信0.597870.240281.078840.116890.95t比率DFp值|t|p值tp值t2.488207580.0157*0.0079*0.9921-0.8-0.40.00.40.8t检验t检验我们得到什么结论我们得到什么结论?

52结论的陈述n由于由于P值小于临界置信水平(本例中值小于临界置信水平(本例中P=0.01570.05,我们可以,我们可以作出下述结论:

作出下述结论:

n我们有足够的证据拒绝零假设我们有足够的证据拒绝零假设如果问题是如果问题是:

“Bob的平均整理时长大于Jane的平均整理时长吗?

”或者“Bob的平均整理时长小于Jane的平均整理时长吗?

”53假设检验多样本比较54n假设检验用于比较假设检验用于比较2个或更多个或更多数据样本的数据样本的均值均值nANOVA检验陈述的原假设(检验陈述的原假设(nullhypothesis)是所有样本的均)是所有样本的均值都相同值都相同Ho:

a=b=c=d=enANOVA检验陈述的备择假设(检验陈述的备择假设(alternatehypothesis)是至少)是至少有一个均值是不同的有一个均值是不同的Ha:

至少一对至少一对是不同的是不同的方差分析ANOVA55“方差分析(ANOVA)”解决什么问题?

典型的问题为典型的问题为:

“我们各抽取了坐席员我们各抽取了坐席员Bob,Jane和和Walt的各的各30通电话样本,通电话样本,想知道坐席员的平均话后整理时长是否想知道坐席员的平均话后整理时长是否相等相等?

”?

”561.建立零假设和备选假设:

Ho:

Bob=Jane=san三个坐席员的平均值彼此相等Ha:

至少一对是不同的至少一个坐席员得平均值和其他人不同2.决定显著性水平:

=0.05(5%)3.随机抽取Bob和Jane各30通电话的整理时间数据作为样本4.选取适合方法计算P值(参考下页详细步骤)5.依据P值结果做出结论按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设H0n如果P值小于a,推翻零假设H057选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n2558步骤1&2不再重复n步骤步骤1:

稳定性检验:

稳定性检验分别使用控制图检验三名坐席员样本数据的稳定性n步骤步骤2:

正态性检验:

正态性检验分别使用分布图检验三名坐席员样本数据的正态性59堆叠数据数据变换60步骤3:

等方差检验610.00.20.40.60.81.0标准差BobJaneWalt座席员BobJaneWalt水平水平303030计数计数0.86931810.98808990.9806127标准差标准差0.72742580.78016180.8059338均值的绝对差的平均均值的绝对差的平均0.70814670.77818000.8023567中位数的绝对差的平均中位数的绝对差的平均OBrien.5Brown-ForsytheLeveneBartlett检验检验0.34790.22920.17060.2863F比率F比率2222分子自由度分子自由度878787.分母自由度分母自由度0.70710.79570.84340.7510p值Fp值FWelch方差分析检验均值是否相等。

该法允许标准差呈不等44.7405F比率F比率2分子自由度分子自由度57.786分母自由度分母自由度Fp值F等方差检验等方差检验Ho:

s(Bob)=s(Jane)=s(Walt)Ha:

至少一对至少一对S不相等不相等步骤3:

等方差检验我们得到什么结论我们得到什么结论?

P-值!

62步骤4:

均值检验6323242526272829处理时长BobJaneWalt座席员R平方调整R平方均方根误差响应均值观测值(或权重和)0.5071620.4958320.94756525.7927490拟合汇总拟合汇总座席员误差C.合计来源来源28789DFDF80.3858178.11547158.50128平方和平方和40.19290.8979均方均方44.7643F比率F比率Fp值F方差分析方差分析BobJaneWalt水平水平303030数值数值24.848225.446127.0839均值均值0.173000.173000.17300标准误差标准误差24.50425.10226.74095%下限95%下限25.19225.79027.42895%上限95%上限标准误差使用合并的误差方差估计值单因子方差分析均值单因子方差分析均值单因子方差分析单因子方差分析处理时长关于座席员的单因子分析处理时长关于座席员的单因子分析Ho:

Mean(Bob)=Mean(Jane)=Mean(Jane)Ha:

至少有一对均值不相等至少有一对均值不相等步骤4:

均值检验我们得到什么结论我们得到什么结论?

64步骤4:

均值检验从左侧圆环可以观察从左侧圆环可以观察到相互之间是否相等到相互之间是否相等23242526272829处理时长BobJaneJaneWalt座席员每对比较t统计量0.0565ANOVA:

我们了解到什么?

n有一个操作员与其它操作员之间存在差异有一个操作员与其它操作员之间存在差异n同样我们可以从菱形图看到同样我们可以从菱形图看到,Walt用的时间比其它两位操作员用用的时间比其它两位操作员用的长一些的长一些n现在我们需要问“为什么现在我们需要问“为什么?

”n致使长于整体周期的根源是致使长于整体周期的根源是CWalt么么?

n你将如何找到答案你将如何找到答案?

66假设检验-非正态(非参数检验)67Mann-Whitney检验n查看工作表查看工作表2-Non-NormalShipping中的数据中的数据n我们希望了解在周末和工作天期间发货的时间是否有差异我们希望了解在周末和工作天期间发货的时间是否有差异n遵循分析路径图研究稳定性研究形状研究散布(离散程度)68研究稳定性-3-2-101234567

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 临时分类 > 批量上传

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2