六西格玛数据分析技术.pptx

上传人:精*** 文档编号:18684272 上传时间:2023-09-08 格式:PPTX 页数:344 大小:12.99MB
下载 相关 举报
六西格玛数据分析技术.pptx_第1页
第1页 / 共344页
六西格玛数据分析技术.pptx_第2页
第2页 / 共344页
六西格玛数据分析技术.pptx_第3页
第3页 / 共344页
六西格玛数据分析技术.pptx_第4页
第4页 / 共344页
六西格玛数据分析技术.pptx_第5页
第5页 / 共344页
六西格玛数据分析技术.pptx_第6页
第6页 / 共344页
六西格玛数据分析技术.pptx_第7页
第7页 / 共344页
六西格玛数据分析技术.pptx_第8页
第8页 / 共344页
六西格玛数据分析技术.pptx_第9页
第9页 / 共344页
六西格玛数据分析技术.pptx_第10页
第10页 / 共344页
六西格玛数据分析技术.pptx_第11页
第11页 / 共344页
六西格玛数据分析技术.pptx_第12页
第12页 / 共344页
六西格玛数据分析技术.pptx_第13页
第13页 / 共344页
六西格玛数据分析技术.pptx_第14页
第14页 / 共344页
六西格玛数据分析技术.pptx_第15页
第15页 / 共344页
六西格玛数据分析技术.pptx_第16页
第16页 / 共344页
六西格玛数据分析技术.pptx_第17页
第17页 / 共344页
六西格玛数据分析技术.pptx_第18页
第18页 / 共344页
六西格玛数据分析技术.pptx_第19页
第19页 / 共344页
六西格玛数据分析技术.pptx_第20页
第20页 / 共344页
亲,该文档总共344页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

六西格玛数据分析技术.pptx

《六西格玛数据分析技术.pptx》由会员分享,可在线阅读,更多相关《六西格玛数据分析技术.pptx(344页珍藏版)》请在冰点文库上搜索。

六西格玛数据分析技术.pptx

SSMC六西格玛数据分析技术六西格玛数据分析技术SSMC目录课程概要第1章基本统计概念第2章概率及其应用第3章管理中常见的几个概率分布第4章参数估计第5章假设检验第6章离散数据的卡方检验第7章方差分析第8章相关分析与一元回归第9章多元回归分析退出放映SSMC课程概要l课程要点l培养对象l欲达目的l课时安排返回目录SSMC课程要点1.数据收集与整理描述2.概率及其在质量管理中的应用3.质量管理中常见的几个概率分布4.参数估计及其应用5.假设检验及其应用6.离散数据的卡方检验7.方差分析及其应用8.相关分析与一元回归9.多元回归及其应用返回目录SSMC培养对象开展六西格玛管理项目的黑带及黑带大师候选人和掌握统计技术与方法应用的人。

返回目录SSMC欲达目的通过本课程的学习你将达到:

1.理解统计数据分析主要方法的基本理论2.树立起六西格玛管理的统计思想3.掌握了基本统计方法在管理中的应用4.能熟练运用Minitab软件实现数据分析5.建立起运用统计方法解决管理问题的能力返回目录SSMC课时安排(36课时)第1章基本统计概念4课时第2章概率及其应用4课时第3章管理中常见的几个概率分布4课时第4章参数估计4课时第5章假设检验4课时第6章离散数据的卡方检验4课时第7章方差分析4课时第8章相关分析与一元回归4课时第9章多元回归分析4课时返回目录SSMC第1章基本统计概念1.1常用数据分析技术概述1.2总体与样本1.3数据的收集1.4数据的类型1.5数据集中趋势的测度1.6数据离散程度的测度1.7数据基本分析的软件实现小组讨论与练习返回目录SSMC本章目标1.理解数据分析在6管理中的重要意义2.理解几个常见的统计概念3.树立企业管理人员量化管理的统计意识4.掌握几种不同平均数的计算方法5.掌握标准差和变异系数的计算方法返回目录SSMC1.1常用数据分析技术概述界定界定Define量测量测Measure分析分析Analyze改进改进Improve控制控制Control量测所得量测所得各种数据各种数据Data返回目录SSMC数据分析的意义界定界定Define量测量测Measure分析分析Analyze改进改进Improve控制控制Control6管理目标管理目标顾客满意顾客满意返回目录SSMC可靠的数据及分析是解决问题的根本管管理理中中的的问问题题如何解决如何解决现在的问题现在的问题确认问题确认问题设计量测指标设计量测指标选择收集数据的方法选择收集数据的方法获得数据获得数据分析数据分析数据历史的历史的近期的近期的最新的最新的得到分析结果得到分析结果制定解决方案制定解决方案决策及行动决策及行动返回目录SSMC1.2总体与样本总体这个企业员工的月平均收入是多少?

信息由样本信息作为总体信息估计值从总体中抽取一小部分样本返回目录?

Xniinxx1/xSSMC总体、个体与样本、样品总体(population):

把研究的一类对象的全体称为总体。

个体(individual,item):

把构成总体的每一个成员称为个体。

样本(sample):

从总体中抽出的部分个体组成的集合称为样本。

样品:

样本中包含的个体成为样品。

样本容量(samplesize):

样本中包含的个体的数量称为样本容量,通常用n表示。

返回目录SSMC1.3数据的收集6管理是一种科学的量化管理没有数据就没有管理没有数据的统计分析就等于无米之炊数据资料的来源有两种:

原始资料和二手资料抽样是企业管理中收集数据的最普遍方法宏观数据资料的获取主要依赖于各种统计年鉴和咨询顾问公司返回目录SSMC关于抽样方法概率抽样和非概率抽样概率抽样(随机性原则)非概率抽样配额抽样简单随机抽样(simplerandomsampling)分层抽样(stratifiedsampling)整群抽样(clustersampling)等距抽样。

又称系统抽样(systematicsampling)返回目录SSMC1.4数据的类型6管理中通常遇到两种类型的数据:

定性数据定性数据定量数据定量数据定类数据定类数据定序数据定序数据计量数据计量数据计数数据计数数据数据是决策的依据返回目录SSMC定量数据定定量量数数据据计量数据计量数据计数数据计数数据返回目录SSMC计量数据连续型数据怎样获得计量数据连续型数据连续型数据连续型数据连续型数据返回目录SSMC计数数据离散型数据计数或事件发生的频率:

如,顾客满意度调查中不满意的人数。

需要较大的样本量,以更好地描述产品或服务的某种特性。

满意的和不满意的人数就是数出来的满意的和不满意的人数就是数出来的瓷砖中的斑点数瓷砖中的斑点数返回目录SSMC变量、参数和统计量变量是说明和描述事物某种特征的指标变量的种类参数统计量变量的种类变量的种类分类变量分类变量顺序变量顺序变量数值型变量数值型变量随机变量随机变量连续型随机变量连续型随机变量离散型随机变量离散型随机变量返回目录SSMC1.5数据集中趋势的测度反映样本位置的统计量样本均值设有样本数据就是样本均值样本中位数:

将样本数据按从小到大排序后,处于中间位置上的数就是中位数。

返回目录xnxxx,.,21niixnx11xSSMC加权算术平均数加权算术平均数其中为的权重(weight),表示在数据集中所占的比重,而当权重相同,即时加权算术平均数即为简单算术平均数。

返回目录niiixx1iixixniii10;1nini,.,2,1,1SSMC几何平均数将所有n个数连乘,然后开n次方,即其中:

代表几何平均数,为连乘符号当n2时,为了方便计算可采用对上式两边取对数的方法计算:

几何平均数一般用于计算在一段时间内有复式增长的数据的均值几何平均数(geometricmean)注意注意返回目录nxxx,.,21nniinngxxxxx121.gxniingxnxxxnx121log1)log.log(log1logSSMC几何平均数(续)几何平均数适用于计算在一段时间内有复式增长的数据的均值情况。

这在企业中要经常用到。

如企业成长10年来每年有个增长率,试计算这10年的平均增长率;1995年2004年每年有个国内生产总值GDP的增长率,求1995年到2004年的平均增长率。

例:

某投资者于2000年、2001年、2002年及2003年的持有期回报(HPR)分别为1.2、1.3、1.4及0.8。

试计算该投资者在这四年内的平均持有期回报。

解:

利用几何平均数计算持有期回报:

平均该投资者平均每年持有期回报为1.1497。

如果该投资者在2000年初投资额为100,那么到2003年底,他的财富将成为。

返回目录1497.18.04.13.12.14HPR4.174$1.1497$1004SSMC1.6数据离散程度的测度一批统计数据相对它的均值而言,这些数据的离散程度如何?

数据波动的统计量通常有三种:

样本方差与样本方差与样本标准差样本标准差数据波动的统计量极差极差变异系数变异系数返回目录SSMC极差(range)极差的计算简单,它是一种最简单的度量离散程度的方法。

极差的缺点也很明显,因为它只考虑了极端值,丢失的数据信息较多。

现在的社会居民收入分配相差很大,这对社会稳定很不利。

极差让我们可以更清醒地认识到贫富差距。

所以极差还是很有意义的一个统计量。

一组数据中的最大值与最小值之差称为极差,用R表示。

极差的计算十分简单,如某企业中员工的最大月收入是12000元,最低月收入是800元,则R1200080011200(元)返回目录SSMC方差与标准差总体方差总体标准差样本方差样本标准差实际应用中常用样本标准差作为总体标准差的估计值。

方差不能带量纲(单位),这样就得不到合理解释;只有标准差才能带单位。

返回目录NXXNii122)

(1)(12nxxsnii1)(122nxxsniiNXXNii12)(SSMC均值与标准差概念的直观理解设有两组样本数据分别为:

2、4、6、8、104、5、6、7、8把这两组数据分别标在下面的直线轴上0024681045678返回目录SSMC均值与标准差概念的直观理解(续)第一组数据的第二组数据的由这两组数据的均值和标准差,结合上面的图形,我们可以直观地看到这两组数据均以6为中心,但前面5个数的离散程度要大于后面5个数的离散程度。

第一组数的标准差是3.16,第二组数的标准差1.58。

这个例子让我们更直观地体会到标准差以及均值的意义。

返回目录16.34)610()68()66()64()62(22222s6)108642(51x6)87654(51x58.14)68()67()66()65()64(22222sSSMC变异系数例13:

设有甲、乙两个企业,他们职工月奖金的平均数及标准差如下(单位:

元)试问甲、乙两个企业哪个企业职工的月平均奖金相差较大?

你怎么判断这个问题,你的答案是什么?

乙:

甲:

返回目录10,100sx6.9,80sxSSMC1.7数据基本分析的软件实现StatBasicStatisticsDisplayDescriptiveStatisticsStoreDescriptiveStatistics返回目录SSMC基本输出结果1DisplayDescriptiveStatistics在绘图窗口的输出分布图箱形图置信区间返回目录SSMC基本输出结果2DisplayDescriptiveStatistics程序输出窗口StoreDescriptiveStatistics在工作表中的结果输出关于身高数据的统计量分析返回目录SSMC小组讨论与练习1.试举本企业中关于总体、样本、个体和样品的例子。

2.试举实际问题中哪些数是连续型数据,哪些数是离散型数据。

3.某企业2000年到2003年的销售收入增长率分别是15、20、23、28,请问这四年的销售收入平均增长是多少?

4.从某啤酒厂的一批瓶装啤酒中随机抽取了10瓶,测得装量分别为:

(单位:

ml)640、639、636、641、642、638、639、643、636、639试计算样本均值与样本标准差。

5.从某厂生产的两种不同规格的车轴中,各随机抽取了20根,测得它们的直径的均值与标准差分别为甲产品乙产品试问哪种产品的质量波动大?

返回目录mmsmmx01.1,40mmsmmx1.2,120SSMC第2章概率及其应用2.1掷骰子的游戏2.2概率及概率的计算2.3概率的性质与运算法则2.4条件概率2.5独立性2.6全概率公式2.7贝叶斯公式2.8概率树小组讨论与练习返回目录SSMC本章目标1.理解随机事件及其概率的基本思想2.掌握概率的性质与运算法则3.理解条件概率与事件的独立4.理解优质产品不是检验出来的理念5.掌握全概率公式和贝叶斯公式的应用6.会运用概率树解决有关问题返回目录SSMC2.1掷骰子的游戏u一枚骰子掷下去后点数为1、2、3、4、5、6各出现的可能性有多大?

u我们大家都知道一枚骰子掷下去后,各个点数出现的机会均等,每个点数出现的可能性都是1/6。

可能出现的点数可能性大小1/61/61/61/61/61/6返回目录SSMC一个顾客的期望u设有一对完全相同的骰子,把这一对骰子随机掷下,一对骰子两两组合的点数最多出现11种结果,这种结果的组合点数可能是2、3、4、5、6、7、8、9、10、11、12。

u有位顾客,仅仅需要能两两组合成4、5、6、7、8、9、10、11的结果。

请问能使这位顾客期望实现的概率有多大?

不能使这位顾客满意的风险是多大?

返回目录SSMC骰子骰子2点数组合点数组合骰子骰子1一对骰子出现的全部组合有多少?

234567345678456789567891067891011789101112返回目录SSMC骰子骰子2每个组合每个组合的概率的概率骰子骰子1一共有36个组合,每个组合出现的概率是1/36=0.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.02780.0278u骰子骰子11与骰子与骰子22分别出现任何给定值的概率都等于分别出现任何给定值的概率都等于1/6u任一给定组合发生的概率任一给定组合发生的概率返回目录0278.06161SSMC2.2概率及概率的计算u古典概型随机事件常用大写的英文字母A、B、C等表示。

随机事件A的概率,用P(A)表示u统计概型其中:

n表示相同情况下试验的次数,m表示某事件A出现的次数,比值m/n称为事件A发生的频率。

返回目录nmAAP事件个数样本空间所包含的基本数所包含的基本事件的个事件)(pnmAP)(SSMC计算组合点数出现的概率出现的组合点值组合个数(m)概率210.0278320.0556430.0833540.1111650.1389760.1667850.1389940.11111030.08331120.05561210.0278返回目录SSMC能使那位顾客满意的程度有多大?

返回目录2345678910111202%出现的组合点数概率8.34%LSLUSL2.78%4%8%6%16%14%12%10%18%SSMC2.3概率的性质与运算法则u概率的公理化定义在研究随机现象中,把表示随机事件A发生的可能性大小的实数称为该事件的概率,用P(A)表示。

前苏联的柯莫哥洛夫于1933年给出如下的概率公理化定义:

1.非负性:

对任一随机事件A,有2.规范性:

必然事件的概率为1,而不可能事件的概率为0,即3.可加性:

如果A与B是两个互不相容事件(互斥),则返回目录0AP)

(1)(P0)(P)()()(BPAPBAPSSMC概率的性质与计算u由概率的公理化定义不难得到概率的其它许多性质,如:

图图1BA返回目录互为对立事件。

与其中AAAPAP.)

(1)(1退化为可加性公理。

此性质互不相容时,与当所示。

如图与事件事件,PABPBABAABPBPAPBAP2.0)()

(1)()()()(SSMC2.4条件概率u在现实世界中,任何随机试验都是在一定条件下进行的。

这里我们要讨论的条件概率,则是当试验结果的部分信息已知(即在原随机试验的条件下,再加上一些附加信息)。

例如当某一事件B已经发生时,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为P(A|B)u由于增加了新的条件(附加信息),一般来说,P(A|B)P(A)。

返回目录SSMC乘法公式u由前一页最后的结果,我们看到条件概率有如下的计算公式:

即条件概率可由两个无条件概率之商来计算。

o对上边的公式变形,即得此公式就是所谓的概率乘法公式。

o如果将A、B的位置对换,这时有P(BA)=P(B|A)P(A),而P(AB)=P(BA),于是公式

(2)与(3)统称为概率的乘法公式。

返回目录

(2)()()(BPB|APABP)1()()()()(0BPBPABPB|AP(3)()()(APA|BPABPSSMC一个例子u例24:

设有1000件产品,其中850件是正品,150件是次品,从中依次抽取2件,2件都是次品的概率是多少?

解:

设Ai表示“第i次抽到的是次品”,i=1,2,所求概率为P(A1A2)。

因为即抽到工件都是次品的概率是2.24%。

运用乘法公式可得返回目录AAP,AP1999149)|(1000150)(120.02249991491000150)|()()(12121AAPAPAAPSSMC2.5独立性u在使用概率的乘法公式时,一般都要计算概率,但是在事件A与B独立的情况下,乘法公式就会变得简单。

u什么是独立事件呢?

一般认为,两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称这两个事件相互独立。

当两个事件相互独立时,其条件概率等于无条件概率,即我们甚至可以用这一公式来判断A、B两个事件是否独立!

因此,当两个事件相互独立时,其乘法规则可以简化为:

返回目录BPA|BP,APB|AP)()()()()()()(BPAPABPSSMC产出合格率的计算o某种产品的生产流程由两道主要工序组成。

每一道工序的最终生产合格率都是99%,那么,整个生产过程的产品合格率是多少?

99%99%=98%因为两道工序是独立的,每件产品都要通过这两道工序加工,这符合乘法原则。

因此,生产过程的产品合格率是98%。

99%99%98%工序工序1工序工序2返回目录SSMC优质产品的生产靠检验吗?

企业如何提高产品合格率和优等率?

例如生产家具的流程有制板、喷漆、安装三道工序,合格率和优等率如下表所示:

制板喷漆安装按成品合计按过程合计合格率(%)9595950.953100=8686优等率(%)9090900.903100=7373返回目录SSMC每道工序都应严格检验吗?

可见,增加工序检验的效果只是提高了按成品合计的合格品率,付出的代价是:

第一,按生产过程的合格率仍然很低,只有86%,浪费巨大,成本增高;第二,优等品率仍然只有73%,产品在市场上只能是质低价廉。

现在第一和第二道工序间及第二和第三道工序间增加检验,把不合格品剔除,得制板喷漆安装按成品合计按过程合计检验前合格率(%)9595958686检验后合格率(%)100100959586优等率(%)9090907373返回目录SSMC提高流程能力才是根本!

,可见产品的质量是制造(设计)出来的,不是检验出来的!

如果提高过程能力,不设检验制板喷漆安装按成品合计按过程合计合格率(%)9999999797优等率(%)9898989494返回目录SSMC2.6全概率公式u全概率公式主要用于计算较为复杂情形随机事件的概率。

u全概率公式实质上是加法公式和乘法公式的综合运用和推广。

u例26:

某车间用甲、乙、丙、三台机床进行生产,各台机床加工零件的次品率分别是5%,4%,2%,它们各自的零件分别占总产量的25%,35%,40%。

三台机床生产的零件混在一起,求任取一个零件是次品的概率。

管接头镗孔机床管接头镗孔机床返回目录SSMC例26的求解u令A1表示“零件来自甲台机床”,A2表示“零件来自乙台机床”,A3表示“零件来自丙台机床”,B表示“抽取到次品”。

u则事件发生当且仅当下列三种情形任意出现一种:

1.是甲机床生产的零件且为次品(A1B);2.是乙机床生产的零件且为次品(A2B);3.是丙机床生产的零件且为次品(A3B)。

u显然,事件B是A1B,A2B,A3B这三个两两互不相容事件的和,用公式表示为:

B=A1B+A2B+A3B返回目录SSMC例26的求解(续)u根据加法公式:

P(B)=P(A1B)+P(A2B)+P(A3B)u分别对P(AiB)(i=1,2,3)用乘法公式:

P(AiB)=P(Ai)P(B|Ai),i=1,2,3于是得:

u代入已知数据:

P(A1)=0.25,P(A2)=0.35,P(A3)=0.40P(B|Ai)=0.05,P(B|Ai)=0.04,P(B|Ai)=0.02P(B)=0.0345即任取一件产品是次品的概率为0.0345。

返回目录A|BPAPBPiii31)()()(SSMCu一般情形,设n个事件A1,A2,A3,An互不相容,P(Ai)0,i=1,2,n,事件B满足,BA1+A2+An,则我们就称这个公式为全概率公式。

全概率公式的总结u全概率公式的直观意义是:

某一事件B的发生有多种可能的原因Ai(i=1,2,n),如果B是由原因Ai所引起的,则B发生的概率是P(AiB)(i=1,2,n)。

每一事件Ai发生都可能导致B发生,相应的概率是P(B|Ai),故B发生的概率是:

当直接计算P(B)较困难,而P(Ai),P(B|Ai)(i=1,2,n)的计算较简单时,就可以利用全概率公式计算P(B)。

例26就是这样计算的。

返回目录A|BPAPBPniii1)()()(A|BPAPBAPBPniiinii11)()()()(SSMCu设n个事件A1,A2,A3,An互不相容,P(Ai)0,i=1,2,n,事件B满足,BA1+A2+An,则2.7贝叶斯公式这就是著名的贝叶斯公式,也称为逆概率公式。

贝叶斯公式是英国统计学家贝叶斯(TBayes)给出,在其去世后的1763年才发表。

该公式是在观察到事件B已发生的条件下,寻找导致B发生的每个原因Ai的概率。

P(Ai)和P(Ai|B)分别称为原因Ai的验前概率和验后概率。

o此公式在实际应用中,可帮助人们确定引起事件B发生的最可能原因。

返回目录),1,2,()()()()()(1niA|BPAPA|BPAPB|APnjjjiiiSSMC贝叶斯公式计算举例u例27:

在上例中,如果抽到的一个零件是次品,分别求这一次品是由机床甲、乙、丙生产的概率。

解:

有关假设与例7相同。

现已知事件B发生,求事件A1,A2,A3发生的概率。

由贝叶斯公式代入已知数据(见例7),计算得类似有P(A2|B)=0.406,P(A3|B)=0.232。

本例中的P(Ai)是事件(取到的一件是次品)发生之前事件Ai发生的概率,是由以往数据分析所得,故称验前概率。

P(Ai|B)是事件(取到的一件次品(B))发生后事件Ai发生的概率,它是获得新信息(即事件B发生)之后再重新加以修正的概率,故称P(Ai|B)为验后概率。

返回目录)A|B(P)A(P)A|B(P)A(P)B(P)BA(P)B|A(P31jiiiijjB|AP3623.00345.0)05.025.0()(1SSMC2.8概率树u企业的领导层在讨论竞争策略时,常常是众说纷纭,但当说完后,人们又一筹莫展,没有头绪;u利用概率树可以帮助企业家理清思路,科学决策;u概率树就是一种树形图,然后在树干和树枝上标上相应的概率。

u我们用几个例子来说明这一决策方法的应用。

u例28:

掷一对硬币,出现结果是两个正面的概率是多大?

返回目录SSMC掷硬币的概率树u第一个硬币出现的可能结果是正面(概率0.5)和反面(概率0.5),于是形成两个分支。

可以用0.5+0.5=1来检查有无其它可能性被遗漏。

u对于这两种可能结果的每一种,对应第二枚硬币均加上相似的两个分支u于是由概率树及乘法法则,会看到出现两个正面的概率是0.25。

正正(0.5)反反(0.5)正正(0.5)反反(0.5)正正(0.5)反反(0.5)结果概率结果概率正正正正0.25正反正反0.25反正反正0.25反反反反0.25返回目录SSMC一个例子u例29:

某种产品由甲、乙、丙三台机床生产,每台机床的生产量不同,其中60%的产品来自机床甲,30%和10%的产品分别由乙和丙生产。

甲、乙、丙三台机床产品的次品率分别是8%、12%和3%。

从它们生产的一批产品中,随机抽取一件产品是次品的概率是多大?

方柱立钻方柱立钻返回目录SSMC例29的概率树由概率树中,我们看到所有次品的三个分枝,及在每一个枝上相应的概率。

为计算随机抽取一件产品是次品的概率,我们利用乘法法则计算出每一台机床次品分枝出现的概率,在利用概率的加法法则计算出抽取一件产品是次品的概率为:

(0.60.08)+(0.30.12)+(0.10

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > 公务员考试

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2