1、统计学重点 统计学复习重点一名词解释 1)英汉翻译 (名词含义要掌握) 众数(mode) 中位数(median) 四分位(quartile) 均值(mean)峰态(kurtosis) 偏态(skewness) 几何平均(geometric mean) 统计学(sartistics) 截面数据(cross-sectional data) 时间数据(times series data) 总体(population) 样本(sample) 分类变量(rank variable) 頻数(frequency) 列联表(contingency table) 饼图(pie chart)茎叶图(stem-an
2、d-leaf-piot) 直方图(histogram) 移动平均法(moving average) 指数平滑法(exponential smoothing)回归模型(regression model) 拟合优度(goodness of fit) 线性趋势(linear trend) 自相关(autocorrtion)偏自相关(partial autocorrtion)2)名词解释(名词的科学定义)四分位差:也称内距或四分间距,它是上四分位数和下四分位数之差(83)四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值(77)众数:一组数据中出现次数最多的变量值茎叶图:由“茎”和
3、“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字移动平均法:通过对时间序列逐期递移求得平均数作为趋势值或预测值的一种预测方法(336)相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量,记为r。(270)指数平滑法:是通过对过去的观察值加权平均进行预测的一种方法(337)季节指数:刻画了序列在一个年度内各月或各季度的典型季节特征(351)假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法多重共线性:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性(308)最小二乘法:276均方误差:
4、标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差(?)自相关系数:自相关(autocorrelation)是时间序列各观测值之间的相关白噪声序列:对于一个纯随机过程来说,若其期望和方差均为常数,则称之为白噪声过程。白噪声过程的样本实称成为白噪声序列,简称白噪声(?)AR模型:自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法MA模型:移动平均(moving average)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量平稳序列:指基本上不存在趋势的序列。二简答
5、题 1)什么是统计学?收集、处理、分析、解释数据并从数据中得出结论的科学,统计学是一门科学,是一种技术,是一门艺术2)统计数据可分为哪几种类型,不同类型数据各有什么特点? 分类数据:只能归于某一列别的非数字型数据,它是对事物进行分类的结果,数据变现为类别,是用文字来表述的顺序数据:只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值3)总体、样本、参数、统计量、随机变量内容及关系?4)一组数据的分布特征可以从哪几个方面进行测度数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或
6、者集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态5)鉴别图表优劣的准则有哪些?一张好的图形应当:1精心设计,有助于洞察问题的实质2使复杂的观点得到简明、确切、高效的阐述3能在最短的时间内,以最少的笔墨给读者提供最大量的信息4是多维的5表述数据的真实情况6)Excel的数据透视表用途?数据透视表是交互式报表,可快速合并和比较大量数据。可旋转其行和列以看到数据源 不同汇总,而且可显示感兴趣区域的明细数据7)解释描述统计和推断统计描述统计:研究数据收集、整理和描述的统计学方法 推断统计:研究如何利用样本数据来推断总体特征的统计学方法8)简述众数
7、、中位数和平均数的特点及应用场合众数是一组数据分布的峰值 不受极端值的影响 缺点是具有不唯一性。众数只有在数据量较多时才有意义 数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值 不受极端值的影响。当数据的分布偏斜较大时 使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。 平均数对数值型数据计算的 而且利用了全部数据信息 在实际应用中最广泛。当数据呈对称分布或近似对称分布时 三个代表值相等或相近 此时应选择平均数。但平均数易受极端值的影响 对于偏态分布的数据 平均数的代表性较差 此时应考虑中位数或众数。9)简述参数最小二乘估计的基本原理 使因
8、变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。即 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小 10)如何做回归分析显著性检验(F检验 , t检验的用途)t检验是对单个变量系数的显著性检验F检验是对整个模型的拟合优度检验,即所有变量对被解释变量的显著性检验11)假设检验中容易出现哪几类错误?第类错误: 错误,原假设为正确时拒绝原假设第类错误: 错误,原假设为错误时未拒绝原假设12)多元回归显著性检验方差分析表的原假设是什么13)简述时间序列的构成要素时间序列可以分为平稳序列与非平稳序列,非平稳序列包含有趋势性、季节性和周期性,因此可将时间序列
9、变化分解为长期趋势,季节变动,周期变动和不规则变动四个因素。长期趋势反映了现象在较长时间内的发展方向,持续向上或向下的态势;季节变动表现为以一年为周期的规则变动;周期变动是围绕长期趋势的一种起伏波动;不规则变动则是随机性,偶然性变动14)自相关与偏自相关系数用来测度什么自相关系数用来测度时间序列各观测值之间的相关程度;偏自相关系数用来测度其他滞后变量不变时,Yt与Y t-k相关程度15)如何正确选择AR模型与MA模型?自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法。 AR模型意味着时间序列的任意一个观测值都是由
10、以前的p个观测值的线性组合加上随机误差et通常的办法是观察时间序列的自相关图和偏自相关图 AR序列的自相关图和偏自相关图具有的典型特征:自相关图单调递减逐步降为0或交替递减逐步降为0,而它的偏自相关图则具有明显的峰值移动平均(moving average)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量。MA模型意为着时间序列的任意一个观测值都是由目前的和以前的q个随机误差的线性组合通常的办法仍然是观察时间序列的自相关图和偏自相关图 自相关图则具有明显的峰值,而它的偏自相关图单调递减逐步降为0或交替递减逐步降为0,三计算题类型1)第一大题名词中涉及计算方面2)
11、列联表计算3)完成方差分析表4)绘制条形图、怕累托图、饼图、蜘蛛图5)移动平均,简单指数平滑计算6)对本学期学过的统计内容由计算机计算后输出结果做分析计算题:众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数 (分出考两题计算题) 10*2、2 分类数据 第六章的分类变量 10分3、SPSS软件 参数的最小二乘估计 15分1、求众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数 10人5月销售的的汽车数为2 4 5 8 9 4 6 12 14 6众数:中位数:四分位:法一:(根据定义法): 平均数:极差:方差:标注差:2、列联表计算一家电脑配件供应商声称,他所提供的配件10
12、0个中拥有次品的个数及概率如下表。求该供应商次品数的数学期望和标准差次品数X=x1,x2.0123P(X=x1,.)0.750.120.080.053 移动平均,简单指数平滑计算下表数据是某商品15个月的销售额(单位:万元)(1)用5期移动平均法预测第16周的销售额(2)才要指数平滑法,用平滑系数a=0.3预测第16周的销售额。4、绘制条形图、怕累托图、饼图、蜘蛛图(1)绘制条形图、怕累托图、饼图、蜘蛛图5、对本学期学过的统计内容由计算机计算后输出结果做分析(看着办,不会的话,尽量多写点)6)完成方差分析表()补:某信息咨询公司受委托调查了解顾客对甲、乙、丙三种品牌矿泉水的喜好程度,随机观察了150名购买者的购买情况,并作如下统计。(看看就好) 问顾客对这三种品牌矿泉水的喜好是否存有差异?解 本题是一维三项概率分布。 令p1、p2、p3分别表示顾客喜好甲、乙、丙品牌的比例,若顾客对这三种品牌矿泉水的喜好没有差异,则意味着顾客中喜好每种品牌的概率均为1/3,因此,可作假设 (计算题一般逃不出这几道题了,计算过程自己去算一遍,就不写出来了,会更有效果)
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2