数据分析课程设计---NBA球员技术统计分析报告.doc

上传人:wj 文档编号:1974544 上传时间:2023-05-02 格式:DOC 页数:20 大小:184.46KB
下载 相关 举报
数据分析课程设计---NBA球员技术统计分析报告.doc_第1页
第1页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第2页
第2页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第3页
第3页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第4页
第4页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第5页
第5页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第6页
第6页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第7页
第7页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第8页
第8页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第9页
第9页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第10页
第10页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第11页
第11页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第12页
第12页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第13页
第13页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第14页
第14页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第15页
第15页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第16页
第16页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第17页
第17页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第18页
第18页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第19页
第19页 / 共20页
数据分析课程设计---NBA球员技术统计分析报告.doc_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据分析课程设计---NBA球员技术统计分析报告.doc

《数据分析课程设计---NBA球员技术统计分析报告.doc》由会员分享,可在线阅读,更多相关《数据分析课程设计---NBA球员技术统计分析报告.doc(20页珍藏版)》请在冰点文库上搜索。

数据分析课程设计---NBA球员技术统计分析报告.doc

《数据分析方法》课程设计

成绩评定表

学生姓名

严震

班级学号

1109010114

专业

信息与计算科学

课程设计题目

NBA球员技术统计分析报告

组长签字:

成绩

日期

20年月日

II

课程设计任务书

学院

理学院

专业

信息与计算科学

学生姓名

严震

班级学号

1109010114

课程设计题目

NBA球员技术统计分析报告

实践教学要求与任务:

设计要求(技术参数):

1、熟练掌握SPSS软件的操作方法;

2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;

3、运用SPSS软件,对模型进行求解,对结果进行分析并得出结论;

4、掌握利用数据分析理论知识解决实际问题的一般步骤。

设计任务:

1、查阅相关资料,找到NBA球员技术的相关指标,获得相关数据;

2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;

3、利用SPSS软件求解,并给出正确的结论。

工作计划与进度安排:

第一天——第二天学习使用SPSS软件并选题

第三天——第四天查阅资料

第五天——第六天建立数学模型

第七天——第九天上机求解并完成论文

第十天答辩

指导教师:

201年月日

专业负责人:

201年月日

学院教学副院长:

201年月日

摘要

数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的,相互独立的随机变量),以再现因子与原变量之间的内在联系;二是用于分类,对个变量或个样品进行分类。

聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。

本文利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。

就是分析和处理数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。

关键词:

spss软件;聚类分析;因子分析;线性规划

目录

1数据分析的任务和目的 1

1.1问题的背景 1

1.2任务和目的 1

2数据的搜集与整理 2

2.1数据的来源 2

2.2数据的处理 2

3利用SPSS软件对结果进行分析 3

总结 13

参考文献 14

1数据分析的任务和目的

1.1问题的背景

一年一度的NBA赛季让全世界的篮球迷为之疯狂,NBA赛事之所以如此受欢迎,最主要的原因在于NBA球员高超的球技。

球队中灵魂人物的个人发挥能够直接影响其球队的成败。

因而对他们的技术统计与分析是一件十分重要的事情。

众所周知,科比-布莱恩特和阿伦-艾弗森是深受大家喜爱的两位球员,两位球员在赛季的发挥也在一定程度上影响着两队的战绩。

因此,通过两位球员在以往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为NBA相关的商业活动和广大球迷提供数据上的参考。

1.2任务和目的

1、频数分析(对两人平均每场上场时间进行频数分析)

2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)

3、单样本t检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均值是否为2.7)

4、两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)

5、单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为1:

1:

10:

10:

10:

10:

10:

10:

10:

10:

2)

6、单样本非参数假设检验(检验科比-布莱恩特和阿伦-艾弗森平均每场盖帽次数总体的分布是否为正态分布)

7、单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分是否持续正常)

8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾弗森平均每场防守次数对平均每场得分有无显著影响)

9、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)

10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中率与平均每场得分的偏相关关系)

11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回归方程)

12、曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)

2数据的搜集与整理

2.1数据的来源

《NBA球员科比-布莱恩特和阿伦-艾弗森11个赛季技术统计表》下载自NBA中文官方网站,具有可信度。

2.2数据的处理

定义视图

数据视图:

3利用SPSS软件对结果进行分析

(1)频数分析(对两人平均每场上场时间进行频数分析)

数据文件中增加一个变量scsj。

输出1

输出2

分析:

从输出1中看出,阿伦-艾弗森平均每场上场时间在10-40(分钟)的频数为1,在40-50(分钟)的频数为10;科比-布莱恩特平均每场上场时间在10-40(分钟)的频数为7,在40-50(分钟)的频数为4;两人平均每场上场时间在10-40(分钟)的频数为8,在40-50(分钟)的频数为14。

从输出2中看出,交叉分组下的频数分析卡方检验结果的相伴概率为0.008,小于显著性水平0.05,故拒绝原假设,认为两人的平均每场上场时间

存在显著性差异。

(2)基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)

实现按NBA球员拆分,输出结果放在同一张表中。

输出3

分析:

从输出3中看出,科比-布莱恩特的平均每场投篮命中率、平均每场三分球命中率和平均每场罚球命中率的均值均比阿伦-艾弗森高,但标准差有高有底,

说明在投篮方面科比-布莱恩特比阿伦-艾弗森发挥出色,但稳定程度高低不定。

均值的统计误差均小于0.05(比较小),说明数据没有不均衡现象,说明两人的发挥都比较稳定。

(3)单样本t检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均值是否为2.7)

实现按NBA球员拆分,输出结果放在同一张表中。

输出4

分析:

从输出4中得,阿伦-艾弗森单样本假设的相伴概率为0.001,小于显著性水平0.05,故拒绝原假设,认为阿伦-艾弗森平均每场犯规次数的均值与2.7有显著性差异;科比-布莱恩特单样本假设的相伴概率为0.773,大于显著性水平0.05,故接受原假设,认为科比-布莱恩特平均每场犯规次数的均值与2.7无显著性差异。

(4)两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)

输出5

分析:

从输出5中看出,两独立样本F检验结果的相伴概率为0.019,小于显著性水平0.05,故拒绝原假设,认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的方差有显著性差异;两独立样本t检验结果的相伴概率为0.003,小于显著性水平0.05,故拒绝原假设,认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的均值有显著性差异。

(5)单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为1:

1:

10:

10:

10:

10:

10:

10:

10:

10:

2)

输出6

输出7

分析:

从输出7中看出,非参数假设检验卡方分布的相伴概率为0.505,大于显著性水平0.05,故接受假设,认为样本来自的总体分布与理论分布无显著差异,即科比-布莱恩特与首发的关系基本是为1:

1:

10:

10:

10:

10:

10:

10:

10:

10:

2。

(6)单样本非参数假设检验(检验科比-布莱恩特和阿伦-艾弗森平均每场盖帽次数总体的分布是否为正态分布)

实现按NBA球员拆分,输出结果放在同一张表中。

输出8

分析:

从输出8看出,科比-布莱恩特的平均每场盖帽次数非参数检验结果的相伴概率为0.945,大于显著性水平0.05,故接受原假设,认为科比-布莱恩特的平均每场盖帽次数服从正态分布;阿伦-艾弗森的平均每场盖帽次数非参数检验结果的相伴概率为0.709,大于显著性水平0.05,故接受原假设,认为科比-布莱恩特的平均每场盖帽次数服从正态分布。

(7)单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分是否持续正常)

输出9

分析:

从输出9看出,随机性检验结果的相伴概率为0.210,大于显著性水平0.05,故接受假设,认为科比-布莱恩特平均每场得分是随机的。

(8)单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾弗森平均每场防守次数对平均每场得分有无显著影响)

输出10

分析:

从输出10中看出,科比-布莱恩特单因素方差分析结果的相伴概率为0.056,大于显著性水平0.05,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得分无显著影响;阿伦-艾弗森单因素方差分析结果的相伴概率为0.374,大于显著性水平0.05,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得分无显著影响。

(9)相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)

输出11

输出12

分析:

从输出11中看出,平均每场三分球命中率与平均每场得分之间不具有较强的线性关系;从输出12中看出,相关分析的相伴概率为0.329,大于显著性水平0.05,故接受原假设,认为平均每场三分球命中率与平均每场得分之间不具有较强的线性关系。

两种方法得到结果一致。

(10)偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中率与平均每场得分的偏相关关系)

---PARTIALCORRELATIONCOEFFICIENTS---

Controllingfor..V15

V17V9

V171.0000.3626

(0)(19)

P=.P=.106

V9.36261.0000

(19)(0)

P=.106P=.

(Coefficient/(D.F.)/2-tailedSignificance)

"."isprintedifacoefficientcannotbecomputed

输出13

分析:

从输出13中看出,偏相关分析结果的相伴概率为0.106,大于显著性水平0.05,故接受假设,认为以平均每场失误次数为控制变量,平均每场罚球命中率与平均每场得分的偏相关关系不显著。

(11)线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回归方程)

输出14

输出15

输出16

输出17

输出18

分析:

从输出14中看出,本次多元分析回归分析采用的是逐步筛选法,且回归系数显著性F检验的相伴概率值小于0.05的自变量引入了回归方程,大于0.1的自变量剔除了回归方程。

自变量进入回归方程的次序是:

平均每场上场时间。

从输出18中看出,科比-布莱恩特的平均每场得分的最终线性回归方程为

平均每场得分=0.839*平均每场上场时间+6.612。

(12)曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均每场得分)

MODEL:

MOD_1.

_

Independent:

V7

DependentMthRsqd.f.FSigfb0b1b2b3

V17LIN.25093.00.117-70.332209.155

V17QUA.770813.43.003-4386.519633.2-21819

9V17CUB.771813.45.003-2962.29973.17-16414

Notes:

9Tolerancelimitsreached;somedependentvariableswerenotentered.

输出19

输出20

分析:

从输出19中看出,线性模型的相伴概率为0.117,大于显著性水平0.05,故接受原假设,认为线性模型的方程不显著;二次曲线与三次曲线的相伴概率均为0.003,小于显著性水平0.05,故拒绝原假设,认为线性模型的方程显著;且三次的曲线拟合度最高,因此选定三次曲线模型。

具体模型是:

平均每场得分=-2962.2+9973.17*平均每场投篮命中率-16414*平均每场投篮命中率^3

总结

经过这次的大作业的锻炼,是我对这学期所学到的数据分析方法和对SPSS的操作有了更加深刻的理解和认识,在课设的过程中不断有问题出现,又不断地查资料或请教老师同学的情况下,终于对SPSS有了进一步的了解。

这份作业以深受大家喜爱的N球星的技术分析为例,探讨了如何用统计软件SPSS对原始数据进行科学的统计分析。

虽然完成了此次课程设计,但是我深刻地感觉到数据分析在现实生活中的重要作用,并且认识到以前学到的东西还是非常浅显的,还要在以后的学习过程中注意多思考、多应用。

在此还要特别感谢马建军老师的指导,是我学会了一些科学的数据分析方法。

参考文献

1.《SPSS17.0中文版常用功能与应用实例精讲》,电子工业出版社

2.《数据统计与分析技术——SPSS软件实用教程》,高等教育出版社

15

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2