ImageVerifierCode 换一换
格式:DOCX , 页数:25 ,大小:56.53KB ,
资源ID:1021263      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-1021263.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(本科毕业论文植物的分类问题研究.docx)为本站会员(b****2)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

本科毕业论文植物的分类问题研究.docx

1、本科毕业论文植物的分类问题研究成都信息工程大学学位论文植物的分类问题研究论文作者姓名: 申请学位专业: 申请学位类别:(嘶):论文提交日期:植物的分类问题研究摘要本文研究了莺尾屈植物的分类和归类问题,利用采集的150组样本数据, 根据快速聚类原理建立分类模型,将莺尾属植物分为3类。根据茨离判别原理 建立判别分析模型,对采集的样本进行判别,交义确认误判率为2%,误判率较 低,并对3个待判样品进行判别,得到所属归类。关键词:分类;莺尾属植物:快速聚类法:距离判别法:SAS软件:MATLABResearch of Plant Classification ProblemAbstractUlis pa

2、per analyses the classification and taxonomy of iris, divide the iris into three categories by using the 150 sample data collected according to classify model based on the fast clustering theoiy. Discriminate the samples tlirougli tlie discriniinant analysis model in line with distance discriminatio

3、n theory, the cioss validation misjudgment rate is a relative low 2%, and the classification of tluee samples need to be discriminated are settled.Key words:Classification; his plant; Fast clusteringinethod;Distance discrimination method;SAS;MATLAB论文总页数:17页1引言 11.1课题背景 11.2国内外硏究现状 11.3本课题研究的意义 11.4本

4、课题的研究内容和研究方法 11. 4.1研究内容 11. 4.2研究方法 12简尾花问题 23莺尾花分类模型 23.1基本假设 33.2符号说明 33.3快速聚类 33.4建立模型 53.5模型求解 54莺尾花判别模型 74.1收集训练样本数据 74.2模型假设 84.3建立模型 84.4模型求解 105模型推广与评价 135.1模型评价 135.2模型推广 14结语 14参考文献 15致谢 错误!未定义书签。声明 错误!未定义书签。1引言1.1课题背景植物是我们II常生活中极其常见的一种生物,与我们的生活息息相关。植 物种类非常之多,地球上已知的植物种类大概就有五十多万种,所以为了能更 好的

5、了解、保护和使用植物资源,对植物进行鉴别、分类就显得十分觅要,所以科学家创立了植物分类学,开始科学的对植物进行分类研究。1.2人类认识世界往往都是先将被认识的对象进行分类,过去的研究主要都是依靠经验和采集大最的数据来对植物进行分类,很少有使用数学工具來进行分类的。但是伴随着时代的发展和技术的提升,人们开始慢慢的把数学工具应用到了分类学当中,这就形成了数值分类学:随着数学方法的不断迭代更新,后 来人们乂将多元分析的技术应用到了数值分类学当中,最终形成了聚类分析。伴随着计算机的诞生和计算机技术的高速发展,人们将计算机技术应用到 了分类学当中,对分类学产生了重大的影响。数值分类学就是建立在数学理论

6、方法基础上,依托计算机的离速运行计算特性來进行分类的。这样的到的结果 比较客观,是科学的计算,而不是靠经验的推断,并且研究过程当中,运算速 度非常之快,效率非常之高,这些都是以前的分类学家很难做到的。1. 3本课题研究的意义分类不仅仅只周限丁植物的分类应用当中,同吋分类在其他学科以及我们实际工作当中也有许多应用。比如,在经济学当中,为了了解不同地区的城镇 居民的收入和消费情况,往往需要划分不同的类型去研究:在产品质最监管工 作当中,往往需要根据产品的某些重要指标來将其划分位一、二、三等品等; 在实际工作当中,我们可以设计一个分类模型,可以对股票的涨跌情况进行分 类,用來预测股票的后期走势。本文

7、对植物分类问题的研究,在植物的鉴别分类,以及保护植物资源以及生物多样性都有着非常重要的意义。1. 4本课题的研究内容和研究方法1.4.1研宪内容本文主要研究了莺尾属植物的分类问题,主耍采用快速聚类法对其进行聚类分析和距离判別法对其进行判别分析。1.4.2研究方法学习分类就是要学会一种分类方法或者分类函数。本文首先采用快速聚类 的原理方法建立分类模型來对莺尾屈植物进行聚类,并借助数据分析软件SAS 软件对莺尾属植物的数据进行数据处理和分类;然后使用马氏距离判别原理建 立判别分析模型对训练样本进行判别分析,并计算误判率的交义确认估计;最后对分类结果做讨论分析。2莺尾花问题本文抽取了 150组莺尾属

8、植物的数据作为样本,数据來源于统计学家 R.A.Fisher创建的莺尾花数据集,考察莺尾属植物中三个不同品种的花的四个 形状,每50组数据取自同一品种的花,每一种花的相关数据采取如下四种属 性来表述(1) %i:花萼片的长度(毫米);(2) %2:花萼片的宽度(毫米);(3) %3:花瓣的长度(毫米):(4) 花瓣的宽度(毫米);抽样数据见表表1琦尾属植物数据表NX1X2*3心NX1X2%4NXlX2心X*15033142514830143101473213226428562252513816210246311523652516155361304918103693257234673156245

9、448311921045229131356328511555503016210574286119646341435650321221065930421576931512357612656111075134152862221515586428562110850351339593218185943301111095628492010463610260584012211060224010116130461461513819411173206318126027511662673144141126725581813653052206362284818113493115114562539116449301

10、421146731471515653055186551351421156323441316582751196656304515116513715217683259236758274110117563041131851331756850341641186325491419572815136946321421196128471220623454237060294515120612943132177386722715726351012151253010226333471672574415412257284113236733572573503614212365305822247630662174773

11、06123124693154212549254517756334562112554391342655351327658275119126513514327673052231 157194213127723661252870324714787230581612865325120296432451579543415412961294714306128101380524215113056293613314831162817130592113169314915325930511882643155181326427531933552438118360304818133683055213463255019

12、8163295618134552540133561325323854924331013548341623652341428656274213136483014137493614187573042121374523133385-1301515885542142138572550203979386420894931152139573817340443213290772669231405138153416733572191602250151415523401342503516692513917414266304114435826401293662946131436828481444443013294

13、52273914144543417245772867209560344516145513715446632749189650341521465235152474732162974419142147582851244855264412985020351014867305017495023331099552437101496333602550723260181005827391215053371523鹫尾花分类模型3.1基本假设1.本模型采用的数据均真实有效,并且是可操作的。2.样本均为随机抽取。3.不考虑人为因素的影响。3.2符号说明表2符号说明Xl花萼片长如花萼片宽尢3花證长X4花册宽样品序号

14、(4=1,2,-, 150)第i种类的样本1=1, 2,33.3快速聚类首先将抽取的样品进行简单的分类,接着根据样品间的欧氏距离按照一定 方法逐步调整,最后直到不能再调整为止。快速聚类法适用丁样本数目较大的 数据集的聚类分析,但是需要事先指定分类的数目,而且此数目对最终分类结 果有较大影响。因此在实际中一般要对多个分类的数目进行尝试,来找出合理 的分类结果。1选择初始聚点本文在聚类过程中均采用欧氏距离,B|J:dg巧)=|心一別=(兀一”)(忑一勺):采用最小最大原则來选择初始聚点,因为最终需要把收集到的150个样本 分成3类,所以初始聚点的选择为3个。苗先求出所给样品中欧氏距离相距最 远的两

15、个样品九为初始的2个聚点,即选择礼,轧,使得无 2)= 4讥=maxd。由欧氏距离求得2个初始聚点%k,xi2分别是序号为21和60的样本,即 maxdv = d(7V21,/V6o) = 60.9426 然后,选择第3个聚点竝3,使的mind(%is,%tr),r = 1,2 = maxmind(,xir),r = l,2,y H ilti2 由欧氏距离求得的第3个初始聚点看3是序号为77的样本,即 mind(N77,%r),r = 1,2 = maxfmind(Xj,xir),r = 1,2, j 工 iif i2 = 37.7227 初始聚点集合为” =皿1川60, N772.快速聚类法

16、步骤(1) 设求出的3个初始聚点的集合是厶。=晋用。)烏。) 用下列原则来实现初始分类G)=x: d(扁。) d(x,xf)j = 1,2,3,; H i,i = 1,2,3通过这个步骤各个样品将归类成不相交的3类,初始分类的原则就是将每个样 品归类到最近的初始聚点为一类,这样就可以得到一个初始分类G(。)=同。)府)府)(2) 重新从G()开始,来计算新的聚点集合厶-然后把0)的重心分别计 算出来作为新的聚点苴中兔是q()中的样品数这样,又可以得到新的聚点集合 小)=申疳,才)接着从厶开始,继续对样品做新的分类,同样:G)= x: d(xfx 0,若d(m) 曲)则递推计算过程结束。3.4建

17、立模型算法步骤(1) 根据最小最大原则选取3个初始聚点;(2) 将每个观察样本按就近原则分配给最近的初始聚点;(3) 重新把每个聚集中的重心作为新的聚点;(4) 不断重复上述(2), (3)过程岂到聚点的变化足够小为止。下面给出它的工作原理图。图1快速聚类法工作原理3. 5模型求解(1)运用最大最小原则找出3个初始聚点:由proc fast cl us过程,得到计算结果:初始聚点如表3所示。表3初始聚点聚点X1*2X3丸415840122277386722357194213聚点1、2、3对应的样品号分别为60、21和77号,即初始聚点分别为21 号、60号和77号样品。(2)最终聚类中心如表4

18、所示。表4最终聚类中心聚类中心尢1X2X3丸4150. 2434. 0614.692. 76268. 5030. 5057. 2420. 71358. 8527. 2043. 8714.25根据最终聚类中心的数据分析,其中一类品种的花瓣长度和宽度都是最小的 且花萼的长度居中,花萼宽度为最宽,将这一类归为心类;其中一类品种的花瓣 长度和宽度都是最大的且花萼长度为最长,花萼宽度居中,将这一类归为G2类: 其中一类品种的花萼长度和花萼宽度都是最小的且花瓣长度和宽度都是居中,将 这一类归为G3类。(3)最终聚类结果如表5所示。表5 150个样品分3类情况类号样本个数最邻近类至最邻近类距离Gi51G33

19、3. 238g238G318.150G361G218.150结果分析:三个不同品种的莺尾花的150个样本,其中51个样本屈于Gi类; 另外有38个样本属于G2类;剩余的61个样本属于Gg 而类与类之间的距离有 助于分析两个类之间的接近程度,由表可知G2类与G3类之间的距离故小,为18. 150,所以G2类与G3类最为相近。4莺尾花判别模型4.1收集训练样本数据收集莺尾属植物的三个不同品种的花的形状的数据作为训练样本,收集到的数据如表6所示。表6莺尾花的三个不同品种的形状数据编号品种X1X2兀3编号品种兀2无4编号品种兀2兀3兀4115033142502652846159936428562221

20、4634143512622245151 0036731562431463610252259324818101363285115415133175532613046141 02369315123515535132542602751161033653052206148311625525625391110436530551815234142562572845131053582751198149361415726333471610636832592391443213258270324714107362345423101503516659264324515108373867221114430132602

21、612840131 093673357251214732162612552438111 103763066211314830143622543045151113492545171415138162632582640121 123673052231514834192612552614121133593051181615030162652502333101143632550191715032122662673144141153643253231814330111672563045151 1 637938642019158401226825827111011736733572120151381946926029451511837(2867202114930142702572635101 193632749182215135112712571942131203723260182315034164722492433101213613049182414632142732562742131223612656142515744154742573042121 23364285621261503614275266294613124362284818271543415476

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2