大数据在我国高校的应用研究.docx

上传人:b****6 文档编号:16519833 上传时间:2023-07-14 格式:DOCX 页数:20 大小:152.07KB
下载 相关 举报
大数据在我国高校的应用研究.docx_第1页
第1页 / 共20页
大数据在我国高校的应用研究.docx_第2页
第2页 / 共20页
大数据在我国高校的应用研究.docx_第3页
第3页 / 共20页
大数据在我国高校的应用研究.docx_第4页
第4页 / 共20页
大数据在我国高校的应用研究.docx_第5页
第5页 / 共20页
大数据在我国高校的应用研究.docx_第6页
第6页 / 共20页
大数据在我国高校的应用研究.docx_第7页
第7页 / 共20页
大数据在我国高校的应用研究.docx_第8页
第8页 / 共20页
大数据在我国高校的应用研究.docx_第9页
第9页 / 共20页
大数据在我国高校的应用研究.docx_第10页
第10页 / 共20页
大数据在我国高校的应用研究.docx_第11页
第11页 / 共20页
大数据在我国高校的应用研究.docx_第12页
第12页 / 共20页
大数据在我国高校的应用研究.docx_第13页
第13页 / 共20页
大数据在我国高校的应用研究.docx_第14页
第14页 / 共20页
大数据在我国高校的应用研究.docx_第15页
第15页 / 共20页
大数据在我国高校的应用研究.docx_第16页
第16页 / 共20页
大数据在我国高校的应用研究.docx_第17页
第17页 / 共20页
大数据在我国高校的应用研究.docx_第18页
第18页 / 共20页
大数据在我国高校的应用研究.docx_第19页
第19页 / 共20页
大数据在我国高校的应用研究.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

大数据在我国高校的应用研究.docx

《大数据在我国高校的应用研究.docx》由会员分享,可在线阅读,更多相关《大数据在我国高校的应用研究.docx(20页珍藏版)》请在冰点文库上搜索。

大数据在我国高校的应用研究.docx

大数据在我国高校的应用研究

大数据在高校中的应用研究

大数据技术在各行各业中的应用越来越广泛与深入,其在高校的发展也是势不可挡,信息化的高校建设更适应现如今的社会。

大数据在我国高校的应用要吸取国外经验、发挥本国优势。

大数据教育和传统教育对比起来有很大的优势,我们应扩大这种优势。

大数据不是无根之木、无源之水,应用大数据技术,应注意到数据从收集到使用的整个过程中的每个细节,可能每个过程都有现阶段的技巧或是问题,我们要努力掌握技巧、解决问题。

国家很看好大数据在高校的发展,社会也是很认同的,事实上高校也是有这类需求的,因此,我们应该积极推动大数据在高校中的应用,但在此之前,我们也应做好大数据在高校中的引用研究。

本文先是对大数据的概念及来源做了一些介绍,然后讲述在高校中大数据技术可以在那些方面发挥巨大作用,接下来举了例子详细说明大数据在高校招生工作中的使用即是在高校招生决策支持系统中大数据技术是如何发挥作用,然后讲述了大数据在高校中应用的难点所在以及使用大数据技术的一些策略,最后则是展望未来大数据在高校的发展。

[关键词]大数据;高校;信息化

大数据在高校中的应用研究

一、引言

这是个数据爆发的时代。

当人类进入信息时代后,数据作为这个时代独一无二的传媒介质便在我们的生活中无处不在。

尤其是伴随着物联网和互联网的快速发展,我们的一切都在被记录、被数据化。

一份国际数据资讯公司的报告提到,数据数量一直在快速增长,这个速度不仅是指数据流的增长,还包括许多全新的数据种类的增多。

现今数据容量增长的速度,已经大大超过了硬件技术的发展速度,到2020年产生的数量将增至44ZB(十万亿亿字节),超出存储空间6ZB(1ZB相当于343.6亿部32GB智能手机的存储容量)。

这些数据正是在告知我们人类已经进入了一个深度研究数据内在信息和核心价值的大数据时代。

“大数据”一词来自于未来学家托夫勒于1980年所著的《第三次浪潮》。

而最早开始对大数据进行应用探索的是2005年雅虎公司的Hadoop项目。

Hadoop其最初知识用来解决网页搜索问题的一个项目,后被ApacheSoftwareFoundation公司引入并成为开源应用。

Hadoop是有多个软件产品组成的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。

在这个“第三次的浪潮”中,教育行业在其中有着相当重要的的地位,而其中的高校更是如此,它不但是这场浪潮的参与者,更是大数据发展的推动者。

做为教育行业中典型代表的高校理应更好的管理和利用所拥有的大规模的数据和信息资源,而这也是顺应大数据时代发展趋势、推动自身信息化建设和发展的一个绝佳契机,更是为在以后的教育和科研工作中发挥出举足轻重的作用。

作为信息化高度发展的美国,政府为了顺应、推动大数据这一发展趋势,2012年3月美国奥巴马政府宣布投资2亿元用于“大数据的研究和发展计划”,从此大数据从商业行为上升到国家战略层面。

作为世界大国的我国,对于大数据也很早就给予高度的关注,2012年2月中国工信部发布了《物联网十二五规划》,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这成为支持中国大数据产业发展的重要依据;2015年9月经李克强总理签批,国务院印发《促进大数据发展行动纲要》;在《十二五规划纲要》、《十三五规划纲要》等国家战略部署中,也曾多次提到对于大数据的发展。

而国家在高校教育中的大数据的发展方面也是十分重视的,《国家中长期教育改革和发展规划纲要(2010-2020年)》明确提出,在加快教育信息化发展进程中要“加强优质资源教育资源开发与应用……促进优质教育资源普及共享”。

图12012-2020年全球大数据市场规模

我国在高校大数据研究发展方面有着独特的优势。

据国家统计局2014年的一份报告显示,我国目前在校大学生约2468万人。

《2015年中国大数据交易白皮书》中提到2013年在线教育用户人数达6720万人,同比增长13.8%,预计到2017年将达到12032.6万人。

大数据在高校中的基础变的越来越牢固,但到底我们应该怎样去合理而高效地运用呢,这就是论文的主题大数据在高校的应用研究。

二、大数据在高校的发展

(一)大数据

1.大数据的概念及目标

最早提出“大数据”时代到来的是全球最著名管理咨询公司之一的麦肯锡公司。

2011年5月麦肯锡发布《大数据:

下一个竞争、创新和生产力的前沿领域》报告,提到:

“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。

人们对于海量的数据的挖掘和应用,预示着新一波的生产率增长和消费者盈余浪潮的到来”,提出了大数据时代到来。

全球最具权威的IT研究与顾问咨询公司,高德纳咨询公司在2012年对大数据解释为:

“大数据是大量、高速以及多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力和优化处理。

”维基百科对于大数据的定义则更为简单:

大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可以容忍时间的数据集。

对于大数据的定义有很多,但无论哪种定义都实际上强调大数据的目标,即获取知识和推测趋势、掌握个性化特征、通过分析辨识真相。

所以,大数据技术的战略层面意义不仅仅是掌握海量的数据信息,而是在于通过将各种数据集合整理后的分析得到大量额外的有价值的信息和数据关系,从而帮助人们优化决策和行为模式。

2.大数据与传统数据的区别

信息大爆炸在提醒着我们,未来将因大数据技术而改变。

与传统的数据相比,大数据如此受欢迎,是因为大数据本身的特点。

与传统数据最关键的区别是:

其一,数据收集的来源不同。

传统的数据库只是收集基础数据,仅仅使用的是数据本身的含义,而没有深入的挖掘数据的价值。

不同的是大数据从传统的数据中整理和分析,对数据之间的关联更加的重视,也就是主要研究数据之间的关系;其二,数据的应用方向不同。

传统的数据库主要功能是存储和查询,以对过去产生的数据保存为核心。

不同的是大数据是以预测事物发展为核心,通过对庞大数据的科学分析,从而的到将来发展的趋势和将来事件发生的可能性。

通过对海量数据进行分析,得到的发展趋势在未来或推断未来的可能性。

(二)高校中所需的大数据

1.高校中的数据源

社会每时每刻都会产生大量的数据,高校更是如此。

我国自从教育信息化以来,高校有许多数据被收集并保留下来,从学生来看,有联系方式、宿舍信息、班级信息等基本信息,食堂消费记录、宿舍晚归等生活信息,选课、课后作业完成情况、图书借阅记录、历次学习成绩等学习信息,参加的社团、比赛、讲座等第二课堂信息;从教师来看,有教学任务、课件等教学信息,论文报告、科学研究数据等科研信息;从学校管理者来看,有学校的资产信息、师资信息、社团活动信息、讲座举办信息、招生就业信息等等。

随着高校教育信息化建设的不断深化和逐渐加强,比以往更庞大的数据在快速的积累保存,这些对于高校来说,是一个珍贵的资产。

这些庞大的数据并不仅是简单的数据的积累、记录和保存,如果能有效利用它们,其隐含的价值会对高校的现代化建设产生相当积极的效果。

举例来说,通过对“课程+成绩+就业”等相关数据的科学深入分析,就能在一定程度上对学生选课、教师授课、学校的排课的相关内容进行有效的指导和建议;还有通过对“学生的图书借阅记录+学生选课信息+学生课程成绩”等相关数据的分析,就可以了对学生的兴趣爱好有一定的掌握,并可以对学生未来就业做出具体符合的建议。

在如今的时代,信息就是金钱,大数据技术应用于高校教育信息化将会有更多更加突出表现,展现出其重要的作用。

2.高校中的大数据的特点

复旦大学信息办主任宓咏认为,高校信息化过程中产生的数据来自于不同的层次和分类,既有人事、财务、资产、科研等常规管理型业务产生的结构化数据,又有多媒体教学资源等非结构化数据;既有用户使用网络产生的行为数据,又有物联网、移动互联网感知到的位置数据等。

这些数据围绕着对教师和学生的服务与管理而产生,存在碎片化、持续性等特点。

  “碎片化”是指无论是业务数据、教学资源数据或网络行为数据,在某种方面来说都是反映行为个体的一个属性。

举例来说,从图书馆获得的论文数据和从科研管理部门拿到的项目数据,都直接或间接反映了教师的科研能力的一个方面,只有将许许多多来自不同地方的数据进行有效整合,并进行量化分析建模,如此便可以具体准确地判断教师的个人能力。

“持续性”则体现了校园科研、教学和管理业务等的规律,比如校园一卡通消费、上网时长、每个学期选修课程、专业课成绩、获得学分以及重修重考等数据能够相对的反映一个学生的生活习惯、个人爱好和学习进步的趋势等,但这必须建立在长期和持续的数据手机、分析的基础上,如若仅靠短期的数据分析所获得的结论则对指导教育教学活动并无多大益处。

高校信息化过程中产生的这些数据,在整体上是满足数量大、种类多、产生快、真实可信和具备分析价值等特点,当然也是完全符合大数据特征的。

(三)与传统教育相比的优势

传统教育的课堂教学活动是以教师为中心的。

首先,教师不能完全照顾到课堂中基础和兴趣不尽相同的每个学生,学生只能被动听教师的讲授,因此学生学习的主动性、自主性较低;其次,由于局限于校园和课堂,优秀教师及教育资源的施教面受到限制,不能实现最大化利用和资源共享。

而作为大数据教育,一方面,学生能够做到根据自己的需要自主安排学习计划,自主决定学习时间、地点和选择学习内容。

在网络化的教育模式中,学生学习的自主性、个性化和能动性得到了充分的发挥。

同时,教育资源也得到了充分利用和共享,通过远程传输,同样教育资源的施教能力在空间和时间上被放大了,在不同的时间、有更多的处于不同地域、地点的学生可以学习同一教师所讲授的课程,从而满足了更多求学者的受教育需求。

当然,这也意味着,网络教育对学生的学习主动性和自学能力提出了较高的要求。

大数据教育的网络课程表现形式生动形象、信息容量大、更新快,可综合计算机多媒体信息处理技术的运用,使网络课程表现教学内容的形式更加丰富多彩、生动形象,这些表现形式包括文字、声音、图表、影像、动画等。

网络课程的突出特点是多媒体和交互性。

一方面,教学内容的表现不再只是枯燥的文字和图表,而是配合有精彩动画、影像和声音;另一方面,学生在学习过程中,不再只是被动的看和听,还可以参与实际的模拟操作,与教学内容进行交互。

大数据技术的重大意义不仅在于可以实现教学信息和内容的远程传输和资源共享,更是使得网络可以在任何时间和地点,让教师和学生、学生和学生间进行全方位的双向交互。

这种交互既可以是实时的,也可以是非实时的。

计算机网络使真正的教师与学生、学生与学生之间双向互动、实时全交互的实现成为可能。

大数据教育运用了信息数据库管理技术和双向交互功能,为个性化教学提供了有效的实现途径与条件。

一方面,系统可对学生的个性资料、学习过程和阶段情况实现完整的跟踪记录、储存;另一方面,教学和学习服务系统则可基于系统记录的个人资料,进行针对不同学生的个别或个性化学习建议等。

三、大数据在高校中的运用

高校是数据生产大户,很多高校正在使用大数据技术解决遇到的实际问题,如美国德克萨斯大学利用大数据技术分析学校用户IT使用行为产生的数据,确定用户行为异常,审计IT基础环境,制定安全防护措施。

还有一些应用场景如分析学生参与网络课堂产生的数据,进而确定如何改进课程讲述方式,达到因材施教的教育目标。

在我国,高校数量众多并且规模较大,许多高校都是万人以上的,在高校里的学生从招生、学籍、选课、成绩、食堂、活动等方面产生大量的数据,更何况还有教师和管理人员。

在大数据时代,只有用好这些数据,才能更好地帮助教学、科研、学生管理等工作,大大提高高校的信息化水平,以及在就业情况分析、学习行为分析、学科规划、心理咨询、校友联络等方面借助大数据分析技术,挖掘数据中潜在的价值。

(一)就业情况分析

我国自从市场经济下高校扩招后,就业制度改革不断深化、高校毕业生人数逐年增加、社会高校毕业生就业形势越来越严峻,就业问题几乎成为每个大学生都要面临的一个难题,在这个环境下研究高校毕业生就业问题就有着紧迫性和重要性。

传统的就业分析通常都是从就业单位、就业地区、所在院系专业、性别、签约类别、就业预期、就业年份等因素来分析,得到的只是一般意义上的统计结果,对于指导单个学生的就业以及预测未来的就业情况发挥的作用比较有限。

而在大数据分析技术下,则可以将学生就业模型涉及到的学习情况、社团信息、生活信息、校外实习、参加的竞赛及获奖情况、所投公司当年的招聘计划、历届学生在所投公司的表现等众多的信息进行收集,构成就业分析模型。

除了数据统计分析之外,我们还可以对数据进行监督学习和无监督学习。

监督学习使用先验知识对数据进行分类;无监督学习则由计算机自己学习处理数据,并在做出判断后给予一定的激励或惩罚。

在进行就业分析时,我们可以首先协作筛选,通过分析已就业学生的成绩、参加的社团活动、关注的行业、性格特点、就业单位、就业岗位等,计算学生之间的相似度,为即将毕业的学生推荐适合的就业单位和岗位,提供个性化的服务;其次是聚类,这是一种无监督的机器学习方法,我们可以通过不同的维度将未能及时就业的学生进行分析,从中找出其共同的特点,再通过比较在校学生的相关属性,及时对学生给出预警,以便其在后续的学习和生活中加以改进。

(二)学习行为分析

为了支持学生的自主学习,高校一般都在使用着学习管理系统,如Blackboard(Blackboard在线教学管理平台是目前市场上唯一支持百万级用户的教学平台,拥有美国近50%的市场份额)、Sakai等。

这些学习管理系统为学生、教师提供了课程学习和交流的场所。

美国教育部教育技术办公室认为教育数据分为键击层、回答层、学期层、学生层、教室层、教师层和学校层,数据就寓居在这些不同的层之中。

大数据分析可以应用于教育中的数据挖掘。

一般高校每年的开课数在数千门,学生数在数万人,产生的数据量非常大。

目前教育机构已经积累了大量数据,使研究者有更多的新机会探究学生学习环境和状态。

应用大数据分析技术使得监控学生的每一个学习行为变为了可能,学生在回答一个问题时用了多长时间,哪些问题被跳过了,为了回答问题而作的研究工作等都可以获得,通过监测这些信息,形成教育大数据库,全面掌握学生学习的全过程,发现学生的学习常态。

通过数据流的变动分析,总结教育规律、调整教学内容和教学模式,客观全面地评价学生学习成果和自身的教学成果,用这些学生学习的行为档案创造适应性的学习系统提高学生的学习效果。

  

(三)个体分析

对于教育领域来说,大数据的应用让研究个体学习也成为了可能,让专门培养和针对性训练成为可能。

通过学校数据中心分析学生的各类信息,如考试成绩的变化、借阅图书的种类、一卡通消费额度等信息,综合性地分析判断学生的状态。

根据分析结果,对于不同的学生因地制宜地制定相应的教学模式、培养方案。

另外,也可以借助学校的微信公众平台为学生推送其感兴趣的资讯信息。

(四)学科规划

促进学科交叉融合发展,构筑有生命力的学科生态,打造凸显核心竞争力的高水平学科是学校学科规划的重要任务。

借助大数据分析技术,充分收集各学科的教学状态数据、科研项目数据、前沿发展动态等信息,从而分析学科建设存在的不足,确定学科未来发展的方向,发掘出潜在的具有国际视野的学科带头人。

(五)舆情预测

学生中存在的问题和困惑,往往最先通过网络显露和传播。

如果学生的意见和建议得不到重视或延误解决,就可能在网上形成炒作,个体情绪可能传染到群体,演变为群体的不满情绪,使网络成为舆论的放大器。

通过分析学生网络访问轨迹实现积累监测,利用其需求、行为、动向等众多数据资源加强舆情分析和预警。

另外,通过对学生数据的追踪和分析,能够发现情绪不稳定的学生或者受不法分子蛊惑的学生,及时将有可能发生的悲剧扼杀在摇篮里。

因此,精准的预测分析能提升舆情管理工作水平,提高校园管理水平。

(六)心理咨询

论坛、微博等平台上每天都会产生由评论、帖子、留言等数据,这些数据集反映了师生的思想情况、情感走向和行为动态,对这些数据进行科学的存储、管理并使用大数据技术进行有效的分析利用,建立师生思想情感模型,对掌握师生心理健康程度,有针对性地加强对师生的心理辅导有着重要的意义。

(七)校友联络

校友资源犹如一座座宝藏,对高校的发展建设有着不可替代的重要作用,是高校工作的重要组成部分。

如何有效地把校友联络起来、团结起来,对学校的建设和发展具有重要意义。

利用传统的管理方法,仅校友信息收集就要耗费大量的时间和精力。

利用大数据技术,收集各类社交网站上的非结构化数据,通过分类、聚类等数据挖掘方法,确定校友身份并收集其联系方式、参加的活动信息等,可以大大提高校友数据收集的效率,为以后利用校友资源提供良好的基础。

总之,大数据的教育应用可以为学生提供一个量身定做个性化的学习环境、一个灵活多变可控的教育系统、一个教育问题早期预警的系统,为教师了解学生学习途径和方法提供了崭新的、可视的、可量化的新手段,为管理者提供可视、具体、动态的平台。

四、大数据技术在高校招生工作中的具体应用

人才培养质量是衡量高等学校办学水平的最重要标准,是高校发展的命脉所在。

要想育好才就必须先选好才,招收高质量的新生是提高高校人才培养质量的重要环节之一。

所以高校应努力做好提高生源质量、招收优质新生的高校招生工作。

常见的提高生源质量方法有:

改善教学条件、提高教学质量,优化招生计划;加强招生管理统计,提高生源质量;加大招生宣传力度、扩大学校知名度、建立生源基地;多渠道、多形式选拔优秀考生;完善招生制度,做好录取工作。

(一)大数据下的高校招生决策支持系统粗略设计

为了更好的优化高校招生计划、更有针对性的开展招生宣传工作、更高效和深入的推进优质生源基地建设、完善自主选拔录取工作、强化学生日常管理,为学校招生决策层提供更为有力的决策依据,结合以往的总结和经验、学校招生工作的实际需求确立了以下三个分析与决策主题:

1.录取生源结构分析

对于录取生源结构进行总体分析,可以对录取学生的情况进行综合且具体的了解和掌握,为今后的学生管理、教学安排、学校的招生宣传、专业设置、招生计划的优化提供有意义的指导。

2.学生成绩分析

学生的成绩分析主要基于高考成绩和在校学籍成绩两部分。

高考成绩是高校录取学生的重要依据,若是建立数据库也是学生招生属性的重要组成部分。

学生的在校学籍成绩是入校学生在高校中学习情况的直观表现,经过整合后的如在校加权平均成绩等,都是评判人才培养质量的重要指标。

通过对本主题的分析,可以研究影响学生在校成绩高低的因素,探讨高考成绩和其他相关招生属性与该生在高校中成绩的潜在关联关系。

更甚可以以此为着力点完善高校招生工作和教务管理工作的联动机制,优化和完善学校的人才培养机制。

3.学生毕业去向分析

学生的招生工作、教学环节、就业服务对高校的人才培养工作来说,也就是一个“选才”、“育才”、“成才”的过程。

学生毕业后的去向是真正的对高校人才培养效果的考验。

打个比方的话,招生和就业就好似高校的“入口”和“出口”,看起来关系不大,但其实是有内在联动的。

具体来说就业率总是考生和家长在高考填报志愿时必然关心的问题,所以是直接影响着高校生源质量的好坏,尤其放在如今就业形势日益严峻的大环境下。

通过对本主题的分析,以倒推的方法研究毕业学生的去向和招生属性、学籍成绩的内在关系,可以更好地为开展招生工作提供决策信息,更有效的指导招生工作的展开。

(二)系统结构设计

在招生决策支持系统的设计中,使用基于大数据下数据挖掘或数据仓库之类的新型决策支持系统体系结构。

该系统的主体组成部分如下:

基础业务系统、数据挖掘系统、决策分析系统以及人机交互系统等,整体系统结构如图2所示。

1.基础业务系统

决策支持系统所使用的大数据多数来自基础业务系统,所以基础业务系统是建立数据仓库及数据挖掘的基础。

上文所说的业务系统主要有高校招生网上录取系统、学籍管理系统和毕业生信息管理系统。

2.数据仓库

数据仓库又是决策支持系统中数据存储及组织等功能的基础,在该系统中处于核心的地位,它将所收集到的基础业务数据事物集进行集成、转换与综合,重组成用于分析的数据视图等资料。

可以基于SQL数据库系统构建招生决策数据仓库等。

3.决策分析系统

不同的用户可以从不同级别的数据层,利用不同的分析工具来提取不同类型的信息。

可以基于已建立的招生决策数据仓库等,构建多维数据集,通过联机分析处理对学生历史数据进行分析,通过数据挖掘发现数据中的潜在模式和有价值信息。

4.人机交互系统

人机交互系统是决策支持系统的用户界面,根据系统用户提供的信息,为其返回决策分析的结果。

可尝试采用C#语言基于C/S架构构建人机交互系统。

(三)系统功能模块设计

根据初步设计的功能需求以及所有的数据资源集合,招生决策支持系统可分为三个模块:

1.用户管理模块

本模块完成对系统登录用户的管理功能,包括用户管理、角色定制、权限分配三个子模块。

用户管理子模块:

可已对系统登陆用户的资料、密码等信息进行维护。

(2)角色定制子模块:

本系统的用户角色主要有超级管理员、招生管理员、学籍管理员、就业管理员、招生决策员等。

可通过此模块实现对用户角色的分配,使之享有相应的权限。

只有超级管理员才有对用户管理、权限分配的权限,超级管理员应只有一人。

(3)权限分配子模块:

通过配置角色,将权限细则配置到角色上。

权限细则包括可访问的模块及功能、可访问的数据字段、数据字段的读写权限等。

2.数据管理模块

本模块完成对系统数据管理的功能,包括数据展示、数据维护、数据预处理三个子模块。

数据展示子模块:

拥有相应权限的用户可通过此模块实现对数据仓库中数据的浏览。

浏览方式为字段查看和图表查看。

(2)数据维护子模块:

拥有相应权限的用户可对相应的数据进行维护。

如就业管理员只可对就业数据进行维护。

(3)数据预处理子模块:

可对数据进行简单的离散化分档处理、缺失值处理等。

字段包括毕业学校、高考成绩、专业志愿、在校成绩、专业科类等。

3.决策支持模块

用户通过本模块完成数据挖掘工作,其后用户可以通过可视化界面而直观获取决策信息。

决策支持模块又分为关联规则挖掘子模块、聚类分析子模块和决策树分析子模块三部分。

招生决策支持系统功能结构如图3所示。

(四)决策方法构建方案

解决不同类型、不同程度的问题,需要采用不同的决策方法、构建不同的模型,在系统设计中需要充分利用现有的算法和工具,来完成数据的分析和挖掘,针对上文确立的三个决策主题可构建下列方案:

对于录取生源结构主题可采用聚类算法进行分析,将学生按照某些特征自动分成若干个簇,针对每个簇的个性特征总结出有价值的决策信息以利于开展更有针对性的学生管理工作。

2.对于学生成绩主题尤其是在校学籍成绩的分析可采用决策树算法进行分类分析。

试研究可能影响学生在高校学籍成绩高低的因素有哪些,从而调整相应的招生策略以争夺更为优质的生源。

3.对于学生毕业去向主题可采用关联规则算法进行挖掘分析。

通过对学生的毕业去向与招生数据、学籍数据各属性间的各种关联关系的研究探寻有价值的决策信息。

4.对于一些基本的数据分析和统计工作可借助联机分析处理技术来实现。

联机分析处理从数据仓库中集成的数据出发,可构建面向分析的多维数据模型,从多个不同的角度对数据进行分析和比较。

(五)大数据技术在招生决策中的应用

招生决策数据仓库建好以后,除了进行联机分析外,还要利用数据挖掘等技术对数据仓库中的数据进行特定的、更为深入的分析处理,以便从大量数据中挖掘出以前未发现的但隐式存在的知识,以便于招生决策支持。

一般来说,数据挖掘是一个利用各种分析方法和分析工具,在大规模的海量的数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来作出决策和预测。

支持大规模的数据分析方法及过程,选择及建立适合数据挖掘应用的数据环境是研究数据挖掘的一个重要问题。

数据挖掘一般步骤如图4所示。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2