论文写作规范毕业论文格式开题报告范文|MBA论文范文本科论文范文硕士论文范文博士论文范文

  • 在线提交留言
  • 中职硕士学位论文开题报告

    发布时间:2020-08-26 来源:https://www.boshuolunwen123.com  作者:佚名

      TAGS标签:研究生论文  免费论文  论文下载  写作辅导  论文写作  论文致谢  参考文献  开题报告  职称论文  毕业论文  论文模板  论文范文


    研究生学位论文开题报告
    (中职硕士)

     

    姓名:                 
    导师:             
    专业:      计算机应用      
    学院:      信息学院        


    硕士研究生学位论文开题报告

    姓    名   导师   合作导师 
    专    业 计算机应用 所属学院 信息学院
    学    号   研究方向 数据挖掘
    论文选题 题目名称 数据挖掘理论及其在学生综合评价中的应用
     性质(√) 基础理论研究( )    应用性研究(√)    开发性研究( )
     类别(√) 国家项目( )      合作项目( )    省(部)项目( )
    自选项目(√ )      其它项目(                    项目)
     姓   名 职   称 工作单位及职务 签字
    组长    
    评 审 组 成 员    
        
        
        
        
        
    成绩 (     )票同意  (    )票不同意 评价
    (通过或不通过) 
    注:评审组一般由三到五名副高以上职称专家组成。            (学院盖章)
           年      月     日
    一、拟选课题背景及其研究目的、意义
    互联网的发展和计算机网络技术的普及,改变了人们的生活,让人们利用信息技术生产和搜集数据的能力大大提升。但数据库技术的广泛应用,给人们提供方便的同时,也带来了很多问题。如何有效利用这些数据,让海量的数据成为一个公司的资源而不是负担,成为技术人员研究的热点。面对市场的需求,数据挖掘和知识发现技术的出现成为必然。
    麻省理工学院的《科技评论》曾评估,“数据挖掘”技术是对未来人类产生重大影响的十大新兴技术之一。数据挖掘(Data Mining)是解决数据丰富而知识贫乏的有效途径,其实质是从大量数据中提取隐含的、未知的和潜在有用信息的过程。提取的有用信息可用于信息管理、查询优化、决策支持、过程控制等,还可用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到数据中挖掘知识,提供决策支持。数据挖掘技术汇集了不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。
        随着高等教育制度的改革,各大院校不断扩招,高等教育开始变得大众化,学生的综合素质出现参差不齐的现象。许多学校多年来在教育教学管理工作中积累了大量的数据,然而,由于信息意识和技术的缺乏,隐藏在这些大量数据中的信息一直没有得到有效利用。数据挖掘技术虽然在很多领域都有广泛应用,但在教育教学层面的应用还比较少,处于发展的初级阶段。所以如何从大量的数据中发现有用的信息并进行整合运用,应用到学生的综合评价中,为学校管理层提供决策支持,是各个学校亟需解决的问题。在学生的综合评价中引入数据挖掘技术,使其与综合素质评价工作有机地结合起来,既符合时代潮流的发展趋势,也具有一定的研究价值。

     

    二、本课题及所属研究领域在国内外研究历史、现状及发展趋势
    在1989年8月召开的第11届国际人工智能联合会议的专题讨论会上,KDD(Knowledge Discovery and Data Mining)一词首次被提出。随后,美国人工智能协会又先后多次召开KDD国际研讨会,汇集了来自各个领域的研究人员和应用开发者,集中讨论了数据统计、海量数据分析算法、知识表现、知识运用等问题。会议规模也由专题讨论会逐渐发展到国际学术大会,研究重点逐渐从发现方法转向实际的系统应用。1995年,第一届“知识发现和数据挖掘”国际学术会议在加拿大蒙特利尔召开时首次提出数据挖掘这个学科名称。近年来,数据挖掘技术领域的研究十分活跃。
    数据挖掘(DM,即Data Mining)被称为数据库中的知识发现(KDD),是数据库系统和数据库应用领域一个前沿学科。在业内,数据挖掘视为数据库知识发现的一个基本步骤,是KDD过程中对数据应用算法抽取知识的过程。目前,国际上有影响的典型数据挖掘系统有SAS公司的Enterprise Miner,IBM公司的Intelligent Miner,SGI公司的Set Miner等。与国外相比,国内对数据挖掘的研究起步较晚。近几年,国内在数据挖掘和知识发现方面也取得了相当多的研究成果。目前数据挖掘和知识发现的研究已经形成了三根强大的技术支柱:数据库、人工智能和数理统计。
    目前,从国内外的研究进展来看,各个领域的技术界限还未突破,各学科的研究没有相互融合。未将并行优化的各种方法集成用于数据库中的数据挖掘,从而提高实时性,并解决随机的、动态的、不完全的及混沌数据的数据挖掘。离达到所谓的智能数据挖掘还有很大的差距。
    现在,数据挖掘技术的研究日益活跃,数据挖掘在未来的发展趋势可能会集中在一下几个方面:
    1.像SQL语言一样,研究标准的数据挖掘语言,促进各个领域数据挖掘系统的互操作。
    2.寻求数据挖掘过程中的可视化方法,使人们可以在知识发现的过程中进行很好的人机交互。
    3.根据不同的数据存储类型的特点进行针对性的研究,如文本数据、图形图像数据、多媒体数据等。
    开发针对特定应用的数据挖掘系统。随着数据挖掘应用范围的日益扩大,数据挖掘在特定应用问题时的局限性也成为研究的热点。


    三、本课题拟解决的主要技术问题,在理论和应用方面的意义,研究的主要内容,拟采取的研究方法、技术路线及可行性分析,预期达到目标,完成课题的条件(包括个人业务水平、实验室或学科组的技术、设备条件)
        1.拟解决的主要技术问题及意义
        本课题拟解决的主要技术问题为:
        (1)学生综合评价的关键指标的确定
    目前,学生综合评价指标主要依赖于经验。因此,本课题拟选择4个一级指标,15个二级指作为学生的评价参数,通过数据挖掘的理论及技术得到这些指标对学生成长的影响以及各个指标对学生影响程度。除此之外,得到这些指标的相互关联关系。
    (2)数据挖掘在学生综合评价中的研究应用
        通过数据挖掘在学生综合评价中应用的研究,可以有效的弥补传统评价方式的不足,同时也可以在数据挖掘技术应用的过程中发现其局限性,以实际需求来促进数据挖掘的理论研究,同时为今后数据挖掘应用问题的研究提供参考。数据挖掘在学生综合评价中发现的知识可以为学生管理工作、学校政策调整、学生评奖评优以及就业推荐等方面提供决策支持。
        2.本文研究的主要内容,使用的方法,及预期目标
       本课题拟研究的主要内容如下:
       (1)选择合适数据挖掘理论确定数据挖掘的方法
        数据挖掘是指从大量的数据中自动搜索隐藏数据于其中的有着特殊关系性的信息的过程。挖掘的方法包括:关联规则、神经网络、决策树、遗传算法、粗糙集理论、模糊集方法等。数据挖掘的过程分为三个阶段:数据准备、数据挖掘、结果表示和解释。国际权威的学术组织ICDM,于06年12月评选出的数据挖掘领域的十大经典算法。很多专家认为不仅仅是选中的十大算法,参加评选的18种算法,随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。在论文研究中,通过比较这些方法的优缺点,在学生综合评价中选择合适的数据挖掘方法。
    考虑到决策树方法产生的分类规则易于理解,准确率较高的优点。本课题拟采用决策树算法对学生数据进行挖掘。决策树与其他模型相比运算速度相对较快且易于转换成SQL语句,同时决策树能获得相近或更好的分类准确率。另外,相比于其它算法,决策树的优点为:决策制定的过程是可见的,可以解释结果是如何产生的,描述简单,分类速度快,特别适合大规模的数据处理。而且决策树的构造过程不需要任何领域知识。
    (2)确定评价参数并建立决策树规则
     数据挖掘技术是面向应用的,本课题拟以新疆哈密职业技术学院为研究对象,研究数据挖掘在学生综合评价中的应用。新疆哈密职业技术学院是2014年6月由中等职业教育学校变为高等职业教育院校,一所集中等职业教育、成人函授教育、技能培训和鉴定于一体的全日制中等职业学校,学校包含的学生素质参差不齐,要对其进行综合评价首先需要确定评价的指标。学生的综合素质大体包括:思想道德素质(政治表现、道德修养、法纪观念、学习态度、卫生习惯)、专业技能素质(专业学习成绩、学习实践动手能力、科研创新能力、英语及计算机应用能力)、人文素质(人文社会知识、社会工作、社会实践活动)、身心素质(身体健康状况、体育运动水平、心理健康状况)等四个方面。

    利用决策树分类理论构建学生综合评价决策树,实现学生综合评价定性分析。首先,建立决策树分类规则,规则如下:
    综合素质按优秀、良好、一般、差分为1,2,3,4级;
    思想道德素质按良好(排名前40%)、一般(排名40%只80%)、差(排名后20%)分为1,2,3级;
    专业素质按优秀(排名前20%)、良好(排名20%至40%)、一般(排名40%至60%)、较差(排名后40%)分为1,2,3,4级;
    人文素质按较好(排名前40)、一般(排名40%只80%)、差(排名后20%)分为1,2,3级;
    身心素质按良好和较差分为1,2级;
    综合素质评价的等级按照四个方面:思想道德素质、专业素质、人文素质、身心素质进行分级的优先顺序为思想道德素质、专业素质、人文素质、身心素质来建立规则。根据分类规则建立决策树,进行综合素质分类。
    (3) 构造决策树并建立数据训练集
    论文研究的第三个内容是生成决策树,而构造决策树的关键就是进行属性选择度量。因为属性选择度量决定了给定节点上的元组如何分裂。它提供每个属性描述给定训练元组的秩评定,具有最好度量得分的属性被选作给定元组的分裂属性。常用的度量指标有信息增益、增益率及Gini系数,使用信息增益的算法主要有ID3,使用增益率的代表算法有C4.5,使用Gini系数的代表算法有CART。 本课题拟选用C4.5算法进行讨论。
          然后,依据构建的决策树分类规则来建立数据训练集。输入样本中每个学生的素质测评数据,并在SQL Server的Analysis Services的挖掘模型中,选择决策树分类的模型来进生成决策树。最后,通过自动生成的决策树,对学生综合素质进行分析,可以有效的为学生管理者提供辅助决策支持。
        (4)开发综合评价系统
    在上述理论的基础上, 拟以C#为开发语言,SQL Server2008为数据库存储工具,开发基于决策树的学生综合评价系统。在系统中,依据构建的决策树分类规则来建立数据训练集,先输入样本中每个学生的素质测评数据,并在SQL Server的Analysis Services的挖掘模型中,选择决策树分类的模型来进生成决策树。最后,通过自动生成的决策树,对学生综合素质进行分析,可以有效的为学生管理者提供辅助决策支持。
    可行性分析
    数据挖掘技术在很多领域已经成功应用并取得很大的经济效益,同时,数据挖掘理论也取得了很多研究成果,为本课题研究提供了强大的理论支撑,所以从技术上本课题研究是可行的。
    本课题研究经济投入较少,而且能为学生管理工作带来便利,可以节省学校的人力、物力、财力,所以从经济上本课题也是可行的。
    预期目标
        本课题拟实现的目标是通过研究讨论,数据挖掘应用于学生综合评价中能够为学生管理、学生就业、教学改革等提供很好的决策支持,有助于推动学生综合素质的培养。
        3.完成课题的条件
    本人在导师的指导下,搜集和阅读了大量的与数据挖掘相关的中英文文献,对本领域的研究意义、研究现状以及存在的问题有了较深入的了解。而且通过对人工智能、模式识别等课程的学习,储备了一定的理论基础。此外,本人一直担任学院《计算机应用基础》的代课老师,同时还担任继续教育中心成人函授班的班主任,熟悉学生工作,并经常接触学生的综合评价工作。多年的工作学习为接下来的研究工作打下了良好的基础。
         硬件设备上,设备齐全且运行良好,其中计算机必须满足的条件:
        (1)CPU:Intel Pentium 1GHz或更高的处理器(推荐酷睿2或更高的处理器),或任何运行于Microsoft Windows NT Workstation的Alpha的处理器。
        (2)操作系统:Microsoft Windows XP/vista/7或Microsoft Windows NT Service/Workstation4.0(推荐Service Pack5)或更高版本,或者Unix,Linux操作系统。
        (3)监视器:Microsoft Windows支持的VGA或分辨率更高的监视器。
        (4)内存:512MB内存以上。
    软件上,学校有免费开放的图书馆,以及万方、知网等全文数据库,以上条件能够保证本课题研究的顺利进行。

     

    参考文献
    [1]Jiwei Han,Micheline Kambr.数据挖掘概念与技术[M].北京:机械工业出版社,2007
    [2]敖广武,丛红卫.数据挖掘理论和开发方法[J].信息技术,2003
    [3]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利出版社,2003
    [4]吕成哲,赵晓明,王起伟.浅谈数据挖掘理论[J].信息技术,2007
    [5]赵岩,赵慧娟.数据挖掘理论与技术[J].福建电脑,2006
    [6]吴斌.基于数据挖掘技术的学生成绩分析评价与研究[D].南昌大学,2009-12-12
    [7]夏火松.数据仓库与数据挖掘技术[M].北京:科学出版社,2004
    [8]王锐,马德涛.数据挖掘技术及其应用现状探析[J].电脑应用技术,2007
    [9]陈京民.数据仓库与数据挖掘技术[M].北京:电子工业出版社,2002
    [10]罗克.数据库中数据挖掘理论方法及应用研究[D].湖南大学,2005-01-01
    [11]张志军.大学生综合测评系统的构建研究[J].中国成人教育,2007-04-30
    [12]牛祥春.基于数据挖掘的学生综合测评系统应用研究[D].2006-05-01
    [13]陈显祥.基于学生综合测评系统数据挖掘应用研究[D].贵州大学,2007-04
    [14]翁宇.数据挖掘技术在高职教学质量评价中的应用[D].华南理工大学,2010-11-23
    [15]Han J.Conference tutorial notes:data mining techniques.In:Processing of ACM SIG MOD International Conference’96 on Management of Data (SIFMOD’96). Montreal, Canada.June,1996
    [16]Margart H.Dunham.DATA MINING Introductory and Advanced Topics[M].北京:清华大学出版社,2003

     


    四、课题进展计划(包括各阶段计划完成的内容和所需的时间等)
    进度安排 计划完成内容 所需时间
    第一阶段
    (2015.9-2015.10) 查阅数据挖掘及其应用的相关文献,确定研究方向,并征求导师意见,拟定论文题目 1个月
    第二阶段
    (2015.10-2015.11) 撰写开题报告 半个月
     完成开题报告 半个月
    第三阶段
    (2015.11-2016.5) 准备论文初稿,完成论文初稿 六个月
    第四阶段
    (2016.5-2016.11) 在导师的指导下修改论文初稿,然后再多次修改论文,并最终定稿,完成论文 六个月
    第五阶段
    (2016.11-2017.1) 最终定稿,校正论文格式,完成论文,提交并准备论文答辩 二个月

     

    五、合作导师意见(是否同意开题)
                                              
    合作导师签字:           
                                                   年   月   日
    六、导师对硕士生开题报告的评语(研究生对国内外文献、动态、水平是否了解清楚,所选课题是否适当、正确,预期目标能否达到,理论和实际应用的价值如何、路线和措施是否具体可行等)

     


                                             导师签字:                   

    年     月    日
    七、开题报告会评审组意见

     

    组长(签字):              
     年     月     日
    八、学院审核意见

     

                                       主管院长(签字):             

    原文地址:https://www.boshuolunwen123.com/kaitibaogao/shuoshi_kaitibaogao/37462.html,如有转载请标明出处,谢谢。 您可能在寻找关于硕士论文开题报告方面的范文,您可以到开题报告频道查找。

    在线咨询】【写作辅导】【论文检测】【论文改重】【论文翻译

    会员投稿】【范文模板】【开题报告】【资料下载】【提交留言

    发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表
    论文写作指导
    论文在线咨询

    热门论文热门下载

    京ICP备18055229号