论文写作规范毕业论文格式开题报告范文|MBA论文范文本科论文范文硕士论文范文博士论文范文

  • 在线提交留言
  • 数据挖掘技术的现状和发展趋势

    发布时间:2020-04-10 来源:https://www.boshuolunwen123.com  作者:博硕论文辅导网

      TAGS标签:研究生论文  免费论文  论文下载  写作辅导  论文写作  论文致谢  参考文献  开题报告  职称论文  毕业论文  论文模板  论文范文

    数据挖掘技术的现状和发展趋势
        近十几年来,数据膨胀之巨大己到了让人不可思议的地步,超大型数据库、数据仓库被频繁的用于企业管理、政府应用、科研和应用软件开发等等。如何从这些数据中获取有用的知识,提高信息的获取能力和效率成为我们面临的新问题。如果这些数据不能为公司的业务决策和战略发展服务,不能成为公司发展借助的有效资源,那么这些海量的数据将成为我们的包袱甚至是占用我们存储空间的垃圾数据。数据挖掘技术逐渐成为帮助我们业务发展的主流工具,但是需要有一个误区需要走出来,就是并非所有的信息发现认为都被看做是数据挖掘。我们应该将其与一些我们认为是数据挖掘的任务分开,如使用数据库管理系统查找某个记录,或通过Internet搜索引擎查找你需要的页面,这些工作则是另一个领域的任务一信息检索(information retrieval)领域的任务。虽然这些领域的任务是看上去很重要,其数据程序和数据结构方面可能使用了较为复杂的算法,但是它们主要依赖较为成熟的计算机语言和数据的明显特征通过创建索引目录有效地组织和检索信息。在这些方面,随着数据挖掘技术的不断开发,也己经用来嵌入到信息检索领域以能够增强信息检索系统的能力。
    一、数据挖掘技术的现状
        当今数据库领域较为突出的两个研究方向分别是数据挖掘(Data Mining)与知识发现(KDD)。知识发现的提出是1989年8月召开的第十一届国际人工智能大会并正式形成的,六年后在加拿大蒙特利尔召开的首届KDD&Data Mining国际学术会议上,把数据挖掘技术详细分为科研领域的知识发现与工程领域的数据挖掘。在此之后十几年,每年都举办一次这样的会议,数据挖掘技术的理论研究与技术应用的发展取得了长足的进步和可喜的成果。自数据挖掘提出以来其研究主要围绕理论论证、技术创新和实践应用三个方面展开。将现有的多重理论与研究方法进行合理整合是数据挖掘研究人员采用的有效技术。这些技术的应用从常规情况来看主要是依靠开发商业应用软件对从单纯对解决问题的激励条线向解决整体系统性问题的方向转变,金融机构如保险、证券、零售行业甚至是网络行业占有相当一部分比例。国际上许多软件公司和科研机构都对Data Mining的开发应用非常重视,我们所熟知的微软Google都有专门的研究中心进行开发工作。美国既是全球的金融中心,也是数据挖掘研究最为广泛的地区,其每年投入的人力、财力都是其他国家投入的几倍。我国因为种种原因,虽然数据挖掘技术起步晚发展慢,但与我国的经济走势一样呈现出积极的进步力量。另外一个现实问题是,我国的研究人员分布较为集中,绝大数据研究学者通过高校的费用支持进行研究,少部分研究人员分布在较为发达地区的公司(如北上广深等大型公司的总部),科研的重点放在数据挖掘的算法研究方面。
    二、数据挖掘的发展趋势
        数据挖掘发展的二十多年,其应用范围不断扩大,逐渐渗透到工作、生活中的各个方面,在互联网、金融等领域有不少成功的应用案例,对数据挖掘进行理论和方法的实践结合成为大多数挖掘人员的有效技术。但是当前数据的多样性和复杂性给我们的挖掘任务设置了太多障碍,我们需要通过设计不同的算法和挖掘流程去应对这样的难题,开发出一整套便于我们识别和使用的方法促进我们的工作。数据挖掘的设计、应用、评估人员所面临的主要问题是如何去在一个未被优化的挖掘环境中通过一套行之有效的数据语言,取之可用的挖掘算法,在一个内部开放共享的数据挖掘平台,实现人机交互和大数据的聚合,顺利解决困扰我们的应用困难,这个问题将是困扰我们尤其是初学者、初用者的一个主要困难。那么面对这样一种发展趋势,我们的应对策略有哪些?
         (1)数据挖掘理念与方法的扩展:数据挖掘的初衷是帮助需要他的人或者公司提高其个人效率和企业竞争力。随着数据挖掘理念逐渐进入大家的视野,数据挖掘的影响力也在不断放大,很多行业如生物医学,证券投资和通信等多个领域都有它的影子。此外,当前最火的电子商务(网购平台)和电子市场(交往软件)也成为数据挖掘应用的重要领域。但是当前应用的仅仅是数据挖掘的通用系统,针对具体问题开发特定的应用系统是下一步发展的趋势之一。
          (2)可调整的数据挖掘方法:初级阶段的数据分析一般是非交互方式,而当前阶段数据挖掘为了实现对海量数据的处理多采用交互方式以达到处理的效能。这种交互方式的最大好处是能够消化处理大量数据的同时,通过其互动的特性对数据挖掘过程中的方式方法进行及时调整,提高了挖掘方式的伸缩性和延展性,同时这种可调整或者说是能够伸缩的数据挖掘方法在强调用户交互的同时通过其“伸缩性”改进了数据挖掘的效率。允许用户调整提数口径和挖掘条件引导第三方挖掘工具以研究人员可接受的模式进行动态反馈,更加操作灵活的方式提供了一种特殊的操作体验。
          (3)数据挖掘与多系统集成:数据库、数据仓库和互联网技术是源信息的主要承载体。数据挖掘技术的应用前提是需要与上述载体能够对接,利用挖掘技术的延展性和伸缩性等特性,嵌入到上述系统中,获取真实、可靠的第一手数据,将数据聚类、关联分析、分类和预测挖掘高度融合形成统一的整体。
        (4)可视化数据挖掘:如果想将数据挖掘更好的推广可开发,其可视化程度必须提高,可视化给人以直观的感受,可视化也是从海量数据中发现关键信息的有效途径。只有将视觉界面清晰化,操作步骤简单化,才有可能将数据挖掘技术向成为数据分析的基本工作迈进。
          (5)探索创新多重复杂类型的数据挖掘:随着时代的发展和科技的进步,数据资源朝着多元化的方向发展,数据的复杂程度不断加大,如何快速处理不断变化的数据成为研究人员继续探索的方向。即使在web挖掘、文本类型挖掘、Multimedia挖掘、时序和序列挖掘取得了部分成果,但是上述成果的应用仍然未普及,挖掘的局限性较大。因此对于复杂数据的研究应结合数据分析技术进行挖掘式研究。
          (6)隐私保护与信息安全:信息泄露为当今社会普遍关注,数据挖掘过程中难免会对一些敏感信息有所涉及,因此数据挖掘的同时能否对信息有效保护也是人们关注的重点。随着各种数据挖掘算法和分析方式的研究,整个社会面临的严峻形势就是个人隐私能否得到保护,或者说虽然进行了挖掘但没有泄露,因此不管对数据挖掘方法做何开发出一种能够为用户信任的数据挖掘方法,以便在适当的信息访问和挖掘过程中确保隐私保护与信息安全也是数据挖掘发展的趋势之一。
     

    原文地址:https://www.boshuolunwen123.com/lgyx_lunwen/ruanjian_lunwen/22937.html,如有转载请标明出处,谢谢。 您可能在寻找关于软件工程论文方面的范文,您可以到理工医学论文频道查找。

    在线咨询】【写作辅导】【论文检测】【论文改重】【论文翻译

    会员投稿】【范文模板】【开题报告】【资料下载】【提交留言

    发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表
    论文写作指导
    论文在线咨询

    热门论文热门下载

    京ICP备18055229号