文章荟萃

基于知识平台的S研究院数据挖掘模型

来源:2011年第04期 作者:吴曦 点击:

一、数据挖掘概述1、数据挖掘的概念数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取潜在有用的信息和知识的过程。[1]信息技术的高度发展,人们积累的数据量不断增长,如何从海量的数据中提取有用的知识至关重要,数据挖掘就是为顺应这种需要而发展起来的数据处理技术,主要用于解决“信息丰富,知识贫乏”的问题。同时,数据挖掘也可通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘基本功能主要包括:自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测等。[2]2、数据挖掘的原理和方法数据挖掘基本原理的处理过程:首先,构建目标数据集,即根据用户要求从各种资源中提取的相关有用数据,数据挖掘主要从这些数据通信中进行数据提取;而后预处理,即整理目标数据,除去明显错误和冗余的数据,进一步精简所选数据的有效部分,并将数据转换成有效形式,以使数据通过算法和建模(包括选取合适的模型和参数)构造成模型。并用一定的方法表达成 ...

《中外企业家》  主管单位:哈尔滨工业大学    主办单位:中外企业家杂志社    ISSN:1000-8772    国内刊号:23-1025/F    邮发代号:2-287    创刊年:1984
未经本刊授权,不得转载本站资料