往期目录
文章荟萃
基于知识平台的S研究院数据挖掘模型
来源:2011年第04期 作者:吴曦 点击:
次
一、数据挖掘概述1、数据挖掘的概念数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取潜在有用的信息和知识的过程。[1]信息技术的高度发展,人们积累的数据量不断增长,如何从海量的数据中提取有用的知识至关重要,数据挖掘就是为顺应这种需要而发展起来的数据处理技术,主要用于解决“信息丰富,知识贫乏”的问题。同时,数据挖掘也可通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘基本功能主要包括:自动预测趋势和行为、关联分析、聚类、概念描述、偏差检测等。[2]2、数据挖掘的原理和方法数据挖掘基本原理的处理过程:首先,构建目标数据集,即根据用户要求从各种资源中提取的相关有用数据,数据挖掘主要从这些数据通信中进行数据提取;而后预处理,即整理目标数据,除去明显错误和冗余的数据,进一步精简所选数据的有效部分,并将数据转换成有效形式,以使数据通过算法和建模(包括选取合适的模型和参数)构造成模型。并用一定的方法表达成 ...
- 上一篇:关于房地产企业会计核算的探讨
- 下一篇:我国汽车行业上市公司绩效实证分析