1.1什么是数据挖掘? (a)它是一种广告宣传吗? (d)它是一种从数据库、统计学、机器学和模式识别发展而来的技术的简单转换或应用吗? (c)我们提出一种观点,说数据挖掘是数据库进化的结果,你认为数据挖掘也是机器学习研究进化的结果吗?你能结合该学科的发展历史提出这一观点吗?针对统计学和模式知识领域做相同的事 (d)当把数据挖掘看做知识点发现过程时,描述数据挖掘所涉及的步骤 答:数据挖掘比较简单的定义是:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们所不知道的、但又是潜在有用信息和知识的过程。 数据挖掘不是一种广告宣传,而是由于大量数据的可用性以及把这些数据变为有用的信息的迫切需要,使得数据挖掘变得更加有必要。因此,数据挖掘可以被看作是信息技术的自然演变的结果。 数据挖掘不是一种从数据库、统计学和机器学习发展的技术的简单转换,而是来自多学科,例如数据库技术、统计学,机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成。 数据库技术开始于数据收集和数据库创建机制的发展,导致了用于数据管理的有效机制,包括数据存储和检索,查询和事务处理的发展。提供查询和事务处理的大量的数据库系统最终自然地导致了对数据分析和理解的需要。因此,出于这种必要性,数据挖掘开始了其发展。
完整课后答案请下载附件,回复本帖子即可查看解压密码
|