admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:layuiadmin iframe)

数据挖掘概念与技术

• 数据挖掘概述

o 数据挖掘概念

▪ 从大量数据中挖掘有趣模式和知识的过程。数据源包括数据库、数据仓

库、Web、其他信息储存库或动态流入系统的数据

▪ 从数据中挖掘知识、数据中的知识发现(KDD)

o 知识发现过程

▪ (1)数据清理:消除噪声和删除不一致数据

▪ (2)数据集成:多种数据源可以组合在一起

▪ (3)数据选择:从数据中提取与分析与任务相关的数据

的形式

(4)数据变换:通过汇总和聚集操作,把数据变换和统一成适合挖掘

▪ (5)数据挖掘:基本步骤,使用智能方法提取数据模式

▪ (6)模式评估:根据某种兴趣度量,识别代表知识的真正有趣的模式

(7)知识表示:使用可视化和知识表示技术,向用户提供可挖掘的知

o 数据收集和数据库创建 (20世纪60年代或更早) 原始文件处理

▪ 数据库管理系统(20世纪70年代-80年代初期)

• 高级数据库系统(20世纪80年代中期-现在)

• 高级数据分析(20世纪80年代后期-现在)

o 数据挖掘的数据类型

▪ 数据库系统

• 组成

o 内部相关的数据(数据库)

o 管理和存取数据的软件程序

▪ 定义数据库结构和数据储存,说明和管理并发、共享


本文标签: 数据 知识 数据库 挖掘