作者: | 来源:互联网 | 2023-09-18 14:11
ch01绪论重点Q1.数据仓库的四个特征面向主题集成的不可修改随时间变化Q2.数据仓库数据的粒度与组织数据的粒度是指数据仓库的数据单元中所保存数据的综合程度数据的综合程度越高,其粒
ch01 绪论
重点
Q1. 数据仓库的四个特征
Q2. 数据仓库数据的粒度与组织
- 数据的粒度是指数据仓库的数据单元中所保存数据的综合程度
- 数据的综合程度越高,其粒度越粗
- 数据仓库存储的数据粒度越细,则占用的存储空间越大,但提供的更细节的查询
Q3. 知识发现概念
- 定义:知识发现(KDD)就是采用有效算法从大量的、不完全的、有噪声的、模糊和随机的数据中识别出有效的、新颖的、潜在有用乃至最终可理解的模式(Pattern)的非平凡过程
- 过程:
- 数据采集
- 数据预处理
- 数据挖掘
- 知识评价
- 知识应用
- 知识发现过程中一个特定而关键的步骤:数据挖掘
Q4. 数据挖掘的数据来源
- 数据库
- 传统数据库(DB)
- 数据仓库(DW)
- 空间数据库(Spatial Database)
- 时态数据库和时间序列数据库(Temporal Database and Time-Series Database)
- 多媒体数据库(Multimedia Database)
- 文本数据库(Text Database)
- 非数据库
Q5. 数据挖掘的步骤
- 问题定义
- 数据准备
- 挖掘实施
- 评估解释
- 知识应用
Q6. 数据仓库与数据挖掘的区别
- 结论:数据仓库不是为数据挖掘而生的,反过来数据挖掘也不是为数据仓库而活。它们是支持决策的两个相对独立的知识体系
Q7. 数据仓库与数据挖掘的联系
一个中心(决策支持),两个基本点(DW,DM)
- DW为DM提供了更好的、更广泛的数据源
- DW为DM提供了新的数据支持平台
- DW为DM提供了方便
- DM为DW提供了更好的决策支持工具
- DM为DW的数据组织提出了更高的要求
- DM为DW提供了广泛的技术支持
课后练习题
4. 简述数据仓库的定义
答: 数据仓库是一个面向主题的、集成的、不可修改的、随时间变化的,支持管理决策的数据集合
5. 简述数据库与数据仓库的关系
答:数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成的
相关:
数据库与数据仓库的区别:
- 数据库是面向事务设计的,数据仓库是面向主题设计的
- 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据
- 数据库是为捕获数据而设计,数据仓库是为分析数据而设计
- 事务系统是实时的,而分析系统是事后的
6. 简述数据仓库特征
答:
11. 简述数据挖掘的主要步骤
答:
ch02 数据仓库原理