Ⅰ 数据仓库的主题和主题域是什么关系
数据仓库的主题和主题域是什么关系
主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。
Ⅱ 数据仓库的主要应用在哪些方面
数据仓库是一个面向主题的,集成的,时变的和非易失的数据集合,支持管理部门的决策过程。面向主题是指数据仓库围绕一些主题来组织,区别于事务。
集成的是指数据仓库是将多个异构数据源集成在一起。
时变的是指数据存储从历史的角度提供数据。
非易失的是指数据仓库只在初始化装入和数据查询时操作数据,不存在更新,插入等操作,极大多为读操作,而非写操作。
数据仓库更多的是用于决策分析,通过分析储存的历史数据挖掘出规律,以及预测以后的发展。
Ⅲ 数据仓库 主题数量 不超过多少
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合
数据仓库,英文名称为Data Warehouse,可简写为DW。
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。
◆集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库是一个过程而不是一个项目。
数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。
从功能结构化分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分
数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。
并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
Ⅳ adventureworksdw2008数据仓库包含了哪些业务主题
简单地说就一个数据库!
现阶段用的数据库有:Oracle,DB2,My Sql,Ms Sql Server等!
Ⅳ 在一个数据仓库里面,可以构建多个主题吗能构建多个多维数据集
当然可以建多个主题了,数据仓库就是以主题划分的,你说的多维数据集是MS SQLSERVER2005里的概念吧 我不太清楚
Ⅵ 怎么理解数据仓库中的面向主题
1、面向主题,是让你面向主题去分析问题,架构模型,而不是非要物理上分开,就像面向对象编程一样
2、“很多资料中都写数据仓库的数据模型是使用“第三范式”,数据集市才使用多维的星型模型”这个是不对的,因为在Inmon 和 Kimball 的书中都没有表示这种说法
Inmon 表是建数仓需要有个企业级的一致数据模型,并没有表示非要第三范式,这个第三范式是 Kimball 在自己的书里说 Inmon 的方式用第三范式不好啦啥的,具体自己看书《数据仓库工具箱-维度建模权威指南》第一种1.5节
数据集市使用维度建模,这个说法Kimball 也没有说过,而是 Inmon 在自己的书里说维度建模只适合数据集市,具体看《数据仓库》第5张5.19节(应该是这一节)
PS:其实感觉他俩的观点差不多,只是根据他们必须得给自己的观点加油呐喊而已,两个人互撕很多年了
Ⅶ 数据库与数据仓库的区别
数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
“与时间相关”:数据库保存信息的时候,并不强调一定有时间信息。数据仓库则不同,出于决策的需要,数据仓库中的数据都要标明时间属性。决策中,时间属性很重要。同样都是累计购买过九车产品的顾客,一位是最近三个月购买九车,一位是最近一年从未买过,这对于决策者意义是不同的。
“不可修改”:数据仓库中的数据并不是最新的,而是来源于其它数据源。数据仓库反映的是历史信息,并不是很多数据库处理的那种日常事务数据(有的数据库例如电信计费数据库甚至处理实时信息)。因此,数据仓库中的数据是极少或根本不修改的;当然,向数据仓库添加数据是允许的。
数据仓库的出现,并不是要取代数据库。数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。
目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。
Ⅷ 数据仓库的主题划分,列举有哪些主题.试题
我觉得俺主题分类是易于查找,既然是“仓库”,那么必须有一种分类方式来解决储存、寻找储存数据,而且数据细分的话类别很多,按照别的分类方法会造成分类难以界定,因为有的数据不是那么容易划分的,而按照主题分类,那么这种模糊分类方法就比较实用啦!