解释下什么是数据仓库「数据库与数据仓库的主要区别」

互联网 2023-03-13 17:45:57

今天给大家普及一下解释下什么是数据仓库「数据库与数据仓库的主要区别」相关知识,最近很多在问解释下什么是数据仓库「数据库与数据仓库的主要区别」,希望能帮助到您。

今天又学了一点[加油]

什么是数据仓库呢?

数据仓库之父(W.H Inmon)在1991年出版的“Building the Data Warehouse”(《数据仓库》)中定义:数据仓库是面向主题的、集成的、相对稳定的、随时间变化的用于支持管理决策的数据集合。

一、面向主题

数据仓库是给分析人员看的,因此需要根据分析时关注的角度组织数据(主要是为了方便数据分析)。这里关注的角度就是主题,比如说电商行业关注的就是用户、商品、订单等等主题。

二、集成

集成就是数据仓库的数据是从原本分散的业务数据库抽取聚合而成的。因为需要按照主题组织数据,原本业务库表就需要进行整合。

三、相对稳定

相对稳定是说数据仓库的数据是不能修改的。这里的不能修改是因为数据仓库的数据是从其他分散业务库聚合而来,不能修改聚合后的数据。当然业务库表是不断变化的,这时就需要将变化同步到数据仓库。这里同步一般是增量同步,而不是修改原本数据仓库数据。

四、随时间变化

因为业务随时间是不断变化的,分析人员要借助数据仓库分析数据必须保障数据仓库数据的实效性。

总的来说数据仓库本质上还是数据库,只是这是面向数据分析人员的数据库。