千字文解讀數(shù)據(jù)倉庫!詳細(xì)
數(shù)據(jù)倉庫的誕生
1991年(Bill Inmon)比爾·恩門提出數(shù)據(jù)倉庫概念,在其著作《建立數(shù)據(jù)倉庫》一書中定義了數(shù)據(jù)倉庫的概念,該書中提供了建立數(shù)據(jù)倉庫的意見和基本原則,因此(Bill Inmon)比爾·恩門被稱為數(shù)據(jù)倉庫之父。
數(shù)據(jù)倉庫的發(fā)展
簡單報表階段:系統(tǒng)的主要目標(biāo)是解決一些日常的工作中業(yè)務(wù)人員需要的報表,以及生成一些簡單的能夠幫助領(lǐng)導(dǎo)進(jìn)行決策所需要的匯總數(shù)據(jù)。這個階段的大部分表現(xiàn)形式為數(shù)據(jù)庫和前端報表工具。
數(shù)據(jù)集市階段:主要是根據(jù)某個業(yè)務(wù)部門的需要,進(jìn)行一定的數(shù)據(jù)的采集,整理,按照業(yè)務(wù)人員的需要,進(jìn)行多維報表的展現(xiàn),能夠提供對特定業(yè)務(wù)指導(dǎo)的數(shù)據(jù),并且能夠提供特定的領(lǐng)導(dǎo)決策數(shù)據(jù)。
數(shù)據(jù)倉庫階段:主要是按照一定的數(shù)據(jù)模型,對整個企業(yè)的數(shù)據(jù)進(jìn)行采集,整理,并且能夠按照各個業(yè)務(wù)部門的需要,提供跨部門的,完全一致的業(yè)務(wù)報表數(shù)據(jù),能夠通過數(shù)據(jù)倉庫生成對對業(yè)務(wù)具有指導(dǎo)性的數(shù)據(jù),同時,為領(lǐng)導(dǎo)決策提供全面的數(shù)據(jù)支持。
數(shù)據(jù)倉庫的概念
數(shù)據(jù)倉庫是在企業(yè)管理和決策中,面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合。
面向主題的:
在建設(shè)企業(yè)級數(shù)據(jù)倉庫中,數(shù)據(jù)是分主題域的,比如:以某車輛管理數(shù)倉項(xiàng)目為例:城市主題域、車輛品牌主題域、車輛信息主題域、訂單主題域、用戶主題域等。
集成的:
數(shù)據(jù)倉庫中的數(shù)據(jù),是由分散的多個業(yè)務(wù)方數(shù)據(jù)庫(mysql/oracle/其他數(shù)據(jù)庫相關(guān))、數(shù)據(jù)文件(文字、圖片、視頻、聲音等**)、用戶日志(按空格分隔開的數(shù)據(jù)、按_分隔開的數(shù)據(jù))抽取來的,集成的數(shù)據(jù)來源,一般是內(nèi)部數(shù)據(jù)(局域網(wǎng)內(nèi)部數(shù)據(jù),外網(wǎng)訪問不到的)和外網(wǎng)數(shù)據(jù)(業(yè)務(wù)采集服務(wù)器上或者可訪問接口拿到的數(shù)據(jù)等)
與時間相關(guān)的:
數(shù)據(jù)倉庫包含各種粒度的歷史數(shù)據(jù)。數(shù)據(jù)倉庫中的數(shù)據(jù)可能與某個特定日期、星期、月份、季度或者年份有關(guān)。
數(shù)據(jù)倉庫的數(shù)據(jù)隨時間的變化表現(xiàn)在以下三個方面:
1.數(shù)據(jù)倉庫的數(shù)據(jù)時限一般要遠(yuǎn)遠(yuǎn)長于操作型數(shù)據(jù)的數(shù)據(jù)時限
2.業(yè)務(wù)系統(tǒng)存儲的是當(dāng)前數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)是歷史數(shù)據(jù)
3.數(shù)據(jù)倉庫中的數(shù)據(jù)是按照時間順序追加的,都帶有時間屬性
不可修改的:
數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一般情況下并不進(jìn)行修改操作。
數(shù)據(jù)庫中進(jìn)行聯(lián)機(jī)處理的數(shù)據(jù)經(jīng)過集成輸入到數(shù)據(jù)倉庫中,一旦數(shù)據(jù)倉庫存放的數(shù)據(jù)已經(jīng)超過數(shù)據(jù)倉庫的數(shù)據(jù)存儲期限,這些數(shù)據(jù)將從當(dāng)前的數(shù)據(jù)倉庫中刪去。因?yàn)閿?shù)據(jù)倉庫只進(jìn)行數(shù)據(jù)查詢操作,所以數(shù)據(jù)倉庫管理系統(tǒng)相比數(shù)據(jù)庫管理系統(tǒng)而言要簡單得多。
簡單總結(jié)一下:數(shù)據(jù)倉庫中保存的數(shù)據(jù)是一系列企業(yè)數(shù)據(jù)的歷史快照,不建議被修改(實(shí)際分析會有數(shù)據(jù)回補(bǔ)的情況)。用戶只能通過分析工具進(jìn)行查詢和分析。
數(shù)據(jù)倉庫的作用
把數(shù)據(jù)源集中起來為企業(yè)管理和決策提供數(shù)據(jù)支持
降本增效
數(shù)倉開發(fā)人員,提供出T+1結(jié)果給不同用戶(上級領(lǐng)導(dǎo)、客戶等)展示
作者:教你學(xué)懂大數(shù)據(jù)
歡迎關(guān)注微信公眾號 :教你學(xué)懂大數(shù)據(jù)