數據倉庫基礎知識培訓.ppt
數據倉庫 我們公司數據中心架構 指標、維度與報表和OLAP分析主題關系 名詞解釋及縮略語,內部交流,隨著信息技術的不斷推廣和應用,許多企業(yè)都已經在使用管理信息系統(tǒng)處理管理事務和日常業(yè)務。這些管理信息系統(tǒng)為企業(yè)積累了大量的信息。企業(yè)管理者開始考慮如何利用這些信息海洋對企業(yè)的管理決策提供支持。因此,產生了與傳統(tǒng)數據庫有很大差異的數據環(huán)境要求和從這些海洋數據中獲取特殊知識的工具需要。 本章目標: (1)了解數據倉庫的發(fā)展與展望 。 (2) 理解數據倉庫的體系結構和參照結構。,數據倉庫概述,數據倉庫概述,1.1數據倉庫的發(fā)展與展望 1.2數據倉庫的體系結構 1.3數據倉庫的參照結構,1.1.1從傳統(tǒng)數據庫到數據倉庫 隨著市場競爭的加劇,信息系統(tǒng)的用戶已經不滿足于僅僅用計算機去處理每天所發(fā)生的事務數據,而是需要信息能夠支持決策的信息,去幫助管理決策。這就需要一種能夠將日常業(yè)務處理中所收集到的各種數據轉變?yōu)榫哂猩虡I(yè)價值信息的技術,傳統(tǒng)數據庫系統(tǒng)無法承擔這一責任。因為傳統(tǒng)數據庫的處理方式和決策分析中的數據需求不相稱。這些不相稱性主要表現在決策處理中的系統(tǒng)響應問題、決策數據需求的問題和決策數據操作的問題。,1.1數據倉庫的發(fā)展與展望,1.決策處理的系統(tǒng)響應問題 2.決策數據需求的問題 3.決策數據操作的問題 4.數據倉庫與傳統(tǒng)數據庫的對比,1.1數據倉庫的發(fā)展與展望,1.1數據倉庫的發(fā)展與展望,定義: “一個面向主題的、集成的、隨時間變化的、非易失性數據的集合,用于支持管理層的決策過程”。 特性: 面向主題性 數據集成性 數據的時變性 數據的非易失性 數據的集合性 支持決策作用。,1.1.2 數據倉庫的定義與基本特性,1.2.1 數據倉庫的概念結構 從數據倉庫的概念結構看,應該包含:數據源、數據準備區(qū)、數據倉庫數據庫、數據集市/知識挖掘庫以及各種管理工具和應用工具。,1.2 數據倉庫的體系結構,1.2.2 虛擬數據倉庫結構 虛擬數據倉庫利用描述了業(yè)務系統(tǒng)中數據位置和抽取數據算法的元數據直接從業(yè)務系統(tǒng)中抽取查詢的數據進行概括、聚合操作后,將最終結果提供給用戶,1.2.3 數據集市結構 數據集市結構或稱為主題結構的數據倉庫是按照主題進行構思所形成的數據倉庫,沒有一個獨立的數據倉庫。系統(tǒng)的數據不存儲在同一數據倉庫中,每個主題有自己的物理存儲區(qū)。,1.2.4 單一數據倉庫結構 將所有的主題都集中到一個大型數據庫中的體系結構。數據源中數據被按照同一標準抽取到獨立的數據倉庫中,用戶在使用時再根據主題將數據倉庫中的數據發(fā)布到數據集市中。,1.2.5 分布式數據倉庫結構 在企業(yè)各個分公司具有相當大的獨立性時,企業(yè)總部設置一個全局數據倉庫,各個分公司設置各自的局部數據倉庫。局部數據倉庫主要存儲各自的未經轉換的細節(jié)數據,全局數據倉庫中主要存儲經過轉換的綜合數據,站點A 站點B 站點C 站點D,全局數據倉庫,總部,1.3數據倉庫的參照結構,數據倉庫的基本功能包含:數據抽取,數據篩選、清理,清理后的數據加載,設立數據集市,完成數據倉庫的查詢、決策分析和知識的挖掘等操作。 數據倉庫的管理層分成數據管理與元數據管理兩部分,主要負責對數據倉庫中的數據抽取、清理、加載、更新與刷新等操作進行管理。 數據倉庫環(huán)境支持層包含數據傳輸和數據倉庫基礎兩部分。,1.3.1 數據倉庫基本功能層,數據來源主要包含:業(yè)務數據、歷史數據、辦公數據、Web數據、外部數據以及數據源元數據 數據準備區(qū)的功能結構部分由數據標準化處理、數據的過濾與匹配、數據的凈化處理、標明數據的時間戳、確認數據質量與元數據抽取和創(chuàng)建等操作組成 數據倉庫的功能結構部分由數據重整和數據倉庫創(chuàng)建以及元數據管理組成 數據集市/知識挖掘庫的功能結構與數據倉庫的功能結構極為相似 數據倉庫的數據存取與使用結構主要為數據倉庫的最終用戶提供進行決策分析和挖掘知識的功能。數據倉庫的數據存取與使用結構應該包含數據倉庫存取與檢索、元數據管理以及數據倉庫分析與報告,1.3.2 數據倉庫的管理層,數據管理層中的數據抽取、新數據需求與查詢管理主要負責完成從數據源中抽取數據的管理。 數據倉庫中的數據加載、存儲、刷新和更新系統(tǒng)則負責對從數據源中所抽取的數據在完成篩選、凈化處理以后,將這些數據加載、存儲到數據倉庫中;捕獲數據源中的數據變化,用最新數據充實數據倉庫;根據用戶的需求和數據倉庫管理的要求對數據倉庫進行更新等工作。 安全性與用戶授權管理系統(tǒng)主要負責數據倉庫的安全管理工作。 數據倉庫的數據歸檔、恢復及凈化系統(tǒng)主要負責定期對數據倉庫中的數據進行歸檔、備份。凈化系統(tǒng)則負責對從數據源所抽取的數據進行數據的篩選、數據標準的統(tǒng)一、數據內容的統(tǒng)一等各種求精、重整凈化工作的管理。,1.3.3 數據倉庫的元數據管理層,負責管理數據倉庫所使用的元數據,其中包括: 數據倉庫、數據集市/知識挖掘庫和詞匯表管理 元數據抽取、創(chuàng)建、存儲和更新管理 預定義的查詢和報表以及索引管理 刷新與復制管理,登錄、歸檔、恢復與凈化管理,1.3.4 數據倉庫的環(huán)境支持層,數據傳輸層包含了: 數據傳輸和傳送網絡 客戶/服務器代理和中間件 復制系統(tǒng) 數據傳輸的安全保障系統(tǒng),我們公司數據中心架構,分析型系統(tǒng)架構 目標系統(tǒng)架構說明 存儲區(qū)域比較分析 ETL過程分析,分析型系統(tǒng)架構,我們公司數據中心架構,目標系統(tǒng)架構說明,我們公司數據中心架構,存儲區(qū)域比較分析,我們公司數據中心架構,ETL過程分析,指標、維度與報表OLAP分析主題關系,名詞解釋及縮略語,名詞解釋,名詞解釋及縮略語,縮略語,名詞解釋及縮略語,縮略語,內部交流,謝謝!,