《BI商務(wù)智能--數(shù)據(jù)迷霧中(PPT 46)》由會(huì)員分享,可在線閱讀,更多相關(guān)《BI商務(wù)智能--數(shù)據(jù)迷霧中(PPT 46)(46頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、,*,來(lái)自中國(guó)最大的資料庫(kù)下載 中國(guó)最大的資料庫(kù)下載 中國(guó)最大的資料庫(kù)下載,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),單擊此處編輯母版標(biāo)題樣式,“電子技術(shù)到來(lái)以后,人延伸出(或者說(shuō)在體外建立了)一個(gè)活生生的中樞神經(jīng)系統(tǒng)。,麥克盧漢,理解媒介,1,數(shù)據(jù)迷霧中,迷茫,2,一個(gè)平常飲料店的故事,1993年前,店里賣(mài)的飲料只有啤酒、可口可樂(lè)和北冰洋汽水,進(jìn)貨出貨老板在一個(gè)舊本子上記錄,一個(gè)平常飲料店的故事,1995年,生意大了,各處開(kāi)了分號(hào),飲料多了,酒也多了,有幾十種。,店里裝了自動(dòng)柜員機(jī),柜員機(jī)里記的賬天天都打印出來(lái)送給老板。,老板看不過(guò)來(lái),加個(gè)總數(shù)就算了,但生意該怎么做,老板還算
2、清楚。,一個(gè)平常飲料店的故事,1998年,經(jīng)營(yíng)的品種過(guò)了百,店里連了網(wǎng),用上了財(cái)務(wù)軟件。,1999年又上了互聯(lián)網(wǎng),客人來(lái)自四面八方。賬單每天打出厚厚一堆,老板瞧著密密麻麻的數(shù)字楞神,直嚷嚷生意難做。,數(shù)據(jù)迷霧鋪天蓋地,美國(guó)MCI是跨國(guó)的電信公司,長(zhǎng)途電話客戶2億,電腦里數(shù)據(jù)存了5TB,每月還增加300GB。,據(jù)美國(guó)加州一所大學(xué)研究,世界上每個(gè)人,不管死活,已經(jīng)產(chǎn)生或?qū)⒁a(chǎn)生250MB的數(shù)據(jù),每年全球數(shù)據(jù)凈增21010GB。,如何應(yīng)對(duì)?,商務(wù)智能,7,什么是商務(wù)智能,商業(yè)智能是對(duì)商業(yè)信息的搜集、管理和分析過(guò)程,目的是使企業(yè)的各級(jí)決策者獲得知識(shí)或洞察力,促使他們做出對(duì)企業(yè)更有利的決策。,商業(yè)智能一
3、般由數(shù)據(jù)倉(cāng)庫(kù)(或數(shù)據(jù)場(chǎng))、數(shù)據(jù)分析、數(shù)據(jù)挖掘、在線分析、數(shù)據(jù)備份和恢復(fù)等局部組成。,什么是商務(wù)智能,商務(wù)智能是從累計(jì)的原始數(shù)據(jù)中提取有用信息的過(guò)程,商務(wù)智能為決策者在正確的時(shí)間,地點(diǎn)提供關(guān)于企業(yè)運(yùn)營(yíng)情況的各項(xiàng)信息使之能夠做出準(zhǔn)確的決定,背景,商業(yè)智能(BI)的概念最早是Gartner Group于1996年提出,執(zhí)行信息系統(tǒng)(EIS),決策支持系統(tǒng)(DSS)。,為什么需要商務(wù)智能,促進(jìn)銷(xiāo)售,加深客戶關(guān)系,改進(jìn)產(chǎn)品,提供更好的效勞,協(xié)調(diào)企業(yè)運(yùn)營(yíng),降低本錢(qián),提高決策水平,Business Intelligence helps track what really works and what doe
4、snt.,Bill Gates,Chairman,Microsoft,通過(guò)BI幫助我們,提高企業(yè)效益,建立忠實(shí)的顧客群,增進(jìn)企業(yè)效率,做出明智的決策,商務(wù)智能內(nèi)容,產(chǎn)品分析,哪種產(chǎn)品贏利情況最好?,哪種產(chǎn)品贏利最差卻賣(mài)的最快?,哪種產(chǎn)品組合對(duì)一定收入的家庭最有吸引力?,商務(wù)智能內(nèi)容,銷(xiāo)售分析,一家已開(kāi)張兩年的分店銷(xiāo)售趨勢(shì)如何?,附近地區(qū)是否存在競(jìng)爭(zhēng)者?,哪種產(chǎn)品的贏利有向上的趨勢(shì)及哪類(lèi)顧客購(gòu)置了這些產(chǎn)品?,商務(wù)智能內(nèi)容,顧客分析,提供頭10%利潤(rùn)的顧客有什么特點(diǎn)?,購(gòu)置產(chǎn)品或效勞三個(gè)月后顧客的流失率是多少?,過(guò)去六個(gè)月里比平均消費(fèi)額高兩個(gè)百分點(diǎn)的都是誰(shuí)?,眾多行業(yè)積極尋求BI解決方案的,零售、
5、保險(xiǎn)、銀行、通信、離散制造、政府、醫(yī)療、分銷(xiāo)、流程制造、教育等。,商務(wù)智能如何工作,數(shù)據(jù):把不同來(lái)源的數(shù)據(jù)匯總為一個(gè)數(shù)據(jù)倉(cāng)庫(kù),內(nèi)涵:商務(wù)智能工具通過(guò)分析這些數(shù)據(jù)來(lái)幫助人們更好地了解企業(yè)情況,行動(dòng):通過(guò)分析來(lái)更有效地分配資源,商務(wù)智能系統(tǒng)結(jié)構(gòu),數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW),聯(lián)機(jī)分析處理(On-Line Analytical Processing,OLAP),數(shù)據(jù)挖掘(Data Mining,DM),數(shù)據(jù)倉(cāng)庫(kù)(DW),數(shù)據(jù)倉(cāng)庫(kù),是在數(shù)據(jù)庫(kù)已經(jīng)大量存在的情況下,為了進(jìn)一步挖掘數(shù)據(jù)資源、為了決策需要而產(chǎn)生的,它決不是所謂的“大型數(shù)據(jù)庫(kù)。,W.H.Inmon關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的定義:面向主題
6、的、集成的、與時(shí)間相關(guān)且不可修改的數(shù)據(jù)集合。,面向主題,傳統(tǒng)數(shù)據(jù)庫(kù)主要是為應(yīng)用程序進(jìn)行數(shù)據(jù)處理,未必按照同一主題存儲(chǔ)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)側(cè)重于數(shù)據(jù)分析工作,是按照主題存儲(chǔ)的,與時(shí)間相關(guān),數(shù)據(jù)庫(kù)保存信息的時(shí)候,并不強(qiáng)調(diào)一定有時(shí)間信息,數(shù)據(jù)倉(cāng)庫(kù)則不同,出于決策的需要,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)都要標(biāo)明時(shí)間屬性,不可修改,數(shù)據(jù)庫(kù)處理的是日常事務(wù)數(shù)據(jù),有的需要不斷更新,數(shù)據(jù)倉(cāng)庫(kù)反映的是歷史信息,可以添加,但不可更改。,數(shù)據(jù)倉(cāng)庫(kù)生成,Extract,Transfer,and Load(ETL),Model,Integrate,Data,ETL,Data warehouse,數(shù)據(jù)展現(xiàn),面向高層決策者的主管信息系統(tǒng)(EIS
7、),面向決策分析者的聯(lián)機(jī)分析系統(tǒng)(OLAP),決策者上的即席查詢(xún)系統(tǒng)(Ad Hoc),靈活報(bào)表系統(tǒng)(Reporting),數(shù)據(jù)展現(xiàn)采用多種靈活的方式,比方C/S模式或B/S模式,聯(lián)機(jī)分析處理(OLAP),OLAP委員會(huì)的定義:是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對(duì)從原始數(shù)據(jù)中轉(zhuǎn)化出來(lái)的、能夠真正為用戶所理解的、并真實(shí)反映企業(yè)維特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對(duì)數(shù)據(jù)的更深入了解的一類(lèi)軟件技術(shù)。,OLAP的目標(biāo):是滿足決策支持或多維環(huán)境特定的查詢(xún)和報(bào)表需求,它的技術(shù)核心是“維這個(gè)概念,因此OLAP也可以說(shuō)是多維數(shù)據(jù)分析工具的集合。,開(kāi)展背景,60年代,關(guān)系數(shù)據(jù)庫(kù)之父E.F.
8、Cdd提出了關(guān)系模型,促進(jìn)了聯(lián)機(jī)事務(wù)處理(OLTP)的開(kāi)展(數(shù)據(jù)以表格的形式而非文件方式存儲(chǔ))。,1993年,E.F.Cdd提出了多維數(shù)據(jù)庫(kù)和多維分析的概念,即OLAP,OLAP多維數(shù)據(jù)結(jié)構(gòu),超立方結(jié)構(gòu)(Hypercube),多立方結(jié)構(gòu)(Multicube),OLAP多維數(shù)據(jù)分析,切片和切塊(Slice and Dice):在多維數(shù)據(jù)結(jié)構(gòu)中,按二維進(jìn)行切片,按三維進(jìn)行切塊,可得到所需要的數(shù)據(jù),OLAP多維數(shù)據(jù)分析,鉆取(Drill):鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)操作,OLAP多維數(shù)據(jù)分析,旋轉(zhuǎn)(Rotate)/轉(zhuǎn)軸(Pivot)
9、:通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù),數(shù)據(jù)挖掘(DM),一方面規(guī)模龐大、紛繁復(fù)雜的數(shù)據(jù)體系讓使用者漫無(wú)頭緒、無(wú)從下手;,另一方面在這些大量數(shù)據(jù)的背后卻隱藏著很多具有決策意義的有價(jià)值的信息。,數(shù)據(jù)挖掘(DM),如何發(fā)現(xiàn)這些有用的知識(shí),使之為管理決策和經(jīng)營(yíng)戰(zhàn)略開(kāi)展效勞?,數(shù)據(jù)挖掘(Data Mining)。,DM應(yīng)用實(shí)例(購(gòu)物環(huán)境設(shè)計(jì)),某超市,需要設(shè)計(jì)一個(gè)吸引客人購(gòu)置商品的最正確環(huán)境。通過(guò)對(duì)客人的采購(gòu)路線和消費(fèi)記錄的挖掘發(fā)現(xiàn):美國(guó)女性的視線高度是150cm左右,而男性是163cm左右,最適宜的視線角度是視線高度以下15度。因此,最好的貨品擺設(shè)位置是在130到135厘米之間。,按照DM找出的特別信息,
10、該超市里的主打產(chǎn)品,總是擺在最容易發(fā)現(xiàn)的高度區(qū)內(nèi)。,DM應(yīng)用實(shí)例(客戶購(gòu)置模式識(shí)別),Safeway是英國(guó)的第三大連鎖超市,年銷(xiāo)售額超過(guò)一百億美元,運(yùn)用傳統(tǒng)的方法降低價(jià)位、擴(kuò)充店面以及增加商品種類(lèi),若想在競(jìng)爭(zhēng)中取勝已經(jīng)越來(lái)越困難了,必須以客戶為導(dǎo)向,了解六百萬(wàn)客戶所做的每一筆交易以及這些交易彼此之間的關(guān)聯(lián)性,DM應(yīng)用實(shí)例(客戶購(gòu)置模式識(shí)別),Safeway首先根據(jù)客戶的相關(guān)資料,將客戶分為150類(lèi),再用關(guān)聯(lián)(Association)的技術(shù)列出產(chǎn)品相關(guān)度的清單。,比方:“在購(gòu)置烤肉炭的客戶中,75%的人也會(huì)購(gòu)置打火機(jī)燃料。,DM應(yīng)用實(shí)例(客戶購(gòu)置模式識(shí)別),Safeway還需要對(duì)商品的利潤(rùn)進(jìn)行細(xì)
11、分。例如,Safeway發(fā)現(xiàn)某一種乳酪產(chǎn)品雖然銷(xiāo)售額排名第209位,可是消費(fèi)額最高的客戶中有25%都常常買(mǎi)這種乳酪。,Safeway 知道客戶每次采購(gòu)時(shí)會(huì)買(mǎi)哪些產(chǎn)品以后,就可以利用Data Mining中的 Sequence Discovery 功能,找出長(zhǎng)期的經(jīng)常性購(gòu)置行為,進(jìn)而促銷(xiāo)。,數(shù)據(jù)挖掘(DM)學(xué)科背景,統(tǒng)計(jì)學(xué),計(jì)算機(jī)科學(xué),人工智能領(lǐng)域的廣泛運(yùn)用,數(shù)據(jù)挖掘(DM)常用方法,分類(lèi)(classification):依照所分析對(duì)象的屬性分門(mén)別類(lèi)、加以定義、建立類(lèi)組(class)。,比方,將信用卡申請(qǐng)人分為低、中、高風(fēng)險(xiǎn)群,或是將顧客分到事先定義好的族群。,數(shù)據(jù)挖掘(DM)常用方法,估計(jì)(e
12、stimation):根據(jù)既有的連續(xù)性數(shù)值相關(guān)屬性資料,求得某一屬性的未知值。,比方,估計(jì)家中小孩的數(shù)量、一個(gè)家庭的總收入或是不動(dòng)產(chǎn)的價(jià)值。,所使用的技巧有相關(guān)分析、回歸分析及類(lèi)神經(jīng)網(wǎng)絡(luò)方法。,數(shù)據(jù)挖掘(DM)常用方法,預(yù)測(cè)(prediction):根據(jù)對(duì)象屬性過(guò)去的觀察值來(lái)估計(jì)此屬性未來(lái)的值。,比方,預(yù)測(cè)哪些顧客會(huì)在未來(lái)的半年內(nèi)取消該公司的效勞,或是預(yù)測(cè)哪些電話用戶會(huì)申請(qǐng)?jiān)鲋敌?,如三方通話、語(yǔ)音信箱等。,所使用的技巧有回歸分析、時(shí)間序列分析及類(lèi)神經(jīng)網(wǎng)絡(luò)方法。,數(shù)據(jù)挖掘(DM)常用方法,關(guān)聯(lián)分組(affinity grouping):從所有對(duì)象來(lái)決定哪些相關(guān)對(duì)象應(yīng)該放在一起。,比方,在超市中
13、,哪些物品會(huì)一起被購(gòu)置,零售商可以利用關(guān)聯(lián)分組來(lái)規(guī)劃店內(nèi)商品的擺設(shè)位置,把會(huì)被一起購(gòu)置的商品擺在一起。,在客戶的營(yíng)銷(xiāo)系統(tǒng)上,此種功能可用來(lái)確認(rèn)交叉銷(xiāo)售(cross-selling)的時(shí)機(jī)以設(shè)計(jì)出更吸引人的產(chǎn)品群組。,聚類(lèi)、群集化(clustering):將不同的母體區(qū)隔為較具同構(gòu)型的群組(cluster),換句話說(shuō),其目的是將組與組之間的差異分辨出來(lái),并對(duì)個(gè)別組內(nèi)的相似樣本進(jìn)行挑選。在群集化技術(shù)中,沒(méi)有預(yù)先定義好的類(lèi)別和訓(xùn)練樣本存在,所有紀(jì)錄都根據(jù)彼此相似程度來(lái)加以歸類(lèi)。,比方,在市場(chǎng)營(yíng)銷(xiāo)調(diào)查前,先將顧客群集化,再來(lái)分析每群顧客最喜歡哪一類(lèi)促銷(xiāo),而不是對(duì)每個(gè)顧客都用相同的標(biāo)準(zhǔn)規(guī)則來(lái)分析。,所使
14、用的技巧有k-means法及agglomeration法。,SCORING&MODELING,PORTALS,DSS,EIS,ANALYSESQUERIESSCORES,APPLICATIONS,DATA HANDLE,DATASTORES,LOAD,TRANSFORM,EXTRACT,STANDARD TEMPLATE,OLAP,Agent,DM,WAREHOUSE,CRM ERP SCM Policy F&A Other,商務(wù)智能體系結(jié)構(gòu),客戶分類(lèi)和特點(diǎn)分析,市場(chǎng)營(yíng)銷(xiāo)策略分析,經(jīng)營(yíng)本錢(qián)與收入分析,欺詐行為分析和預(yù)防,商務(wù)智能的應(yīng)用前景,市場(chǎng)預(yù)測(cè),根據(jù)IDC分析,從1997年到2002年,整個(gè)數(shù)據(jù)倉(cāng)庫(kù)市場(chǎng)(軟件、效勞、效勞器和存儲(chǔ))以平均每年20.5的速度增長(zhǎng)。,IDC的另一項(xiàng)調(diào)查結(jié)果說(shuō)明,企業(yè)用于商務(wù)智能的投資回報(bào)率平均2.3年高達(dá)400。一項(xiàng)來(lái)自美國(guó)MetaGroup的市場(chǎng)分析指出,92的企業(yè)將在今后3年內(nèi)使用數(shù)據(jù)倉(cāng)庫(kù)。,謝謝大家!,