《《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 》課程教學(xué)大綱》由會(huì)員分享,可在線閱讀,更多相關(guān)《《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 》課程教學(xué)大綱(10頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程教學(xué)大綱課程代碼:1101309118課程名稱(chēng):數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘英文名稱(chēng):Data Warehousing and Data Mining學(xué) 分:3 總學(xué)時(shí):48講課學(xué)時(shí):30 實(shí)驗(yàn)學(xué)時(shí):上機(jī)學(xué)時(shí):18課外學(xué)時(shí):適用對(duì)象:經(jīng)濟(jì)管理類(lèi)信息管理與信息系統(tǒng)專(zhuān)業(yè)先修課程:計(jì)算機(jī)基礎(chǔ),數(shù)據(jù)庫(kù)學(xué)生自主學(xué)習(xí)時(shí)數(shù)建議:30 課程性質(zhì) 目的和任務(wù)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘是信息管理與信息系統(tǒng)專(zhuān)業(yè)的專(zhuān)業(yè)模塊課。通過(guò)課程學(xué)習(xí),使學(xué)生能夠了解數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘的產(chǎn)生和發(fā)展歷史,掌握如何設(shè)計(jì)并實(shí)現(xiàn)比較規(guī)范的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),掌握數(shù)據(jù)挖掘的基本概念、技術(shù)和應(yīng)用方法。培養(yǎng)學(xué)生應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘理論和技術(shù)解決
2、實(shí)際問(wèn)題的能力。1. 了解數(shù)據(jù)管理技術(shù)從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展過(guò)程。2. 掌握數(shù)據(jù)倉(cāng)庫(kù)的定義、特點(diǎn)和研究數(shù)據(jù)倉(cāng)庫(kù)的必要性。3. 掌握數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)和聯(lián)機(jī)分析處理的概念4. 掌握數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織、數(shù)據(jù)預(yù)處理與規(guī)劃管理5. 掌握數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃、設(shè)計(jì)、管理的基本方法6. 掌握數(shù)據(jù)挖掘的基本概念及與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系7. 熟悉聚類(lèi)分析、分類(lèi)發(fā)現(xiàn)和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法的使用環(huán)境、算法特點(diǎn),并能進(jìn)行算法復(fù)雜性的分析。8 .認(rèn)識(shí)數(shù)據(jù)挖掘的發(fā)展趨勢(shì)和應(yīng)用前景9.能夠在科研實(shí)踐中應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和應(yīng)用數(shù)據(jù)挖掘的方法。二、教學(xué)基本要求在充分講解數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘基本概念、基本原理和基本技術(shù)的基礎(chǔ)上,注重實(shí)際應(yīng)用
3、能力的培養(yǎng),通過(guò)理論知識(shí)的學(xué)習(xí)和上機(jī)環(huán)節(jié),結(jié)合實(shí)例,使學(xué)生能夠比較好的掌握數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘基礎(chǔ)知識(shí),重點(diǎn)培養(yǎng)學(xué)生利用數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)分析、解決實(shí)際問(wèn)題的基本技能。學(xué)生應(yīng)系統(tǒng)學(xué)習(xí)并掌握數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基本概念,認(rèn)真思考并理解其發(fā)展的一般規(guī)律,準(zhǔn)確理解和掌握數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基本方法和技術(shù)及在實(shí)際工作中的應(yīng)用。1. 學(xué)生應(yīng)對(duì)數(shù)據(jù)庫(kù)系統(tǒng)的基本概念、基本原理和關(guān)系數(shù)據(jù)理論有較扎實(shí)的理解,應(yīng)比較熟悉關(guān)系數(shù)據(jù)庫(kù)的原理和實(shí)施方法。2. 學(xué)生應(yīng)具備數(shù)據(jù)結(jié)構(gòu)和算法分析的基本知識(shí)。3. 能夠結(jié)合實(shí)際問(wèn)題進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)設(shè)計(jì)工作,包括對(duì)多維數(shù)據(jù)模型的構(gòu)造、事實(shí)表與維表的定義等。4. 教學(xué)中應(yīng)結(jié)合實(shí)例
4、對(duì)每種數(shù)據(jù)挖掘算法進(jìn)行分析,對(duì)算法復(fù)雜性進(jìn)行研究。5. 教學(xué)中應(yīng)分析本學(xué)科當(dāng)前的研究現(xiàn)狀,提出需解決的問(wèn)題。三 教學(xué)內(nèi)容第一單元數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘概述1、教學(xué)內(nèi)容(1) 了解數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的產(chǎn)生、發(fā)展,熟悉數(shù)據(jù)挖掘的應(yīng)用;(2) 掌握基本概念和數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)過(guò)程;(3) 數(shù)據(jù)倉(cāng)庫(kù)的基本原理;(4) 操作型處理(事務(wù)型處理)和分析型處理;(5) 了解OLAP,掌握其基本概念、特點(diǎn)、特性;基本動(dòng)作、展現(xiàn)方式、OLAP的體系結(jié)構(gòu)和分類(lèi)。2、重點(diǎn)和難點(diǎn):(1) 重點(diǎn):數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)過(guò)程;(2) 難點(diǎn):操作型處理(事務(wù)型處理)和分析型處理。第二單元關(guān)聯(lián)規(guī)則挖掘技術(shù)1、教學(xué)內(nèi)容(1) 關(guān)聯(lián)規(guī)則
5、挖掘的基本概念;(2) 關(guān)聯(lián)規(guī)則挖掘的分類(lèi);(3) 關(guān)聯(lián)規(guī)則挖掘的Apriori算法;(4) 關(guān)聯(lián)規(guī)則挖掘算法FP-growtho2、重點(diǎn)和難點(diǎn):(1) 重點(diǎn):關(guān)聯(lián)規(guī)則挖掘的Apriori算法;(2) 難點(diǎn):關(guān)聯(lián)規(guī)則挖掘算法FP-growtho第三單元分類(lèi)和聚類(lèi)1、教學(xué)內(nèi)容(1) 決策樹(shù)基礎(chǔ);(2) 決策樹(shù)算法;(3) 分類(lèi)器評(píng)價(jià)標(biāo)準(zhǔn);(4) 距離和相似系數(shù);(5) 系統(tǒng)聚類(lèi)法。2、重點(diǎn)和難點(diǎn):(1) 重點(diǎn):決策樹(shù)基礎(chǔ);(2) 難點(diǎn):決策樹(shù)算法。第四單元遺傳算法和因子分析1、教學(xué)內(nèi)容(1) 生物進(jìn)化理論和遺傳學(xué)的基本知識(shí);(2) 遺傳算法基本原理;(3) 遺傳算法關(guān)鍵技術(shù);(4) 因子分析的基
6、本思想;(5) 因子分析原理。2、重點(diǎn)和難點(diǎn):(1) 重點(diǎn):遺傳算法關(guān)鍵技術(shù);(2) 難點(diǎn):因子分析原理。第五單元離群點(diǎn)挖掘1、教學(xué)內(nèi)容(1) 離群點(diǎn)挖掘的概念;(2) 基于統(tǒng)計(jì)的方法;(3) 基于距離的方法;(4) 基于密度的方法;(5) 基于聚類(lèi)的方法。2、重點(diǎn)和難點(diǎn):(1) 重點(diǎn):基于統(tǒng)計(jì)的方法;(2) 難點(diǎn):基于聚類(lèi)的方法。四 實(shí)踐環(huán)節(jié)設(shè)計(jì)本課程安排18學(xué)時(shí)實(shí)驗(yàn),詳見(jiàn)本課程實(shí)驗(yàn)教學(xué)大綱。五、課外習(xí)題及課程討論為達(dá)到本課程的教學(xué)基本要求,課外思考題或習(xí)題不應(yīng)少于20題。六、教學(xué)方法與手段本課程采用板書(shū)與多媒體課件結(jié)合的方式進(jìn)行課堂教學(xué)。七、各教學(xué)環(huán)節(jié)學(xué)時(shí)分配內(nèi)容講課實(shí)驗(yàn)上機(jī)習(xí)題課討論課自
7、主學(xué)習(xí)合計(jì)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘概述22關(guān)聯(lián)規(guī)則挖掘技術(shù)6410分類(lèi)和聚類(lèi)6410遺傳算法和因子分析8614離群點(diǎn)挖掘6410串講22合計(jì)301848八、學(xué)生自主學(xué)習(xí)要求課外學(xué)生按照授課學(xué)時(shí):自主學(xué)習(xí)時(shí)間比例1: 1來(lái)對(duì)應(yīng)各章節(jié)自主學(xué)習(xí)、歸納、總結(jié)。九 考核方式1、本課程考試為閉卷筆試。2、學(xué)生的課程總評(píng)成績(jī)由平時(shí)總評(píng)成績(jī)和期末考試成績(jī)兩部分構(gòu)成(平時(shí)總評(píng)所占比例原則上為30%,其中實(shí)驗(yàn)成績(jī)占20%,出勤、課堂表現(xiàn)、學(xué)習(xí)主動(dòng)性等占10%)。十、推薦教材和教學(xué)參考書(shū)教材:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程,陳立偉編著,清華大學(xué)出版社,201 lo參考書(shū):數(shù)據(jù)挖掘原理與技術(shù),張?jiān)茲?、龔玲編著,電子工業(yè)出版社,20
8、04o數(shù)據(jù)倉(cāng)庫(kù)原理與實(shí)踐,林宇編著,人民郵電出版社,2003o十一 說(shuō)明1、注重實(shí)踐教學(xué),強(qiáng)調(diào)理論和實(shí)際相結(jié)合,要求學(xué)生會(huì)操作。2、部分實(shí)驗(yàn)需在課余時(shí)間進(jìn)行。大綱制訂人:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程組大綱審定人:制訂日期:2014年5月數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程實(shí)驗(yàn)(上機(jī))教學(xué)大綱一、教學(xué)目標(biāo)與基本要求數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的實(shí)踐課程主要介紹數(shù)據(jù)倉(cāng)庫(kù)的工作機(jī)理及其構(gòu)建過(guò)程,要求學(xué)生熟練使用數(shù)據(jù)庫(kù)管理系統(tǒng)MS SQL Server,掌握典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)及其開(kāi)發(fā)工具的使用,理解數(shù)據(jù)挖掘的工作原理與流程,掌握典型數(shù)據(jù)挖掘技術(shù)及其工具的使用方法,熟悉SQL SERVER BI DEV集成挖掘環(huán)境。通過(guò)上述實(shí)驗(yàn)環(huán)節(jié)
9、,使學(xué)生加深了解和更好地掌握數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程教學(xué)大綱要求的內(nèi)容。二、基本理論與實(shí)驗(yàn)(上機(jī))技術(shù)知識(shí)本實(shí)驗(yàn)教學(xué)內(nèi)容為數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程實(shí)驗(yàn)。通過(guò)實(shí)驗(yàn),可加深學(xué)生對(duì)課堂教學(xué)的理論知識(shí)的理解和鞏固,掌握計(jì)算機(jī)操作技能,提高開(kāi)發(fā)應(yīng)用軟件能力和細(xì)致科學(xué)研究素養(yǎng)。三 實(shí)驗(yàn)(上機(jī))方法特點(diǎn)與基本要求在數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的課程實(shí)驗(yàn)過(guò)程中,要求學(xué)生做到:(1)預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書(shū)有關(guān)部分,認(rèn)真做好實(shí)驗(yàn)內(nèi)容的準(zhǔn)備,就實(shí)驗(yàn)可能出現(xiàn)的情況提前作出思考和分析。(2)仔細(xì)觀察上機(jī)操作時(shí)出現(xiàn)的各種現(xiàn)象,記錄主要情況,作出必要說(shuō)明和分析。(3)認(rèn)真書(shū)寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)報(bào)告包括實(shí)驗(yàn)?zāi)康暮鸵螅瑢?shí)驗(yàn)情況及其分析。(4)遵守機(jī)房
10、紀(jì)律,服從輔導(dǎo)教師指揮,愛(ài)護(hù)實(shí)驗(yàn)設(shè)備。(5)實(shí)驗(yàn)課程不遲到。如有事不能出席,所缺實(shí)驗(yàn)一般不補(bǔ)。(6)實(shí)驗(yàn)報(bào)告按班級(jí)分次統(tǒng)一在規(guī)定時(shí)間內(nèi)提交。實(shí)驗(yàn)報(bào)告的格式見(jiàn)本指導(dǎo)書(shū)的第三部分。實(shí)驗(yàn)報(bào)告內(nèi)容應(yīng)包括:實(shí)驗(yàn)名稱(chēng)、目的、內(nèi)容、原理、環(huán)境、實(shí)驗(yàn)步驟、實(shí)驗(yàn)總結(jié)(思考題的回答及實(shí)驗(yàn)心得)等內(nèi)容。四 主要儀器設(shè)備1、本實(shí)驗(yàn)的計(jì)算機(jī)配置:1G以上的CPU ; 128 MB以上內(nèi)存,32MB以上顯存;軟件配置:Windows 2000/XP/2003o2、應(yīng)用軟件:Sql server 2005 等。五、實(shí)驗(yàn)(上機(jī))項(xiàng)目的設(shè)置與內(nèi)容提要序號(hào)實(shí)驗(yàn)(上機(jī))項(xiàng)目?jī)?nèi)容提要實(shí)驗(yàn)學(xué)時(shí)實(shí)驗(yàn)類(lèi)型每組人數(shù)實(shí)驗(yàn)要求1關(guān)聯(lián)規(guī)則挖掘技術(shù)
11、關(guān)聯(lián)規(guī)則挖掘的Apriori算法;關(guān)聯(lián)規(guī)則挖掘算法FP-growtho4綜合1必做2分類(lèi)和聚類(lèi)決策樹(shù)基礎(chǔ);決策樹(shù)算法;系統(tǒng)聚類(lèi)法4綜合1必做3遺傳算法和因遺傳算法關(guān)鍵技術(shù);6綜合1必做子分析因子分析算法4離群點(diǎn)挖掘基于統(tǒng)計(jì)的方法;基于距離的方法;基于密度的方法;基于聚類(lèi)的方法4綜合1必做注:總實(shí)驗(yàn)學(xué)時(shí)為18學(xué)時(shí)。六、實(shí)驗(yàn)(上機(jī))報(bào)告要求每次實(shí)驗(yàn)提交實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)報(bào)告由提交實(shí)驗(yàn)成果電子和紙質(zhì)文檔組成,并附有實(shí)驗(yàn)原始記錄。(注:實(shí)驗(yàn)指導(dǎo)書(shū)中有實(shí)驗(yàn)?zāi)康暮蛯?shí)驗(yàn)步驟的詳細(xì)說(shuō)明,在實(shí)驗(yàn)報(bào)告中可不作說(shuō)明。)七考核方式與成績(jī)?cè)u(píng)定1、考核方式:上機(jī)態(tài)度與實(shí)驗(yàn)報(bào)告相結(jié)合的方式;2、成績(jī)?cè)u(píng)定:考核方法根據(jù)實(shí)驗(yàn)敘述及報(bào)告編輯要求,按實(shí)驗(yàn)報(bào)告質(zhì)量及結(jié)合上機(jī)態(tài)度評(píng)定實(shí)驗(yàn)成績(jī),實(shí)驗(yàn)成績(jī)按學(xué)生總成績(jī)的20%計(jì)。十 推薦教材和教學(xué)參考書(shū)教 材:數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程,陳立偉編著,清華大學(xué)出版社,2011。參考書(shū):數(shù)據(jù)挖掘原理與技術(shù),張?jiān)茲?、龔玲編著,電子工業(yè)出版社,2004o數(shù)據(jù)倉(cāng)庫(kù)原理與實(shí)踐,林宇編著,人民郵電出版社,2003o