《《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 》課程教學大綱》由會員分享,可在線閱讀,更多相關《《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 》課程教學大綱(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程教學大綱
課程代碼:1101309118
課程名稱:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
英文名稱:Data Warehousing and Data Mining
學 分:3 總學時:48
講課學時:30 實驗學時: 上機學時:18 課外學時:
適用對象:經(jīng)濟管理類信息管理與信息系統(tǒng)專業(yè)
先修課程:計算機基礎,數(shù)據(jù)庫
學生自主學習時數(shù)建議:30
— '課程性質(zhì)' 目的和任務
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘是信息管理與信息系統(tǒng)專業(yè)的專業(yè)模塊課。通過課程學習,使學生
能夠了解數(shù)據(jù)倉庫及數(shù)據(jù)挖掘的產(chǎn)生和發(fā)展歷史,掌握如何設計并實現(xiàn)比較規(guī)范的數(shù)據(jù)倉庫
系統(tǒng),掌握數(shù)據(jù)挖掘的基本概念
2、、技術和應用方法。培養(yǎng)學生應用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘理論
和技術解決實際問題的能力。
1. 了解數(shù)據(jù)管理技術從數(shù)據(jù)庫到數(shù)據(jù)倉庫的發(fā)展過程。
2. 掌握數(shù)據(jù)倉庫的定義、特點和研究數(shù)據(jù)倉庫的必要性。
3. 掌握數(shù)據(jù)倉庫的體系結構和聯(lián)機分析處理的概念
4. 掌握數(shù)據(jù)倉庫的數(shù)據(jù)組織、數(shù)據(jù)預處理與規(guī)劃管理
5. 掌握數(shù)據(jù)倉庫規(guī)劃、設計、管理的基本方法
6. 掌握數(shù)據(jù)挖掘的基本概念及與數(shù)據(jù)倉庫的關系
7. 熟悉聚類分析、分類發(fā)現(xiàn)和關聯(lián)規(guī)則等數(shù)據(jù)挖掘算法的使用環(huán)境、算法特點,并能
進行算法復雜性的分析。
8 .認識數(shù)據(jù)挖掘的發(fā)展趨勢和應用前景
9.能夠在科研實踐中應用數(shù)據(jù)倉庫技術和應用數(shù)據(jù)
3、挖掘的方法。
二、教學基本要求
在充分講解數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基本概念、基本原理和基本技術的基礎上,注重實際應
用能力的培養(yǎng),通過理論知識的學習和上機環(huán)節(jié),結合實例,使學生能夠比較好的掌握數(shù)據(jù)
倉庫與數(shù)據(jù)挖掘基礎知識,重點培養(yǎng)學生利用數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術分析、解決實際問題
的基本技能。
學生應系統(tǒng)學習并掌握數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本概念,認真思考并理解其發(fā)展的一般
規(guī)律,準確理解和掌握數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本方法和技術及在實際工作中的應用。
1. 學生應對數(shù)據(jù)庫系統(tǒng)的基本概念、基本原理和關系數(shù)據(jù)理論有較扎實的理解,應比
較熟悉關系數(shù)據(jù)庫的原理和實施方法。
2. 學生應具備數(shù)據(jù)
4、結構和算法分析的基本知識。
3. 能夠結合實際問題進行數(shù)據(jù)倉庫的結構設計工作,包括對多維數(shù)據(jù)模型的構造、事
實表與維表的定義等。
4. 教學中應結合實例對每種數(shù)據(jù)挖掘算法進行分析,對算法復雜性進行研究。
5. 教學中應分析本學科當前的研究現(xiàn)狀,提出需解決的問題。
三' 教學內(nèi)容
第一單元數(shù)據(jù)倉庫與數(shù)據(jù)挖掘概述
1、 教學內(nèi)容
(1) 了解數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的產(chǎn)生、發(fā)展,熟悉數(shù)據(jù)挖掘的應用;
(2) 掌握基本概念和數(shù)據(jù)庫中的知識發(fā)現(xiàn)過程;
(3) 數(shù)據(jù)倉庫的基本原理;
(4) 操作型處理(事務型處理)和分析型處理;
(5) 了解OLAP,掌握其基本概念、特點、特性;基本
5、動作、展現(xiàn)方式、OLAP的體
系結構和分類。
2、 重點和難點:
(1) 重點:數(shù)據(jù)庫中的知識發(fā)現(xiàn)過程;
(2) 難點:操作型處理(事務型處理)和分析型處理。
第二單元關聯(lián)規(guī)則挖掘技術
1、 教學內(nèi)容
(1) 關聯(lián)規(guī)則挖掘的基本概念;
(2) 關聯(lián)規(guī)則挖掘的分類;
(3) 關聯(lián)規(guī)則挖掘的Apriori算法;
(4) 關聯(lián)規(guī)則挖掘算法FP-growtho
2、 重點和難點:
(1) 重點:關聯(lián)規(guī)則挖掘的Apriori算法;
(2) 難點:關聯(lián)規(guī)則挖掘算法FP-growtho
第三單元分類和聚類
1、 教學內(nèi)容
(1) 決策樹基礎;
(2) 決策樹算法;
(3)
6、 分類器評價標準;
(4) 距離和相似系數(shù);
(5) 系統(tǒng)聚類法。
2、 重點和難點:
(1) 重點:決策樹基礎;
(2) 難點:決策樹算法。
第四單元遺傳算法和因子分析
1、教學內(nèi)容
(1) 生物進化理論和遺傳學的基本知識;
(2) 遺傳算法基本原理;
(3) 遺傳算法關鍵技術;
(4) 因子分析的基本思想;
(5) 因子分析原理。
2、重點和難點:
(1) 重點:遺傳算法關鍵技術;
(2) 難點:因子分析原理。
第五單元離群點挖掘
1、 教學內(nèi)容
(1) 離群點挖掘的概念;
(2) 基于統(tǒng)計的方法;
(3) 基于距離的方法;
(4) 基于密度的方
7、法;
(5) 基于聚類的方法。
2、 重點和難點:
(1) 重點:基于統(tǒng)計的方法;
(2) 難點:基于聚類的方法。
四' 實踐環(huán)節(jié)設計
本課程安排18學時實驗,詳見本課程實驗教學大綱。
五、課外習題及課程討論
為達到本課程的教學基本要求,課外思考題或習題不應少于20題。
六、 教學方法與手段
本課程采用板書與多媒體課件結合的方式進行課堂教學。
七、 各教學環(huán)節(jié)學時分配
內(nèi)容
講課
實驗
上機
習題課
討論課
自主學習
合計
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
概述
2
2
關聯(lián)規(guī)則挖掘技術
6
4
10
分類和聚類
8、6
4
10
遺傳算法和因子分析
8
6
14
離群點挖掘
6
4
10
串講
2
2
合計
30
18
48
八、學生自主學習要求
課外學生按照授課學時:自主學習時間比例1: 1來對應各章節(jié)自主學習、歸納、總結。
九' 考核方式
1、本課程考試為閉卷筆試。
2、學生的課程總評成績由平時總評成績和期末考試成績兩部分構成(平時總評所占比
例原則上為30%,其中實驗成績占20%,出勤、課堂表現(xiàn)、學習主動性等占10%)。
十、推薦教材和教學參考書
教材:《數(shù)據(jù)倉庫與
9、數(shù)據(jù)挖掘教程》,陳立偉編著,清華大學出版社,201 lo
參考書:《數(shù)據(jù)挖掘原理與技術》,張云濤、龔玲編著,電子工業(yè)出版社,2004o
《數(shù)據(jù)倉庫原理與實踐》,林宇編著,人民郵電出版社,2003o
十一' 說明
1、 注重實踐教學,強調(diào)理論和實際相結合,要求學生會操作。
2、 部分實驗需在課余時間進行。
大綱制訂人:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程組
大綱審定人:
制訂日期:2014年5月
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗(上機)教學大綱
一、 教學目標與基本要求
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》的實踐課程主要介紹數(shù)據(jù)倉庫的工作機理及其構建過程,要求
學生熟練使用數(shù)據(jù)庫管理系統(tǒng)MS SQ
10、L Server,掌握典型的數(shù)據(jù)倉庫系統(tǒng)及其開發(fā)工具的使
用,理解數(shù)據(jù)挖掘的工作原理與流程,掌握典型數(shù)據(jù)挖掘技術及其工具的使用方法,熟悉
SQL SERVER BI DEV集成挖掘環(huán)境。通過上述實驗環(huán)節(jié),使學生加深了解和更好地掌握《數(shù)
據(jù)倉庫與數(shù)據(jù)挖掘》課程教學大綱要求的內(nèi)容。
二、 基本理論與實驗(上機)技術知識
本實驗教學內(nèi)容為《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程實驗。通過實驗,可加深學生對課堂教
學的理論知識的理解和鞏固,掌握計算機操作技能,提高開發(fā)應用軟件能力和細致科學研究
素養(yǎng)。
三' 實驗(上機)方法'特點與基本要求
在《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》的課程實驗過程中,要求學生做到:
11、
(1) 預習實驗指導書有關部分,認真做好實驗內(nèi)容的準備,就實驗可能出現(xiàn)的情況提
前作出思考和分析。
(2) 仔細觀察上機操作時出現(xiàn)的各種現(xiàn)象,記錄主要情況,作出必要說明和分析。
(3) 認真書寫實驗報告。實驗報告包括實驗目的和要求,實驗情況及其分析。
(4) 遵守機房紀律,服從輔導教師指揮,愛護實驗設備。
(5) 實驗課程不遲到。如有事不能出席,所缺實驗一般不補。
(6) 實驗報告按班級分次統(tǒng)一在規(guī)定時間內(nèi)提交。
實驗報告的格式見本指導書的第三部分。實驗報告內(nèi)容應包括:實驗名稱、目的、內(nèi)容、
原理、環(huán)境、實驗步驟、實驗總結(思考題的回答及實驗心得)等內(nèi)容。
四' 主要儀器
12、設備
1、本實驗的計算機配置:1G以上的CPU ; 128 MB以上內(nèi)存,32MB以上顯存;軟件
配置:Windows 2000/XP/2003o
2、應用軟件:Sql server 2005 等。
五、實驗(上機)項目的設置與內(nèi)容提要
序
號
實驗(上機)
項 目
內(nèi)容提要
實驗
學時
實驗
類型
每組
人數(shù)
實驗
要求
1
關聯(lián)規(guī)則挖掘
技 術
關聯(lián)規(guī)則挖掘的Apriori算法;
關聯(lián)規(guī)則挖掘算法FP-growtho
4
綜合
1
必做
2
分類和聚類
決策樹基礎;決策樹算法;
系統(tǒng)聚類法
4
綜合
1
必做
3
遺傳
13、算法和因
遺傳算法關鍵技術;
6
綜合
1
必做
子分析
因子分析算法
4
離群點挖掘
基于統(tǒng)計的方法;基于距離的方法;
基于密度的方法;基于聚類的方法
4
綜合
1
必做
注:總實驗學時為18學時。
六、實驗(上機)報告要求
每次實驗提交實驗報告。實驗報告由提交實驗成果電子和紙質(zhì)文檔組成,并附有實驗原
始記錄。(注:實驗指導書中有實驗目的和實驗步驟的詳細說明,在實驗報告中可不作說明。)
七'考核方式與成績評定
1、 考核方式:上機態(tài)度與實驗報告相結合的方式;
2、 成績評定:考核方法根據(jù)實驗敘述及報告編輯要求,按實驗報告質(zhì)量及結合上機態(tài)
度評定實驗成績,,實驗成績按學生總成績的20%計。
十' 推薦教材和教學參考書
教 材:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程》,陳立偉編著,清華大學出版社,2011。
參考書:《數(shù)據(jù)挖掘原理與技術》,張云濤、龔玲編著,電子工業(yè)出版社,2004o
《數(shù)據(jù)倉庫原理與實踐》,林宇編著,人民郵電出版社,2003o