課程大綱 Syllabus |
學生學習目標 Learning Objectives |
單元學習活動 Learning Activities |
學習成效評量 Evaluation |
備註 Notes |
序 No. | 單元主題 Unit topic |
內容綱要 Content summary |
1 | 第一章 簡介 |
運用探勘技術從大量資料中挖掘出資料之間的關連性以及隱藏的知識,實現『神機妙算』的個人化服務 |
基本概念 |
|
|
|
2 | 第二章資料倉儲 |
資料倉儲乃是利用大量歷史資料之資料庫,提供彙總或是統計的資訊,以支援決策之使用。 |
資料倉儲的基本概念、為何需要資料倉儲、資料倉儲的儲存架構、資料瀏覽的操作方法與建置過程。 |
|
|
|
3 | 第三章 資料前置處理 |
解決資料不完整 (data incomplete)、資料中某些屬性值有遺缺、
資料有雜訊 (noise)、資料有錯誤或是特例(outlier)造成資料不一致 (data inconsistency)等情形。 |
習得資料前置處理的相關問題,包括資料清理、資料整合以及資料轉換。資料前置處理的目的,提高資料探勘的品質,有高品質的資料,才有高品質的探勘結果 。 |
|
|
|
4 | 第四章 資料精簡 |
資料精簡在資料探勘過程中所扮演的角色
狹義而言:主要應用在資料的前置處理階段 (pre-processing phase)
從資料集合中挑選、過濾出具代表性的資料,進而r減少整個資料探勘的時間和成本。廣義而言:整個資料探勘過程都可以應用資料精簡的技術。 |
資料維度的精簡
資料記錄的精簡
資料數值的精簡 |
|
|
|
5 | 第五章 資料分類法 |
根據已知資料及其分類屬性值,建立資料的分類模型,接著利用此分類模型預測新資料的類別。 |
以決策樹為基礎的分類法
非決策樹為基礎的分類法: 貝氏分類法、記憶基礎推論法、類神經分類法 |
|
|
|
6 | 期中考 |
融會貫通 |
融會貫通 |
|
|
|
7 | 第六章 資料群集分析 |
將資料集合中的資料記錄,加以分群成數個群集(cluster),使得每個群集中的資料點間相似程度高於與其它群集中資料點的相似程度 。 |
在群集分析的過程中,並沒有預先指定好的類別資訊,也沒有任何資訊可以表示資料記錄彼此之間是相關的,所以群集分析被視為一個非監督式學習的過程。 |
|
|
|
8 | 第七章 關連法則探勘 |
關連法則探勘的目的是找出交易中可能相關連的產品項目。 |
1. 基本的關連法則探勘
2. 多層次關連法則探勘
3. 數量化關連法則探勘
4. 關連分析 |
|
|
|
9 | 第八章 時間序列分析 |
循序樣式探勘的目的是找出顧客在不同時間點所購買的物品先後之關係。 |
1. 最基礎的一個演算法 — AprioriAll演算法。
2. 一般化的循序樣式探勘:將時間和限制條件考慮在循序樣式的探勘中
3. 網頁瀏覽樣式探勘:分析使用者經常瀏覽的網頁樣式 |
|
|
|
10 | 第九章 工具(R, RStudio) 介紹 |
introduce R for data mining |
Learn how to programming in R |
|
|
|
11 | 第十章 Case Study |
case study by using R |
case study by using R |
|
|
|
12 | 期末考 |
融會貫通 |
融會貫通 |
|
|
|