教學大綱表
請遵守智慧財產權,勿使用非法影印教科書,避免觸法。
課程名稱 (中文) 資料探勘
(英文) Data Mining
開課單位 資訊工程研究所
課程代碼 I5980
授課教師 謝禎冏
學分數 3.0 必/選修 選修 開課年級 研究所
先修科目或先備能力:
課程概述與目標:習得從大量資料中挖掘有價值的資訊,供管理人員做為決策參考,開創新商業契機。其中技術包括迴歸分析、類別資料分析、群集分析、類神經網路(artificial neural network)、決策樹(decision tree)、基因演算法(genetic algorithms)、規則推論法(rules induction)、模糊理論(fuzzy logic)等。
教科書 資料探勘(Data Mining),曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯著
旗標出版社
參考教材 R and Data Mining: Examples and Case Studies, Yanchang Zhao,
Elsevier in December 2012.
課程大綱 學生學習目標 單元學習活動 學習成效評量 備註
單元主題 內容綱要
1 第一章 簡介 運用探勘技術從大量資料中挖掘出資料之間的關連性以及隱藏的知識,實現『神機妙算』的個人化服務 基本概念
  • 討論
  • 講授
  • 作業
  •  
    2 第二章資料倉儲 資料倉儲乃是利用大量歷史資料之資料庫,提供彙總或是統計的資訊,以支援決策之使用。 資料倉儲的基本概念、為何需要資料倉儲、資料倉儲的儲存架構、資料瀏覽的操作方法與建置過程。
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    3 第三章 資料前置處理 解決資料不完整 (data incomplete)、資料中某些屬性值有遺缺、
    資料有雜訊 (noise)、資料有錯誤或是特例(outlier)造成資料不一致 (data inconsistency)等情形。
    習得資料前置處理的相關問題,包括資料清理、資料整合以及資料轉換。資料前置處理的目的,提高資料探勘的品質,有高品質的資料,才有高品質的探勘結果 。
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    4 第四章 資料精簡 資料精簡在資料探勘過程中所扮演的角色
    狹義而言:主要應用在資料的前置處理階段 (pre-processing phase)
    從資料集合中挑選、過濾出具代表性的資料,進而r減少整個資料探勘的時間和成本。廣義而言:整個資料探勘過程都可以應用資料精簡的技術。
    資料維度的精簡
    資料記錄的精簡
    資料數值的精簡
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    5 第五章 資料分類法 根據已知資料及其分類屬性值,建立資料的分類模型,接著利用此分類模型預測新資料的類別。 以決策樹為基礎的分類法
    非決策樹為基礎的分類法: 貝氏分類法、記憶基礎推論法、類神經分類法
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    6 期中考 融會貫通 融會貫通
  • 期中考
  •  
    7 第六章 資料群集分析 將資料集合中的資料記錄,加以分群成數個群集(cluster),使得每個群集中的資料點間相似程度高於與其它群集中資料點的相似程度 。 在群集分析的過程中,並沒有預先指定好的類別資訊,也沒有任何資訊可以表示資料記錄彼此之間是相關的,所以群集分析被視為一個非監督式學習的過程。
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    8 第七章 關連法則探勘 關連法則探勘的目的是找出交易中可能相關連的產品項目。 1. 基本的關連法則探勘
    2. 多層次關連法則探勘
    3. 數量化關連法則探勘
    4. 關連分析
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    9 第八章 時間序列分析 循序樣式探勘的目的是找出顧客在不同時間點所購買的物品先後之關係。 1. 最基礎的一個演算法 — AprioriAll演算法。
    2. 一般化的循序樣式探勘:將時間和限制條件考慮在循序樣式的探勘中
    3. 網頁瀏覽樣式探勘:分析使用者經常瀏覽的網頁樣式
  • 討論
  • 講授
  • 平時考
  • 作業
  •  
    10 第九章 工具(R, RStudio) 介紹 introduce R for data mining Learn how to programming in R
  • 討論
  • 講授
  • 作業
  •  
    11 第十章 Case Study case study by using R case study by using R
  • 討論
  • 講授
  • 問答
  • 作業
  •  
    12 期末考 融會貫通 融會貫通
  • 期末考
  •  

    教學要點概述:
    教材編選: □ 自編教材 ■ 教科書作者提供
    評量方法: 期末考:30%   期中考:30%   問答:5%   平時考:15%   作業:20%  
    教學資源: ■ 教材電子檔 ■ 課程網站
    課程網站:網路硬碟一
    扣考規定:http://eboard.ttu.edu.tw/ttuwebpost/showcontent-news.php?id=504