課程目標:
教導學員利用Python語言重要的函式庫,完成智慧資料分析。本課程運用numpy、pandas、scikit-learn、statsmodels、matplotlib等Python套件,搭配通用的資料分析流程:資料理解、資料準備、建模、模型評估與結果後處理,進行結構化與低結構化的資料分析與建模實作;在機器學習的部分,將教導非監督式學習、監督式學習與薈萃式學習;在資料探勘方法上,則涵蓋頻繁型態探勘、集群、迴歸與分類,結合統計分析、數據探索、屬性工程與資料視覺化,達成資料探勘與機器學習預測建模的學習目標。
課程特色:
講師將透過理論說明與案例實作,讓學員瞭解不同方法、工具與應用領域之間的差異,並分享氣象、交通、互聯網、零售、金融與製造等資料處理與分析之經驗,幫助學員掌握大數據know-how的全貌,厚植活用資料分析建模的實力,掌握未來的技術趨勢。
修課條件:
◎建議具備資訊/電機/電子/機械/工程/工管/化工等理工科系背景者。
◎適合資料分析師、資料科學家、程式設計師等相關職務者報名。
課程大綱:
1.Anaconda Python、整合式開發環境Spyder與Jupyter Notebook介紹
2.資料導向編程與Python語法特色
3.屬性工程與重抽樣方法
4.頻繁型態挖掘
5.集群分析
6.線性迴歸與分類(主成份迴歸、偏最小平方法邏輯斯迴歸與線性判別分析)
7.非線性迴歸與分類(k近鄰法、天真貝式分類、支援向量機)
8.決策樹與薈萃式學習(拔靴集成、多模激發與隨機森林)