Python和R數(shù)據(jù)挖掘技術(shù)-基于Python和R語言的數(shù)據(jù)挖掘和統(tǒng)計分析技術(shù)(上海,8月29-31日)
【舉辦單位】北京曼頓培訓網(wǎng) www.mdpxb.com 中國培訓資訊網(wǎng) www.e71edu.com
【咨詢電話】4006820825 010-56133998 13810210257
【培訓日期】2018年8月29-31日
【培訓地點】上海
【培訓對象】
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級程序員、資深開發(fā)人員。
2,牽涉到數(shù)據(jù)挖掘和統(tǒng)計分析的數(shù)據(jù)中心運行、規(guī)劃、設計負責人。
3,政府機關(guān),金融保險、移動和互聯(lián)網(wǎng)等大數(shù)據(jù)來源單位的負責人。
4,高校、科研院所牽涉到數(shù)據(jù)挖掘與統(tǒng)計分析處理的項目負責人。
【課程背景】
隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實地迎來了一個大數(shù)據(jù)的時代。如何對海量數(shù)據(jù)進行挖掘和分析,已經(jīng)成為一個非常重要且緊迫的需求。
R是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具,也是GNU的一個自由、免費、源代碼開放的軟件。R包括一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng),數(shù)組運算工具(其向量、矩陣運算方面功能尤其強大),完整連貫的統(tǒng)計分析工具,優(yōu)秀的統(tǒng)計制圖功能。
Python是一個數(shù)據(jù)分析和圖形顯示的程序設計環(huán)境,用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。Python有簡便而強大的編程語言:可操縱數(shù)據(jù)的輸入和輸入,可實現(xiàn)分支、循環(huán),用戶可自定義功能。
本培訓將對基于Python和R語言進行數(shù)據(jù)處理、數(shù)據(jù)探索的基本方法,利用R語言實現(xiàn)模型選擇、Logistic回歸及決策樹算法,以及貝葉斯算法及支持向量機、神經(jīng)網(wǎng)絡等算法原理及實現(xiàn)進行講解。
【學員基礎(chǔ)】
1,對IT系統(tǒng)設計有一定的理論與實踐經(jīng)驗。
2,對數(shù)據(jù)挖掘和數(shù)據(jù)處理方法有一定的基礎(chǔ)知識。
3,對Hadoop/Spark等大數(shù)據(jù)技術(shù)有一定的了解。
【培訓目標】
1, 全面了解Python和R語言數(shù)據(jù)挖掘的相關(guān)知識。
2,學習Python和R的數(shù)據(jù)挖掘核心技術(shù)方法以及應用特征。
3,深入使用Python和R在數(shù)據(jù)挖掘和分析中的使用。
【課程大綱】
第一講 數(shù)據(jù)挖掘,Python和R簡介
1.1數(shù)據(jù)挖掘
1.2Python語言
1.3 R語言
1.4 Iris數(shù)據(jù)集
1.5 Bodyfat數(shù)據(jù)集
第二講 數(shù)據(jù)的導入與導出
2.1 R數(shù)據(jù)的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數(shù)據(jù)庫中讀取數(shù)據(jù)
2.4 從Excel中導入與導出數(shù)據(jù)
2.5 Python的數(shù)據(jù)操作
第三講 數(shù)據(jù)可視化展現(xiàn)
3.1 查看數(shù)據(jù)
3.2 單個變量展現(xiàn)
3.3 多個變量展現(xiàn)
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構(gòu)建決策樹
4.2 使用rpart包構(gòu)建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現(xiàn)
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現(xiàn)
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現(xiàn)
6.6 Python聚類實例
第七講 離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數(shù)據(jù)的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數(shù)據(jù)
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關(guān)聯(lián)規(guī)則
9.1 關(guān)聯(lián)規(guī)則的基本概念
9.2 Titanic數(shù)據(jù)集
9.3 關(guān)聯(lián)規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關(guān)聯(lián)規(guī)則的可視化
9.7 Python中的關(guān)聯(lián)規(guī)則實例
第十講 社交網(wǎng)絡分析
10.1 詞項網(wǎng)絡
10.2 推文網(wǎng)絡
10.3 雙模式網(wǎng)絡
10.4 Python中的社交網(wǎng)絡分析實例
【講師介紹】
楊老師,曼頓培訓網(wǎng)(www.mdpxb.com)資深講師。 主要研究網(wǎng)絡信息分析以及云計算相關(guān)技術(shù),長期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡信息處理、商務智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發(fā)經(jīng)驗。
【費用及報名】
1、費用:培訓費5800元(含培訓費、講義費);如需食宿,會務組可統(tǒng)一安排,費用自理。
2、報名咨詢:4006820825 010-56133998 56028090 13810210257 鮑老師
3、報名流程:電話登記-->填寫報名表-->發(fā)出培訓確認函
4、備注:如課程已過期,請訪問我們的網(wǎng)站,查詢最新課程
5、詳細資料請訪問北京曼頓培訓網(wǎng):www.mdpxb.com (每月在全國開設四百多門公開課,歡迎報名學習)