亚洲中文精品a∨在线,国产在线精品在线精品,国产亚洲欧美一区,欧美肉肉丝视频一区二区


學(xué)校介紹

曼頓培訓(xùn)網(wǎng)(www.mdpxb.com),是北京曼頓企業(yè)管理咨詢有限公司(以下簡(jiǎn)稱北京曼頓咨詢)旗下網(wǎng)站。是總部位于美國(guó)的國(guó)際職業(yè)認(rèn)證標(biāo)準(zhǔn)聯(lián)合會(huì)在北京地區(qū)授權(quán)的培訓(xùn)考試及認(rèn)證單位[認(rèn)證號(hào):IOCL086132],同時(shí)也是 香港培訓(xùn)認(rèn)證中心授權(quán)的培訓(xùn)認(rèn)證機(jī)構(gòu)[認(rèn)證號(hào):HKTCC(GZ)A1.. 招生資質(zhì): 已認(rèn)證
學(xué)校優(yōu)勢(shì): 企業(yè)內(nèi)訓(xùn)方面/公開課方面
咨詢電話: 13810210257
分享到:
Python網(wǎng)絡(luò)爬蟲及數(shù)據(jù)采集技術(shù)培訓(xùn)(北京,3月30-31日)
2018/1/11 7:58:41 來源:北京曼頓企業(yè)管理咨詢有限公司 [加入收藏]

Python網(wǎng)絡(luò)爬蟲及數(shù)據(jù)采集技術(shù)培訓(xùn)(北京,3月30-31日)
【舉辦單位】北京曼頓培訓(xùn)網(wǎng)www.mdpxb.com中國(guó)培訓(xùn)資訊網(wǎng)www.e71edu.com
【咨詢電話】4006820825 010-56133998 13810210257
【培訓(xùn)日期】2018年3月30-31日
【培訓(xùn)地點(diǎn)】北京
【培訓(xùn)對(duì)象】
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開發(fā)人員。
2,牽涉到網(wǎng)絡(luò)采集、處理和規(guī)劃的負(fù)責(zé)人、設(shè)計(jì)人員。
3,政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)等以互聯(lián)網(wǎng)信息為數(shù)據(jù)來源單位的負(fù)責(zé)人。
4,高校、科研院所牽涉到網(wǎng)絡(luò)數(shù)據(jù)采集與數(shù)據(jù)處理的項(xiàng)目負(fù)責(zé)人。

【課程背景】
Python是一種面向?qū)ο蟆⒔忉屝陀?jì)算機(jī)程序設(shè)計(jì)語言,Python是純粹的自由軟件,源代碼和解釋器CPython遵循 GPL協(xié)議。是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具,也是GNU的一個(gè)免費(fèi)、源代碼開放的軟件。
Python語法簡(jiǎn)潔清晰,具有豐富和強(qiáng)大的庫(kù),能夠把用其他語言制作的各種模塊(尤其是C/C++)很輕松地聯(lián)結(jié)在一起。 Python爬蟲包括一套完整的數(shù)據(jù)采集、處理、計(jì)算系統(tǒng),簡(jiǎn)便而強(qiáng)大的編程語言,可操縱數(shù)據(jù)的輸入和輸入,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。
本培訓(xùn)將對(duì)基于Python爬蟲進(jìn)行數(shù)據(jù)采集、處理、數(shù)據(jù)分析的方法深度剖析,并對(duì)Python爬蟲原理及實(shí)現(xiàn)進(jìn)行講解。

【學(xué)員基礎(chǔ)】
1,對(duì)IT系統(tǒng)設(shè)計(jì)有一定的理論與實(shí)踐經(jīng)驗(yàn)。
2,具備信息檢索IR和大數(shù)據(jù)處理的基礎(chǔ)知識(shí)。
3,有一定的python基礎(chǔ)知識(shí)和開發(fā)經(jīng)驗(yàn)。

【培訓(xùn)目標(biāo)】
1,全面了解Python爬蟲的相關(guān)知識(shí)。
2,學(xué)習(xí)Python爬蟲的核心技術(shù)方法以及應(yīng)用特征。
3,深入使用Python在網(wǎng)絡(luò)數(shù)據(jù)采集中的使用。

【課程大綱】
第一講 網(wǎng)絡(luò)爬蟲基礎(chǔ)
1.什么是網(wǎng)絡(luò)爬蟲
2.瀏覽網(wǎng)頁(yè)的過程
3.URL的含義
4. 環(huán)境的配置
第二講 Python爬蟲基礎(chǔ)知識(shí)
1.Python爬蟲基礎(chǔ)學(xué)習(xí)
2.Python urllib和urllib2 庫(kù)的用法
3.Python 正則表達(dá)式
4.BeautifulSoup簡(jiǎn)介
5.爬蟲框架Scrapy
第三講 Urllib庫(kù)的基本使用
1.網(wǎng)頁(yè)爬取示例
2.網(wǎng)頁(yè)爬取方法
3.構(gòu)造Requset
4.POST和GET數(shù)據(jù)傳送
第四講 Urllib庫(kù)的高級(jí)用法
1.設(shè)置Headers
2. Proxy(代理)的設(shè)置
3.Timeout 設(shè)置
4.HTTP的PUT和DELETE方法
5.使用DebugLog
第五講 正則表達(dá)式
1.了解正則表達(dá)式
2.正則表達(dá)式的語法規(guī)則
3.正則表達(dá)式相關(guān)注解
4.Python Re模塊
第六講 Beautiful Soup的用法
1. Beautiful Soup的簡(jiǎn)介
2. Beautiful Soup 安裝
3. 創(chuàng)建 Beautiful Soup 對(duì)象
4. Beautiful Soup對(duì)象種類
5. 遍歷文檔樹
第七講 開始采集
1.遍歷單個(gè)域名
2.采集整個(gè)網(wǎng)站
3.通過互聯(lián)網(wǎng)采集
4.用Scrapy采集
5.幾個(gè)示例
第八講 存儲(chǔ)數(shù)據(jù)和讀取文檔
1.媒體文件
2.把數(shù)據(jù)存儲(chǔ)到CSV
3.MySQL與Python整合
4.讀取純文本和CSV文檔
5.讀取Word和.docx
第九講 自然語言處理基礎(chǔ)
1.概括數(shù)據(jù)
2.馬爾可夫模型
3.自然語言工具包
4.用NLTK做統(tǒng)計(jì)分析
5.用NLTK做詞性分析
第十講 用爬蟲測(cè)試網(wǎng)站
1.測(cè)試簡(jiǎn)介
2.Python單元測(cè)試
3.Selenium單元測(cè)試
4.Python單元測(cè)試與Selenium單元測(cè)試的選擇

【講師介紹】
楊老師,曼頓培訓(xùn)網(wǎng)(www.mdpxb.com)資深講師。主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長(zhǎng)期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開發(fā)工作,主持和參與了多個(gè)國(guó)家和省部級(jí)基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。

【費(fèi)用及報(bào)名】
1、費(fèi)用:培訓(xùn)費(fèi)5500元(含培訓(xùn)費(fèi)、講義費(fèi));如需食宿,會(huì)務(wù)組可統(tǒng)一安排,費(fèi)用自理。
2、報(bào)名咨詢:4006820825 010-56133998 56028090 13810210257 鮑老師
3、報(bào)名流程:電話登記-->填寫報(bào)名表-->發(fā)出培訓(xùn)確認(rèn)函
4、備注:如課程已過期,請(qǐng)?jiān)L問我們的網(wǎng)站,查詢最新課程
5、詳細(xì)資料請(qǐng)?jiān)L問北京曼頓培訓(xùn)網(wǎng):www.mdpxb.com (每月在全國(guó)開設(shè)四百多門公開課,歡迎報(bào)名學(xué)習(xí))

我要發(fā)表評(píng)論

      危正龍
      方向:更多管理研修
      危正龍 EMC教練 中國(guó)職業(yè)經(jīng)理人沙盤實(shí)戰(zhàn)演練專家教練 清華大學(xué)國(guó)家CIMS培訓(xùn)中心EMBA班客座教授 學(xué)歷和歷任職務(wù): MBA碩士,歷任王碼五筆公司全國(guó)營(yíng)銷經(jīng)理、王碼集團(tuán)人力...