注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術自動化技術、計算技術爬蟲實戰(zhàn):從數據到產品

爬蟲實戰(zhàn):從數據到產品

爬蟲實戰(zhàn):從數據到產品

定 價:¥69.00

作 者: 賀思聰
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121355080 出版時間: 2019-04-01 包裝: 平裝
開本: 16開 頁數: 244 字數:  

內容簡介

  本書從多個數據項目實例出發(fā),介紹爬蟲、反爬蟲的各種案例,使讀者了解到數據抓取和分析的完整過程。書中案例的難度由淺入深,以作者原創(chuàng)的代碼為主,不借助現成的框架,強調在數據采集過程中的發(fā)散思維,總結攻克反爬蟲的思維模式,實現以低成本的方式得到想要的數據的愿望。最后,用一個“愛飛狗”的例子,為讀者展示如何從0到1地開發(fā)一個大數據產品。

作者簡介

  賀思聰,畢業(yè)于電子科技大學,在ThoughtWorks任高級咨詢師,擔任海外交付團隊技術負責人、架構師。 具有十余年產品研發(fā)經驗,涉及澳洲礦業(yè)相關數字產品研發(fā)、保險業(yè)網站技術架構、光網絡設備軟件研發(fā)、醫(yī)療AR/VR、機械控制、加工仿真模擬等領域。 精通大規(guī)模重構實踐、測試驅動開發(fā),熟悉微服務架構及架構實踐,熟悉敏捷項目開發(fā)管理流程和相關實踐,具有豐富的敏捷團隊管理經驗。

圖書目錄

第1章  基礎知識 1
1.1  什么是爬蟲 1
1.2  數據獲取渠道 2
1.3  抓包分析工具 4
1.4  爬蟲和反爬蟲的斗爭 5
1.5  數據處理、分析和可視化 20
1.6  延深閱讀 21
第2章  基于位置信息的爬蟲Ⅰ 23
2.1  背景及目標 23
2.2  爬蟲原理 24
2.3  數據來源分析 26
2.4  簡單的矩形區(qū)域爬取方式 38
2.5  高級區(qū)域爬取方式 46
2.6  坐標轉換 49
2.7  存儲數據的方式 49
2.8  數據導入 51
2.9  基本數據分析 52
2.10  地圖可視化 56
2.11  軌跡可視化 58
2.12  總結 60
第3章  基于位置信息的爬蟲Ⅱ 62
3.1  背景及目標 62
3.2  爬蟲原理 62
3.3  優(yōu)化方案一 71
3.4  優(yōu)化方案二 75
3.5  優(yōu)化方案三 82
3.6  導入數據到數據庫 97
3.7  基本數據分析及可視化 100
3.8  總結 117
第4章  網站信息爬取及可視化 118
4.1  背景及目標 118
4.2  網站API分析 118
4.3  數據爬取 122
4.4  數據導入 129
4.5  數據分析及可視化 133
4.6  總結 173
第5章  基于逆向分析小程序的爬蟲 174
5.1  背景及目標 174
5.2  數據來源分析 176
5.3  數據爬取方案 177
5.4  轉換數據格式 195
5.5  總結 196
第6章  從數據到產品 197
6.1  從一張機票說起 197
6.2  從價值探索到交付落地 201
6.3  數據爬取 203
6.4  爬蟲架構設計 203
6.5  發(fā)現數據的價值 211
6.6  創(chuàng)新的不確定性 223
6.7  產品設計 226
6.8  產品交付 235
6.9  總結 236

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號