作品介紹

Python網(wǎng)絡(luò)爬蟲(chóng)從入門(mén)到實(shí)踐


作者:唐松      整理日期:2021-11-18 16:47:39

使用Python編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)程序獲取互聯(lián)網(wǎng)上的大數(shù)據(jù)是當(dāng)前的熱門(mén)專題。本書(shū)內(nèi)容包括三部分:基礎(chǔ)部分、進(jìn)階部分和項(xiàng)目實(shí)踐部分;A(chǔ)部分(~7章)主要介紹爬蟲(chóng)的三個(gè)步驟——獲取網(wǎng)頁(yè)、解析網(wǎng)頁(yè)和存儲(chǔ)數(shù)據(jù),通過(guò)諸多示例的講解,讓讀者從基礎(chǔ)內(nèi)容開(kāi)始系統(tǒng)性地學(xué)習(xí)爬蟲(chóng)技術(shù),并在實(shí)踐中提升Python爬蟲(chóng)水平。進(jìn)階部分(第8~13章)包括多線程的并發(fā)和并行爬蟲(chóng)、分布式爬蟲(chóng)、更換IP等,幫助讀者進(jìn)一步提升爬蟲(chóng)水平。項(xiàng)目實(shí)踐部分(4~17章)使用本書(shū)介紹的爬蟲(chóng)技術(shù)對(duì)幾個(gè)真實(shí)的網(wǎng)站進(jìn)行抓取,讓讀者能在讀完本書(shū)后根據(jù)自己的需求寫(xiě)出爬蟲(chóng)程序。無(wú)論你是否有編程基礎(chǔ),只要對(duì)爬蟲(chóng)技術(shù)感興趣,本書(shū)就能帶領(lǐng)你從入門(mén)到實(shí)戰(zhàn)再到進(jìn)階,一步步了解爬蟲(chóng),很終寫(xiě)出自己的爬蟲(chóng)程序。唐松,2010年獲全額獎(jiǎng)學(xué)金人讀香港中文大學(xué)商學(xué)院,之后獲得康奈爾大學(xué)信息科學(xué)碩士學(xué)位。曾與IBM合作大數(shù)據(jù)A100計(jì)劃,為多個(gè)世界500強(qiáng)公司提供數(shù)據(jù)挖掘服務(wù),并將網(wǎng)絡(luò)爬蟲(chóng)的經(jīng)驗(yàn)應(yīng)用到這些項(xiàng)目中。2018年以技術(shù)大咖入職騰訊公司,現(xiàn)任騰訊數(shù)據(jù)服務(wù)中心數(shù)據(jù)分析師,分析騰訊的海量數(shù)據(jù)。曾經(jīng)在香港中文大學(xué)、香港中文大學(xué)(深圳)、西南交通大學(xué)、東華大學(xué)多家高校進(jìn)行過(guò)網(wǎng)絡(luò)爬蟲(chóng)教學(xué),獲得許多教授、博士生、研究生的一致好評(píng)。





上一本:計(jì)算思維之快樂(lè)編程 下一本:英語(yǔ)被動(dòng)結(jié)構(gòu)習(xí)得順序研究

作家文集

下載說(shuō)明
Python網(wǎng)絡(luò)爬蟲(chóng)從入門(mén)到實(shí)踐的作者是唐松 ,全書(shū)語(yǔ)言優(yōu)美,行文流暢,內(nèi)容豐富生動(dòng)引人入勝。為表示對(duì)作者的支持,建議在閱讀電子書(shū)的同時(shí),購(gòu)買(mǎi)紙質(zhì)書(shū)。

更多好書(shū)