ISBN/价格: | 978-7-302-50328-6:CNY69.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 玩转Python网络爬虫/.黄永祥著 |
出版发行项: | 北京:,清华大学出版社:,2018.8 |
载体形态项: | 311页:;+图:;+23cm |
提要文摘: | 本书站在初学者的角度,从原理到实践,循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,分别是网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网络做全面分析;数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识;数据清洗主要介绍字符串操作、正则和Beauti血l Soup的使用;数据入库分别讲述了MySQL和MongoDB的操作,通过Om框架SQLAlchemy实现数据持久化,实现企业级开发。 |
题名主题: | 软件工具 程序设计 |
中图分类: | TP311.56 |
个人名称等同: | 黄永祥 著 |
记录来源: | CN shxhcmtsbmb 20180711 |