知源书城 -Python 3爬虫数据清洗与可视化实战 【正版】
本书资料更新时间:2025-01-20 17:56:07

Python 3爬虫数据清洗与可视化实战 【正版】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

Python 3爬虫数据清洗与可视化实战 【正版】精美图片
》Python 3爬虫数据清洗与可视化实战 【正版】电子书籍版权问题 请点击这里查看《

Python 3爬虫数据清洗与可视化实战 【正版】书籍详细信息

  • ISBN:9787121333590
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-04
  • 页数:212
  • 价格:6.80
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-20 17:56:07

寄语:

【热销推荐,正版现货,全国三仓就近发货,物流快捷,欢迎选购!】


内容简介:

《Python 3爬虫、数据清洗与可视化实战》是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python 读物。《Python 3爬虫、数据清洗与可视化实战》案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

《Python 3爬虫、数据清洗与可视化实战》共分11 章,6 个核心主题:其一是Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python 数据库应用,包括MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识、pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib 和Pyecharts 两个库的使用,涉及饼图、柱形图、线图、

词云图、地图等图形,帮助读者进入可视化的殿堂。

《Python 3爬虫、数据清洗与可视化实战》以实战为主,适合Python 初学者及高等院校的相关专业学生,也适合Python 培训机构作为实验教材使用。


书籍目录:

章 Python 基础 /1

1.1 安装 Python 环境 /1

1.1.1 Python 3.6.2 安装与配置 /1

1.1.2 使用 IDE 工具——PyCharm /4

1.1.3 使用 IDE 工具——Anaconda / 4

1.2 Python 操作入门/6

1.2.1 编写个 Python 代码/6

1.2.2 Python 基本操作/9

1.2.3 变量/10

1.3 Python 数据类型/10

1.3.1 数字/10

1.3.2 字符串/11

1.3.3 列表/13

1.3.4 元组/14

1.3.5 集合/15

1.3.6 字典/15

1.4 Python 语句与函数/16

1.4.1 条件语句/16

1.4.2 循环语句/16

1.4.3 函数/17

第 2 章 写一个简单的爬虫/18

2.1 关于爬虫的合法性/18

2.2 了解网页/20

2.2.1 认识网页结构/ 21

2.2.2 写一个简单的 HTML/21

2.3 使用 requests 库请求网站/23

2.3.1 安装requests 库/23

2.3.2 爬虫的基本原理/25

2.3.3 使用 GET 方式抓取数据/26

2.3.4 使用 POST 方式抓取数据/27

2.4 使用 Beautiful Soup 解析网页/30

2.5 清洗和组织数据/34

2.6 爬虫攻防战/35

第 3 章用 API 爬取天气预报数据/38

3.1 注册免费 API 和阅读技术文档/38

3.2 获取 API 数据/40

3.3 存储数据到 MongoDB /45

3.3.1 下载并安装 MongoDB/ 45

3.3.2 在 PyCharm 中安装 MongoPlugin/ 46

3.3.3 将数据存入 MongoDB/49

3.4 MongoDB 数据库查询/52

第 4 章大型爬虫案例:抓取某电商网站的商品数据/55

4.1 观察页面特征和解析数据/55

4.2 工作流程分析/64

4.3 构建类目树/65

4.4 获取产品列表/ 68

4.5 代码优化/70

4.6 爬虫效率优化/74

4.7 容错处理/77

第 5 章 Scrapy 爬虫/78

5.1 Scrapy 简介/78

5.2 Scrapy 安装/79

5.3 案例:用 Scrapy 抓取股票行情/ 80

第 6 章 Selenium 爬虫/88

6.1 Selenium 简介/88

6.2 案例:用 Selenium 抓取电商网站数据/90

第 7 章数据库连接和查询/100

7.1 使用 PyMySQL/100

7.1.1 连接数据库/100

7.1.2 案例:某电商网站女装行业 TOP100 数据/102

7.2 使用 SQLAlchemy/104

7.2.1 SQLAlchemy 基本介绍/104

7.2.2 SQLAlchemy 基本语法/105

7.3 MongoDB/107

7.3.1 MongoDB 基本语法/107

7.3.2 案例:在某电商网站搜索“连衣裙”的商品数据/107

第 8 章 NumPy/109

8.1 NumPy 简介/109

8.2 一维数组/110

8.2.1 数组与列表的异同/110

8.2.2 数组的创建/111

8.3 多维数组/111

8.3.1 多维数组的高效性能/112

8.3.2 多维数组的索引与切片/113

8.3.3 多维数组的属性/113

8.4 数组的运算/115

第 9 章 pandas 数据清洗/117

9.1 数据读写、选择、整理和描述/117

9.1.1 从 CSV 中读取数据/119

9.1.2 向 CSV 写入数据/120

9.1.3 数据选择/120

9.1.4 数据整理/122

9.1.5 数据描述/123

9.2 数据分组、分割、合并和变形/124

9.2.1 数据分组/124

9.2.2 数据分割/127

9.2.3 数据合并/128

9.2.4 数据变形/134

9.2.5 案例:旅游数据的分析与变形/136

9.3 缺失值、异常值和重复值处理/140

9.3.1 缺失值处理/140

9.3.2 检测和过滤异常值/144

9.3.3 移除重复数据/147

9.3.4 案例:旅游数据的值检查与处理/149

9.4 时序数据处理/152

9.4.1 日期/时间数据转换/152

9.4.2 时序数据基础操作/153

9.4.3 案例:天气数据分析与处理/155

9.5 数据类型转换/158

9.6 正则表达式/ 160

9.6.1 元字符与限定符/161

9.6.2 案例:用正则表达式提取网页文本信息/162

0 章综合应用实例/164

10.1 按性价比给用户旅游产品/164

10.1.1 数据采集/165

10.1.2 数据清洗、建模/169

10.2 通过热力图分析为用户提供出行建议/172

10.2.1 某旅游网站热门景点爬虫代码(qunaer_sights.py)/175

10.2.2 提取 CSV 文件中经纬度和信息/178

10.2.3 创建景点门票热力地图 HTML 文件/179

1 章数据可视化/182

11.1 matplotlib/183

11.1.1 画出各省份平均价格、各省份平均成交量柱状图/183

11.1.2 画出各省份平均成交量折线图、柱状图、箱形图和饼图/184

11.1.3 画出价格与成交量的散点图/185

11.2 pyecharts/186

11.2.1 Echarts 简介/186

11.2.2 pyecharts 简介/187

11.2.3 初识 pyecharts,玫瑰相送/187

11.2.4 pyecharts 基本语法/188

11.2.5 基于商业分析的 pyecharts 图表绘制/190

11.2.6 使用 pyecharts 绘制其他图表/199

11.2.7 pyecharts 和 Jupyter/203


作者介绍:

零一

原名陈海城,

零一数据学院创始人,

电商数据专家,数据分析师,开发工程师。

从事培训教育、数据分析和人工智能行业。

黄园园,具有十年软件开发经验,全栈工程师,六西格玛黑带,精通Python和机器学习算法,具有丰富的分布式爬虫开发经验;曾在苏州三星电子电脑(SESC)、新加坡电信(NCS)、希捷科技(Seagate Technology)等世界知名企业研发部工作,参与过花旗银行在线支付系统、银行账单自动化审核系统等大型软件开发,曾任杭州沐垚科技CTO。

韩要宾,杭州沐垚科技有限公司 COO,CDA数据分析研究院讲师;5年电商从业经验,4年数据挖掘实战经验;专注于数据分析与挖掘、机器学习、深度学习,服务客户包括易购、迪卡侬、百草味、浙江师范大学等。


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!



原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

书籍介绍

《Python 3爬虫、数据清洗与可视化实战》是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的Python 读物。《Python 3爬虫、数据清洗与可视化实战》案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。

《Python 3爬虫、数据清洗与可视化实战》共分11 章,6 个核心主题:其一是Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python 数据库应用,包括MongoDB、MySQL 在Python中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识、pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用;其五是综合应用案例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括Matplotlib 和Pyecharts 两个库的使用,涉及饼图、柱形图、线图、

词云图、地图等图形,帮助读者进入可视化的殿堂。

《Python 3爬虫、数据清洗与可视化实战》以实战为主,适合Python 初学者及高等院校的相关专业学生,也适合Python 培训机构作为实验教材使用。


书籍真实打分

  • 故事情节:9分

  • 人物塑造:4分

  • 主题深度:4分

  • 文字风格:4分

  • 语言运用:6分

  • 文笔流畅:9分

  • 思想传递:9分

  • 知识深度:6分

  • 知识广度:5分

  • 实用性:4分

  • 章节划分:3分

  • 结构布局:4分

  • 新颖与独特:5分

  • 情感共鸣:5分

  • 引人入胜:3分

  • 现实相关:6分

  • 沉浸感:8分

  • 事实准确性:8分

  • 文化贡献:8分


网站评分

  • 书籍多样性:6分

  • 书籍信息完全性:6分

  • 网站更新速度:7分

  • 使用便利性:5分

  • 书籍清晰度:8分

  • 书籍格式兼容性:5分

  • 是否包含广告:9分

  • 加载速度:6分

  • 安全性:3分

  • 稳定性:5分

  • 搜索功能:5分

  • 下载便捷性:7分


下载点评

  • 方便(151+)
  • 强烈推荐(285+)
  • 格式多(608+)
  • 不亏(83+)
  • 体验满分(361+)
  • 下载快(296+)
  • 图书多(302+)
  • 简单(158+)
  • 内容完整(638+)
  • 差评(297+)

下载评价

  • 网友 林***艳: ( 2024-12-23 10:40:31 )

    很好,能找到很多平常找不到的书。

  • 网友 索***宸: ( 2024-12-22 09:25:35 )

    书的质量很好。资源多

  • 网友 冷***洁: ( 2025-01-05 13:49:12 )

    不错,用着很方便

  • 网友 养***秋: ( 2025-01-07 14:25:18 )

    我是新来的考古学家

  • 网友 后***之: ( 2025-01-08 07:11:51 )

    强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!

  • 网友 孙***夏: ( 2025-01-03 07:49:28 )

    中评,比上不足比下有余

  • 网友 寇***音: ( 2024-12-25 16:42:02 )

    好,真的挺使用的!

  • 网友 曾***文: ( 2024-12-31 09:39:30 )

    五星好评哦

  • 网友 马***偲: ( 2025-01-08 04:39:36 )

    好 很好 非常好 无比的好 史上最好的

  • 网友 谢***灵: ( 2025-01-03 01:06:22 )

    推荐,啥格式都有

  • 网友 孙***美: ( 2025-01-09 07:17:52 )

    加油!支持一下!不错,好用。大家可以去试一下哦


随机推荐