【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648精美图片
》【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648电子书籍版权问题 请点击这里查看《

【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648书籍详细信息

  • ISBN:9787115479648
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-04
  • 页数:暂无页数
  • 价格:52.44
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-20 18:09:15

寄语:

团购可联系在线客服询优惠价 可开发票 正版保证


内容简介:

暂无相关简介,正在全力查找中!


书籍目录:

前言ix

部分  分布式计算入门

章  数据产品时代2

1.1  什么是数据产品2

1.2  使用Hadoop构建大规模数据产品4

1.2.1  利用大型数据集4

1.2.2  数据产品中的Hadoop5

1.3  数据科学流水线和Hadoop生态系统6

1.4  小结8

第2章  大数据操作系统9

2.1  基本概念10

2.2  Hadoop架构11

2.2.1  Hadoop集群12

2.2.2  HDFS14

2.2.3  YARN15

2.3  使用分布式文件系统16

2.3.1  基本的文件系统操作16

2.3.2  HDFS文件权限18

2.3.3  其他HDFS接口19

2.4  使用分布式计算20

2.4.1  MapReduce:函数式编程模型20

2.4.2  MapReduce:集群上的实现22

2.4.3  不止一个MapReduce:作业链27

2.5  向YARN提交MapReduce作业28

2.6  小结30

第3章  Python框架和HadoopStreaming31

3.1  HadoopStreaming32

3.1.1  使用Streaming在CSV数据上运行计算34

3.1.2  执行Streaming作业38

3.2  Python的MapReduce框架39

3.2.1  短语计数42

3.2.2  其他框架45

3.3  MapReduce进阶46

3.3.1  biner46

3.3.2  partitioner47

3.3.3  作业链47

3.4  小结50

第4章  Spark内存计算52

4.1  Spark基础53

4.1.1  Spark栈54

4.1.2  RDD55

4.1.3  使用RDD编程56

4.2  基于PySpark的交互性Spark59

4.3  编写Spark应用程序61

4.4  小结67

第5章  分布式分析和模式69

5.1  键计算70

5.1.1  复合键71

5.1.2  键空间模式74

5.1.3  pair与stripe78

5.2  设计模式80

5.2.1  概要81

5.2.2  索引85

5.2.3  过滤90

5.3  迈向第后一英里分析95

5.3.1  模型拟合96

5.3.2  模型验证97

5.4  小结98

第二部分  大数据科学的工作流和工具

第6章  数据挖掘和数据仓102

6.1  Hive结构化数据查询103

6.1.1  Hive命令行接口(CLI)103

6.1.2  Hive查询语言104

6.1.3  Hive数据分析108

6.2  HBase113

6.2.1  NoSQL与列式数据库114

6.2.2  HBase实时分析116

6.3  小结122

第7章  数据采集123

7.1  使用Sqoop导入关系数据124

7.1.1  从MySQL导入HDFS124

7.1.2  从MySQL导入Hive126

7.1.3  从MySQL导入HBase128

7.2  使用Flume获取流式数据130

7.2.1  Flume数据流130

7.2.2  使用Flume获取产品印象数据133

7.3  小结136

第8章  使用API进行分析137

8.1  Pig137

8.1.1  PigLatin138

8.1.2  数据类型142

8.1.3  关系运算符142

8.1.4  用户定义函数143

8.1.5  Pig小结144

8.2  SparkAPI144

8.2.1  SparkSQL146

8.2.2  DataFrame148

8.3  小结153

第9章  机器学习154

9.1  使用Spark进行可扩展的机器学习154

9.1.1  协同过滤156

9.1.2  分类161

9.1.3  聚类163

9.2  小结166

0章  总结:分布式数据科学实战167

10.1  数据产品生命周期168

10.1.1  数据湖泊169

10.1.2  数据采集171

10.1.3  计算数据存储172

10.2  机器学习生命周期173

10.3  小结175

附录A  创建Hadoop伪分布式开发环境176

附录B  安装Hadoop生态系统产品184

术语表193

关于作者211

关于封面211


作者介绍:

暂无相关内容,正在全力查找中


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!



原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

暂无其它内容!


书籍真实打分

  • 故事情节:9分

  • 人物塑造:6分

  • 主题深度:5分

  • 文字风格:8分

  • 语言运用:3分

  • 文笔流畅:8分

  • 思想传递:7分

  • 知识深度:8分

  • 知识广度:7分

  • 实用性:4分

  • 章节划分:5分

  • 结构布局:9分

  • 新颖与独特:4分

  • 情感共鸣:9分

  • 引人入胜:3分

  • 现实相关:8分

  • 沉浸感:9分

  • 事实准确性:5分

  • 文化贡献:9分


网站评分

  • 书籍多样性:8分

  • 书籍信息完全性:4分

  • 网站更新速度:3分

  • 使用便利性:9分

  • 书籍清晰度:6分

  • 书籍格式兼容性:9分

  • 是否包含广告:8分

  • 加载速度:3分

  • 安全性:4分

  • 稳定性:9分

  • 搜索功能:5分

  • 下载便捷性:5分


下载点评

  • 五星好评(666+)
  • 傻瓜式服务(181+)
  • 好评多(346+)
  • 情节曲折(256+)
  • 速度快(551+)
  • 章节完整(668+)
  • 下载速度快(212+)
  • 三星好评(566+)

下载评价

  • 网友 戈***玉: ( 2025-01-09 23:21:08 )

    特别棒

  • 网友 丁***菱: ( 2025-01-18 20:43:42 )

    好好好好好好好好好好好好好好好好好好好好好好好好好

  • 网友 利***巧: ( 2025-01-14 23:18:43 )

    差评。这个是收费的

  • 网友 瞿***香: ( 2025-01-04 15:01:37 )

    非常好就是加载有点儿慢。

  • 网友 訾***雰: ( 2025-01-03 09:48:36 )

    下载速度很快,我选择的是epub格式

  • 网友 师***怡: ( 2025-01-12 23:07:10 )

    说的好不如用的好,真心很好。越来越完美

  • 网友 习***蓉: ( 2024-12-20 22:08:26 )

    品相完美

  • 网友 冉***兮: ( 2025-01-01 21:24:23 )

    如果满分一百分,我愿意给你99分,剩下一分怕你骄傲

  • 网友 相***儿: ( 2025-01-08 19:16:50 )

    你要的这里都能找到哦!!!

  • 网友 田***珊: ( 2025-01-07 07:49:21 )

    可以就是有些书搜不到

  • 网友 常***翠: ( 2024-12-28 20:56:38 )

    哈哈哈哈哈哈

  • 网友 宓***莉: ( 2025-01-06 15:44:19 )

    不仅速度快,而且内容无盗版痕迹。

  • 网友 权***波: ( 2025-01-02 01:25:25 )

    收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!

  • 网友 印***文: ( 2025-01-15 09:55:49 )

    我很喜欢这种风格样式。

  • 网友 冯***卉: ( 2025-01-15 20:55:20 )

    听说内置一千多万的书籍,不知道真假的


随机推荐