年份:2020年

作者:刘未昕 张粤磊 张魁 吴茂贵

出版社:电子工业出版社

语言:chinese

类型:EPUB

大小:10.49 MB

在第一版的基础上,根据近几年大数据领域最新出现的各种流行组件,逐个进行介绍,并以两个具体的示例,贯穿各个章节,对组件之间的协同工作关系进行剖析。新增大数据平台架构选型及最佳实践案例,大数据治理,流计算开发,flink等流式大数据处理。基于docker的大数据运维部署等部分,书中所使用的示例程序,是基于笔者在进行企业培训时,企业提出的业务需求而展开,示例程序更有代表性。
目录
第一部分 大数据概述
第1章 大数据的时代背景及应用落地
1.1 大数据与“云大物区智”的关联
1.2 大数据平台的应用优势
1.3 大数据平台的技术架构选型和产品对比
第2章 大数据系统的安装及配置
2.1 服务器及操作系统的准备
2.2 JDK、Python和Scala
2.3 Hadoop
2.4 Sqoop
2.5 Hive
2.6 ZooKeeper和HBase
2.7 Flume
2.8 Kafka
2.9 Spark
2.10 Flink
2.11 开源大数据系统各组件的组合
2.12 CDH
2.13 FusionInsight
2.14 小结
第二部分 离线大数据处理
第3章 使用Python爬虫获取数据…………………..
声明:
1.本站所有资源仅用于学习及研究使用,请必须在24小时内删除所下载资源,切勿用于商业用途,否则由此引发的法律纠纷及连带责任本站和发布者概不承担。除标明原创外均来自网络整理,版权归原作者或本站特约原创作者所有,如侵犯到您权益请联系本站删除!
2.建立本站的目的是为爱好读书的朋友提供一个丰富的电子书资源下载平台,让知识引领人类文明进步。
3.我们尽量挑选阅读价值较高的书籍,让大家通过读更少的书来获得更大的价值提升。
4.本站投入了大量的精力和财力来整理和维护的,资源收费也是为给大家提供更好的服务,同样的资源,我们不卖几百,几十,我们仅卖几元,一个永久会员能下载全站100%电子书。
5.如果电子书下载地址失效请 联系站长QQ进行补发,另:本站提供电子书代找服务,如有需要,可联系站长。
6.如资金允许,请购买正版!
7.请您认真阅读上述内容,购买即以为着您同意上述内容。