
会员
Hadoop大数据技术开发实战
更新时间:2020-05-22 17:21:01
最新章节:16.13 案例分析:Spark SQL读写MySQL开会员,本书免费读 >
本书以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解了VMware中CentOS7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。通过阅读本书,读者即使没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书可作为Hadoop新手入门的指导书,也可作为大数据开发人员的随身手册以及大数据从业者的参考用书。
品牌:清华大学
上架时间:2019-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
Hadoop大数据技术开发实战最新章节
查看全部- 16.13 案例分析:Spark SQL读写MySQL
- 16.12 案例分析:Spark SQL与Hive整合
- 16.11 案例分析:使用Spark SQL实现单词计数
- 16.10 Spark SQL
- 16.9 案例分析:使用Spark RDD实现单词计数
- 16.8 Spark RDD
- 16.7 Spark Shell的使用
- 16.6 Spark应用程序的提交
- 16.5 Spark HA搭建
- 16.4 Spark集群环境搭建
最新上架
- 会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇,第1篇是基础入门篇,主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础;第2篇是数据分析篇,主要介绍常用的数据分析方法;第3篇是数据挖掘篇,主要介绍常用的数据挖掘方法;第4篇是实战应用篇,介绍两个完整的数据分析与挖掘案例。计算机10.9万字 - 会员
Power BI商业数据分析完全自学教程
本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使计算机0字 - 会员
ETL数据整合与处理(Kettle)
本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL计算机8.1万字 - 会员
网络科学与网络大数据结构挖掘
《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员计算机0字 - 会员
大数据SQL优化:原理与实践
这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字 - 会员
MySQL数据库实用教程
本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,计算机12万字 - 会员
码上行动:利用Python与ChatGPT高效搞定Excel数据分析
本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。计算机8.5万字 - 会员
Python数据分析
本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Pyth计算机12.3万字 - 会员
MySQL数据库基础实例教程
本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不计算机7.8万字
同类书籍最近更新
- 会员
Hadoop构建数据仓库实践
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue数据库22.2万字 - 会员
Redis使用手册
本书系统化介绍Redis命令及其应用场景,内容深入,图文并茂,巨细靡遗,是掌握Redis的案头必备参考书。本书主要分为三大部分,共20章。第一部分“数据结构与应用”介绍Redis最核心的九种数据结构,列举了操作这些数据结构的众多命令及其详细信息,并在其中穿插介绍了多个使用Redis命令构建应用序的示例。通过这些程序示例,读者可以进一步加深对命令的认识,并学会如何在实际中应用这些命令,从数据库24.2万字 - 会员
Access数据库开发从入门到精通
本书系统详细地介绍了使用Access开发数据库系统的知识、技术与实际应用。全书包括13章,每一章都是一个独立的主题,以数据库系统的开发流程来组织各章内容和排列顺序,有助于梳理读者的Access知识体系和数据库开发流程。本书内容包括Access数据库术语、数据库对象及其视图、Access界面环境的使用与定制、数据库的整体设计流程、创建数据库和表、设计表结构、设置表的主键和索引、创建表之间的关系、在数数据库14万字 - 会员
PostgreSQL指南:内幕探索
PostgreSQL是一个开源的多用途关系数据库系统,在世界各地广泛使用。它是一个集成了子系统的庞大系统,每个系统都有一个特殊的复杂功能,并且可以相互协作。对内部机制的理解对于使用PostgreSQL进行管理和集成至关重要,本书从内核逻辑层面展现了PostgreSQL的全貌,并详细分析了PostgreSQL数据库的进程与内存体系结构,并发控制的原理及多种场景的流程、内存管理机制、预写日志的文件结构数据库9.1万字 - 会员
Redis 5设计与源码分析
优质的菜品需要有技艺精湛的厨师来烹饪,本书就像以优质菜品做成的“大菜”。整本书没有太多啰唆的语言,直接抽丝剥茧:从基本的数据结构类型,Redis内部每个操作命令的底层代码运行逻辑和结构,一直到整个Redis持久化技术、主从技术、分布式集群技术等,都有深入源码级别的讲解,让你领略从数据结构到整个高性能服务的全部设计之美。学以致用,读者朋友通过领会与实践来提升技术,成为一个高性能网络服务开发高手,继而数据库17.2万字