
会员
Hadoop与大数据挖掘(第2版)
王哲 张良均等更新时间:2022-08-10 10:02:27
最新章节:11.7 小结开会员,本书免费读 >
这是一本讲解如何基于Hadoop技术栈进行大数据挖掘和分析的著作。它能带领你零基础快速掌握Hadoop技术栈,以及基于它的大数据挖掘与分析的流程和方法。全书核心内容分为两部分。1.Hadoop技术栈:详细讲解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大数据技术的基础、原理、应用,通过这部分内容读者能对Hadoop技术栈有从宏观到微观的了解。2.Hadoop大数据挖掘:通过3个综合案例,逐步展示了基于Hadoop的大数据挖掘的完整流程和方法。几位作者在大数据项目研发、教育、咨询等领域有10余年的丰富经验,对教育界和企业界供需两端的了解非常深入,全书的结构和内容围绕这两端的需求尽心设计,能让Hadoop大数据挖掘与分析的教育和学习事半功倍。本书第1版出版后,获得了教育界和企业界的良好反馈,其中数十家高等院校采用本书作为教材或参考书。第2版在第1版的基础上,在技术适应性、案例实用性等方面做了大量更新,与时俱进,更有竞争力!为了便于学习和教学,本书配套数据文件、实现代码、课后习题、教学PPT。
品牌:机械工业出版社
上架时间:2022-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
Hadoop与大数据挖掘(第2版)最新章节
查看全部- 11.7 小结
- 11.6 模型加载应用
- 11.5 模型构建
- 11.4 消费者信用特征关联
- 11.3 数据预处理
- 11.2 数据探索
- 11.1 背景与目标
- 第11章 消费者人群画像——信用智能评分
- 10.7 小结
- 10.6 O2O平台营销手段和策略分析
王哲 张良均等
主页
同类热门书
最新上架
- 会员
Python数据分析
本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Pyth计算机12.3万字 - 会员
新媒体数据分析基础教程
本书共8章,第1章介绍新媒体数据分析的基础知识;第2章介绍各种新媒体数据分析指标;第3章介绍新媒体数据的采集;第4章介绍新媒体数据处理;第5章介绍新媒体数据分析的思维和方法;第6章介绍新媒体数据可视化;第7章介绍不同新媒体平台的数据分析方法和实战技能;第8章介绍新媒体数据分析报告的制作。计算机9.2万字 - 会员
算法设计与分析
为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法,本书按照算法策略进行划分,每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章,内容包括:算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用计算机9.4万字 - 会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇,第1篇是基础入门篇,主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础;第2篇是数据分析篇,主要介绍常用的数据分析方法;第3篇是数据挖掘篇,主要介绍常用的数据挖掘方法;第4篇是实战应用篇,介绍两个完整的数据分析与挖掘案例。计算机10.9万字 - 会员
云数据中心基础
本教材共介绍7个项目,项目1为云数据中心认知,主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计,主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型,主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云计算机12.1万字 - 会员
OLAP引擎底层原理与设计实践
本书分为6篇,共14章。从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识(第1章和第2章)介绍OLAP的基础知识和Presto相关的背景知识,并给出了后续贯穿全书的SQL代码;第二篇核心原理(第3章和第4章)非常详细地串讲了SQL执行流程,介绍了执行计划的生成和优化;第三篇经典SQL(第5计算机19.7万字 - 会员
ETL数据整合与处理(Kettle)
本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL计算机8.1万字 - 会员
大数据导论
本书围绕新工科背景下大数据人才培养需求编写,既涵盖了大数据的基础知识,又介绍了大数据分析的相关工具与案例。全书共9章,介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程;重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用,还介绍了大数据实验环境的详细搭建步骤,方便读者快速理解和体验大数据应用技术;最后介绍了大数据治理中法律政策、行业标准建设的计算机14.5万字 - 会员
MySQL数据库基础实例教程
本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不计算机7.8万字