会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
同类热门书
最新上架
- 会员
TypeScript+Vue.js前端开发从入门到精通
《TypeScript+Vue.js前端开发从入门到精通》以一个一线前端架构师的视角,深入浅出地介绍TypeScript与Vue.js整合开发大型前端应用的全部技术细节。全书共17个章节,主要内容包括TypeScript基础、面向对象编程、Vue中的模板、组件属性和方法、用户交互处理、组件基础与进阶、Vue响应性编程、动画技术、脚手架VueCLI和Vite工具的使用、ElementPlusUI计算机13.1万字 - 会员
你好,C语言
本书是一本全面介绍C语言的技术性书籍,旨在帮助读者深入了解C语言的基础知识和高级特性,以及它在实际项目中的应用。全书共15章,首先通过清晰易懂的语言,深入浅出地解释了C语言的语法和编程原理,其次重点介绍了C语言的指针操作、内存管理、文件处理和模块化编程等关键概念。此外,本书还提供了主富的实例,帮助读者加深对C语言的理解,并通过实践锻炼读者解决实际问题的能力本书适合作为高等院校计算机科学及相关专业的计算机16.3万字 - 会员
Python数据可视化之Matplotlib与Pyecharts实战
《Python数据可视化之Matplotlib与Pyecharts实战》以某上市电商企业的客户数据、订单数据、股价数据为基础,循序渐进地介绍Python可视化技术,重点介绍Pandas数据预处理与Matplotlib和Pyecharts在数据可视化应用中的基本功能和使用技巧。全书共分4篇,第1篇(第1~4章)主要介绍Python基础与Pandas数据预处理技术,帮助准备可视化数据;第2篇(第5~7计算机7.4万字 - 会员
Django+Vue.js商城项目实战
《Django+Vue.js商城项目实战》基于Django4.x和Vue3.x版本,以一个完整商城网站的开发流程为主线,介绍分别使用纯后端架构和前后端分离架构实现项目的全部技术细节。纯后端开发架构主要讲解Django的知识要点及每个功能模块的要点和实现方式,内容包括Django网站开发基础、项目需求与设计、路由规划与设计、商城数据模型的搭建与使用、数据业务视图、数据渲染与展示、商品信息模块、用户计算机15.4万字 - 会员
演进式架构(原书第2版)
本书提供了关于适应度函数、自动化架构治理和演进式数据的技术、知识和技巧。本书分为三个部分:第一部分包括定义演进式架构机制的章节——介绍团队如何使用技术和工具来构建适应度函数、部署管道以及其他管理和演进软件项目的机制;第二部分包括围绕耦合、复用和其他相关结构考虑因素的架构风格和设计原则,以帮助读者实现清晰的长期演进;第三部分探讨了第一部分中介绍的工程实践与第二部分中的结构考虑因素的交叉点。计算机12.8万字 - 会员
OpenCV计算机视觉项目实战(Python版)
计算机视觉是在图像处理的基础上发展起来的新兴学科。OpenCV是一个开源的计算机视觉库,可以实现图像处理、模式识别、三维重建、物体跟踪等算法。本书基于Python,从图像基本原理说起,初步讲解计算机视觉所需的OpenCV知识。本书可作为信息处理、计算机、机器人、人工智能、遥感图像处理、认知神经科学等相关专业的教学用书,也可供相关领域的研究工作者参考。计算机10.4万字 - 会员
C++从入门到精通(第6版)
《C++从入门到精通(第6版)》从初学者角度出发,以通俗易懂的语言和丰富多彩的实例,详细讲解了C++程序开发需要掌握的知识。本书分为4篇共19章:第1篇是基础知识,包括绪论,数据类型,运算符与表达式,条件判断语句,循环语句,函数,数组、指针和引用,以及构造数据类型;第2篇是面向对象,包括面向对象编程,类和对象,以及继承与派生;第3篇是高级应用,包括模板、标准模板库、RTTI与异常处理、程序调试、文计算机14.7万字 - 会员
SQL语言从入门到精通
《SQL语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了在开发中使用SQL语言必须掌握的技术。全书分为3篇共18章,内容包括SQL语言基础、SQL查询基础、复杂查询、数据排序、SQL函数的使用、分组统计、子查询、多表查询、添加数据、修改和删除数据、视图、存储过程、触发器、游标、索引、事务、管理数据库与数据表、数据库安全。所有知识都结合具体实例进行介绍,涉及的程序代计算机12.4万字 - 会员
HBase从入门到实战
《HBase从入门到实战》系统介绍HBase基本原理与运行机制,融入了作者多年的开发经验与实践技巧。本书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java计算机5.2万字