Python网络爬虫技术与实战
上QQ阅读APP看书,第一时间看更新

3.1.2 安装使用第三方库

在实际开发中,编程人员可以根据自己的需求来使用适合的第三方扩展库,这里介绍三种常见的第三方库的安装方法。

1.利用pip安装

Python自带的pip是Python包管理工具(Python 2.7.9+或Python 3.4+以上版本都自带pip工具),该工具提供了对Python包的查找、下载、安装和卸载功能,常用的pip命令如表3-3所示。

表3-3 常用pip命令使用方法示例

在命令提示符环境中使用pip命令安装第三方Python库,在命令提示符中输入安装命令,这里安装的是后续爬虫开发所用到的request库,安装命令如下所示。


pip3 install request

安装完成后结果显示如下:


Successfully built request get post query-string public
Installing collected packages: public, query-string, get, post, request
Successfully installed get-2019.4.13 post-2019.4.13 public-2019.4.13 query-string-201
9.4.13 request-2019.4.13

2.wheel安装

有时使用pip安装会因网速等问题而报各种各样的错,那么这时我们可能需要使用wheel安装了,wheel是Python的一种离线安装包,其后缀为.whl,需要先将wheel文件下载至本地,然后直接用pip3命令加文件名安装即可。

不过在这之前,需要先安装wheel库,安装命令如下:


pip3 install wheel

然后到PyPI上下载对应的wheel文件,如最新版本2.22.0,可打开https://pypi.Python.org/pypi/requests/2.22.0#downloads,下载requests-2.22.0-py2.py3-none-any.whl到本地。随后在命令行界面进入wheel文件目录,利用pip安装即可:


pip3 install requests-2.22.0-py2.py3-none-any.whl

3.源码安装

如果我们不用pip等包管理器工具来安装,或者只想安装某一特定版本,则可以选择下载源码安装。这种方式需要先找到此库的源码地址,下载下来再用命令安装。一般需要在GitHub上下载所需库的源码,如图3-1中的request库所示。

图3-1 GitHub上的request库

下载解压后,在命令提示符环境中进入文件夹,然后执行setup.py,操作如下:


# 打开setup.py文件所在文件夹
cd requests-master
# 安装
Python setup.py install