这几天学爬虫使用python解析网页找了不少方法,其中比较有用的是lxml。lxml是python使用xpath解析html时需要导入的一个类库,功能非常非常强大。
(安装python其他库和这差不多)
Ubuntu安装lxml
Ubuntu安装其实非常简单,就几条命令就行。
1.注意:它是一个组件、类库,其他语言也能用,并不是python独一的。这个库不能用pip安装,pip安装就只能python自己用了。
sudo apt-get install lxml
2.用python的pip进行安装(注意python的版本使用相对应的pip):
pip install lxml
Windows安装lxml
下载安装文件:
页面中有很多python扩展包的安装文件,找到lxml的下载路径,并选择适合自己的安装文件-https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml:
wheel本质上是一个 zip 包格式,它使用 .whl 扩展名,用于 python 模块的安装,它的出现是为了替代 Eggs。
首先cmd进入你所下载好的lxml文件位置,使用绝对路径安装lxml
安装:
使用这条命令进行安装:
python2 -m pip install –user lxml-4.1.1-cp27-cp27m-win32.whl
如下图所示,出现Successfully installed…表示你以安装成功。
测试:
引用lxml模块,没有报错证明安装成功!
在Windows下安装lxml果然没有在linux下来的方便。