Ubuntu16.04安装爬虫框架scrapy

前端之家收集整理的这篇文章主要介绍了Ubuntu16.04安装爬虫框架scrapy前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

scrapy框架需要在Python2.7,lxml,OpenSSL,pip程序或库的基础之上创建。

因此 ,首先,先检查下是否包含上述四个程序或库

kuku@worker1:~$python
Python2.7.12(default,Jul12016,15:12:24)
[GCC5.4.020160609]onlinux2
Type"help","copyright","credits"or"license"formoreinformation.
>>>

可以看到Ubuntu16.04已经预置了python 2.7

接着查看是否还有lxml

>>>importlxml
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<module>
ImportError:Nomodulenamedlxml
>>>
>>>importOpenSSL
>>>

发现没有lxml,有OpenSSL,于是先安装lxml

kuku@worker1:~$sudoapt-getinstallpython-lxml

重新进入

kuku@worker1:~$python
Python2.7.12(default,"credits"or"license"formoreinformation.
>>>importlxml
>>>

没有报错。为保证后续正确安装,需依次执行

kuku@worker1:~$sudoapt-getinstallpython-dev
kuku@worker1:~$sudoapt-getinstalllibevent-dev
kuku@worker1:~$sudoapt-getinstallpython-pip
kuku@worker1:~$sudopipinstall--upgradepip

后执行

kuku@worker1:~$pipinstallScrapy

即可完成Scrapy的安装,查看下scrapy相关命令

kuku@worker1:~$scrapy

wKioL1gsTLaSogffAABQ0GpWPkw832.png-wh_50

然后可以创建一个新的项目

kuku@worker1:~$scrapystartprojectnewproject
NewScrapyproject'newproject',usingtemplatedirectory'/usr/local/lib/python2.7/dist-packages/scrapy/templates/project',createdin:
/home/kuku/newproject

Youcanstartyourfirstspiderwith:
cdnewproject
scrapygenspiderexampleexample.com
kuku@worker1:~$
kuku@worker1:~$sudoaptinstalltree

使用tree看下newproject文件目录

kuku@worker1:~$treenewproject/

wKiom1gsTgDiMWeMAAAglwb_DtI575.png-wh_50

接下来可以根据自己需要对里面文件进行相应的编辑,以满足自己需求。

原文链接:https://www.f2er.com/ubuntu/356014.html

猜你在找的Ubuntu相关文章