我已经使用3种语言进行Web Scraping –
Ruby,PHP和
Python,老实说,它们似乎都不适合完成任务.
Ruby有一个优秀的机械化和XML解析库,但电子表格支持非常差.
PHP具有出色的电子表格和HTML解析库,但它没有相当于WWW:Mechanize.
Python有一个非常差的Mechanize库.我遇到了很多问题,但仍无法解决问题.它的电子表格库也或多或少都不错,因为它无法创建XLSX文件.
有没有什么是完美的webscraping.
PS:我正在使用Windows平台.
检查Python Scrappy,它非常好:
原文链接:https://www.f2er.com/php/133888.html