我是scrapy框架的新手,我看过一些使用LinkExtractors的教程和一些使用SgmlLinkExtractor的教程.我试图寻找两者的差异/利弊,但结果并不令人满意.
有人能告诉我两者之间的区别吗?我们什么时候应该使用上述提取器?
谢谢!
解决方法
您无法找到对SgmlLinkExtractor的引用的问题在于它现在已被弃用(相关
changeset).您可以在Scrapy 0.24文档中找到SgmlLinkExtractor定义
here.
并且,您不应再使用SgmlLinkExtractor – Scrapy现在只留下一个链接提取器 – LxmlLinkExtractor
– LinkExtractor别名指向的那个.