我需要帮助从Google搜索结果中提取网址,并被告知要使用Nokogiri.我安装了它并阅读了Nokogiri文档,但不知道从哪里开始 – 这对我来说都是希腊语.
我知道我要找的是每个结果的URL,每个结果都存在于< cite>之间.标签.到目前为止,我能够弄清楚如何做的是拉取搜索结果,但我只是不知道如何从文件中提取特定数据.这是我所拥有的极少量代码:
serp = Nokogiri::HTML(open("http://www.google.com/search?num=100&q=stackoverflow"))
解决方法
请享用 :)
require 'open-uri' require 'nokogiri' page = open "http://www.google.com/search?num=100&q=stackoverflow" html = Nokogiri::HTML page html.search("cite").each do |cite| puts cite.inner_text end