我正在努力机械化.我希望“点击”一组链接,这些链接只能通过它们的位置(div#content中的所有链接)或它们的href来识别.
我已经尝试过上述两种识别方法但没有成功.
从文档中,我无法弄清楚如何根据它们在DOM中的位置返回链接集合(用于单击),而不是直接在链接上返回属性.
其次,documentation建议你可以使用:href来匹配部分href,
page = agent.get('http://foo.com/').links_with(:href => "/something")
但我唯一可以让它返回链接的方法是传递一个完全限定的URL,例如
page = agent.get('http://foo.com/').links_with(:href => "http://foo.com/something/a")
如果我想返回带有href的链接集合,这不是很有用
http://foo.com/something/a http://foo.com/something/b http://foo.com/something/c etc...
难道我做错了什么?我有不切实际的期望吗?
解决方法
第二部分
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>
您传递给的值:href默认情况下必须是完全匹配.因此,示例中的href仅匹配< a href =“/ something”>< / a>而不是< a href =“foo.com/something/a”>< / a>
你想要做的是传入一个正则表达式,以便它匹配href字段中的子字符串.像这样:
page = agent.get('http://foo.com/').links_with(:href => %r{/something/})
编辑:
第一部分
要使其仅在链接中选择链接,请在字符串中添加nokogiri样式的搜索方法.像这样:
page = agent.get('http://foo.com/').search("div#content").links_with(:href => %r{/something/}) # **
好吧,这不起作用,因为在你执行page = agent.get(‘http://foo.com/’).search(“div #content”)后,你会得到一个Nokogiri对象而不是机械对象,所以links_with不起作用.但是,您将能够使用css方法从Nokogiri对象中提取链接.我会建议像:
page = agent.get(‘http://foo.com/’).search(“div#content”).css(“a”)
如果这不起作用,我建议查看http://nokogiri.org/tutorials