我非常绝望,因为我无法弄清楚如何实现我在问题中所说的内容.我已经读过无数类似的例子,但没有找到一个在确切情况下工作的例子.所以,假设我有以下代码:
<table><tr> <td><a href="url-a">text A</a></td><td><a>id A</a></td><td><a>img A</a></td> <td><a href="url-b">text B</a></td><td><a>id B</a></td><td><a>img B</a></td> <td><a href="url-c">text C</a></td><td><a>id C</a></td><td><a>img C</a></td> </tr></table>
现在,我已经拥有的是url-a的一部分.我基本上想知道如何获得id和img A.我试图用XPath“找到”这条线但是我无法找到一种方法来使它工作.此外,信息可能根本不存在.这是我最近的一次尝试(严重的是,我现在已经尝试了很多不同的方式,已经超过3个小时了):
if (htmlDoc.DocumentNode.SelectSingleNode(@"/a[contains(@href,'part-url-a')]") != null) string ida = htmlDoc.DocumentNode.SelectSingleNode(@"/a[contains(@href,'part-url-a')]/following-sibling::a").InnerText;
嗯,这显然是错的,所以如果有人可以帮助我,我会很高兴.另外我很感激,如果有人可以通过这样的例子向我指出一些解释XPath和符号/语法的网站.书籍也欢迎.
PS:我知道我可以在没有XPath的情况下实现我的目标,使用Regex或只是简单的C#中的StreamReader,并检查每行是否包含我需要的内容但是a)它太脆弱了我的需求,因为代码可能有突然的换行符b)我真的想要坚持完全坚持使用XPath来完成我在这个项目中所做的任何事情.
在此先感谢您的帮助!
解决方法
使用以下XPath表达式:
/*/tr/td[a[@href='url-a']] /following-sibling::td[1] /a/text()
根据提供的(格式错误但已更正的)XML文档进行评估时:
<table><tr> <td><a href="url-a">text A</a></td><td><a>id A</a></td><td><a>img A</a></td> <td><a href="url-b">text B</a></td><td><a>id B</a></td><td><a>img B</a></td> <td><a href="url-c">text C</a></td><td><a>id C</a></td><td><a>img C</a></td> </tr></table>
选择了想要的文本节点:
id A
同样,这个XPath表达式:
/*/tr/td[a[@href='url-a']] /following-sibling::td[2] /a/text()
当针对相同的XML文档(上面)进行评估时,选择另一个想要的文本节点:
img A
基于XSLT的验证:
在XML文档上应用此转换时(上图):
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:output omit-xml-declaration="yes" indent="yes"/> <xsl:template match="/"> <xsl:copy-of select= "/*/tr/td[a[@href='url-a']] /following-sibling::td[1] /a/text()"/> <xsl:text> </xsl:text> <xsl:copy-of select= "/*/tr/td[a[@href='url-a']] /following-sibling::td[2] /a/text()"/> </xsl:template> </xsl:stylesheet>
产生了想要的结果:
id A img A