我正在使用html敏捷包将我的html文档的内容读成字符串等.完成后,我想删除其内容中的certian元素,但是我遇到了问题.
我的Html看起来像这样:
<div id="wrapper"> <div class="maincolumn" > <div class="breadCrumbContainer"> <div class="breadCrumbs"> </div> </div> <div class="SEO_list"> <div class="SEO_head">Header</div> </div> Content goes here... </div>
现在,我使用了一个xpath选择器来获取其中的所有内容,并使用了InnerHtml属性,如下所示:
node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']"); if (node != null) { pageContent = node.InnerHtml; }
从这一点来说,我想删除带有“breadCrumbContainer”类的div,但是当使用下面的代码时,我收到错误:在集合中找不到“Node”“
node = doc.DocumentNode.SelectSingleNode("//div[@id='wrapper']"); node = node.RemoveChild(node.SelectSingleNode("//div[@class='breadCrumbContainer']")); if (node != null) { pageContent = node.InnerHtml; }
有人可以对此有所了解吗?我对Xpath很新,对HtmlAgility库来说真的很陌生.
谢谢,
戴夫
解决方法
这是因为RemoveChild只能删除一个直接的孩子,而不是一个大孩子.试试这个:
HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class='breadCrumbContainer']"); node.ParentNode.RemoveChild(node);