我正在编写一个带有网页的脚本,并检测使用像facebook这样的按钮的次数.由于这最好用DOM完成,我决定使用
PHP的DOMDocument.
不过,我遇到的一个问题是像facebook这样的按钮:
<fb:like send="true" width="450" show_faces="true"></fb:like>
由于此元素在技术上具有“fb”的命名空间,因此DOMDocument会发出警告,指出未定义此命名空间前缀.然后它继续去除前缀,所以当我到达所述元素时,它的标签不再是fb:like,而是像.
有没有办法“预注册”命名空间?有什么建议?
我遇到了同样的问题,我提出了以下解决方案/解决方法:
原文链接:https://www.f2er.com/php/133930.html没有干净的方法使用DOMDocument解析HTML与命名空间而不会丢失命名空间,但有一些解决方法:
>使用另一个接受HMTL代码中的命名空间的解析器.在这里查看HTML解析器的详细列表.这可能是最有效的方法.
>如果你想坚持使用DOMDocument,你基本上必须对代码进行预处理和后处理.
>在将代码发送到DOMDocument-> loadHTML之前,请使用正则表达式,循环或任何您想要查找所有命名空间标记的内容,并将自定义属性添加到包含命名空间的开始标记.
<fb:like send="true" width="450" show_faces="true"></fb:like>
然后会导致
<fb:like xmlNamespace="fb" send="true" width="450" show_faces="true"></fb:like>
>现在将编辑后的代码提供给DOMDocument-> loadHTML.它将删除命名空间,但它会保留导致的属性
<like xmlNamespace="fb" send="true" width="450" show_faces="true"></like>
>现在(再次使用正则表达式,循环或任何您想要的)查找具有属性xmlNamespace的所有标记,并将该属性替换为实际的名称空间.不要忘记将命名空间添加到结束标记!