前端之家收集整理的这篇文章主要介绍了
php – 如何抓住解决的维基百科文章的Infobox?,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
@H_
403_0@
我仍然坚持要
解决维基百科的
文章.其实我想解析维基百科的
文章的info
Box部分,即我的应用程序已经引用了国家和每个国家/地区
页面,我希望能够
显示该国家相应的维基百科
文章上的信息框.我在这里使用
PHP – 如果有人有任何
代码片段或建议,我应该在这里做什么,我会非常感激.
再次感谢.
编辑
那么我有一个db表,其中有国家的名字.而且我有一个脚本,需要一个国家,并显示其细节.我想抓住信息框 – 蓝色的框与所有的国家详细信息图像等,因为它是从维基百科,并显示在我的页面上.我想知道一个非常简单和容易的方式来做 – 或者有一个脚本,只需将信息框的信息下载到本地远程系统,我可以稍后访问自己.我的意思是我对这里的想法是开放的 – 除了我想要的最终结果是看到我的页面上的信息框 – 当然有一点内容维基百科链接在底部:)
编辑
我想我在http://infochimps.org找到了我正在寻找的东西 – 他们收集了大量的数据集,我认为是YAML语言.我可以直接使用这些信息,但我需要一种方式来不断更新维基百科的信息,然后尽管我相信信息框很少会特别改变o国家,除非一些国家决定改变首都.
我建议对维基百科执行WebRequest.从那里您将拥有该
页面,您可以使用正则表达式,字符抓取或您熟悉的其他表单简单地解析或
查询所需的数据.本质上屏幕刮!
编辑 – 我会补充这个答案,你可以使用HtmlAgilityPack为那些在C#土地.对于PHP,它看起来像SimpleHtmlDom.说了看来,维基百科有一个足够的API.这个问题可能最适合你的需要:
Is there a Wikipedia API?