python – 获取伦敦境内坐标的所有维基百科文章

一般来说,我希望获得所有维基百科文章链接(和标题)以及伦敦境内的坐标.我尝试使用谷歌,但不幸的是没有适当的搜索条件.任何提示

London map

最佳答案
这实际上只是一个对评论来说太大的想法集合.

你最好的选择可能是DBpedia.它是维基百科的语义镜像,具有比维基百科的API更复杂的查询可能性.正如您在this paper中所看到的,它可以处理相当复杂的空间查询,但您需要进入SPARQL.这是该论文的数字:

Example SPARQL query

也就是说,维基百科的API有一个相对较新的空间查询功能Showing nearby wiki information.我不认为你可以搜索多边形,但这是一个好的开始.

这是我之前写的关于使用mwclient从文章获取坐标的答案,但该用户的优势在于可以使用一系列文章进行删除.

Geonames.org或许可以帮助您将搜索范围缩小到地理定位文章.检查英语维基百科中的806,000个地理定位文章并不算太糟糕.

出于性能原因,为了避免给维基百科的服务器带来麻烦,您可以考虑使用Wikipedia或DBpedia的转储.

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...