如何从维基百科页面获取表格数据?

问题描述:

是否有人知道如何使用Wikipedia API从特定Wikipedia页面上的表中获取JSONXML数据?如何从维基百科页面获取表格数据?

是否有其他方法可以做到这一点?

例如从这里https://en.wikipedia.org/wiki/List_of_action_films_of_the_2010s

可以curl(或使用任何其他方法/工具)来检索和/或通过公共API维基百科的URL的解析。这里有两个例子,应该帮助你:

检索List_of_action_films_of_the_2010s的:

接下来JSON unparsed,你需要解析和/或选择与分析相关的子元素。在这种情况下,我会假设:wikitable元素。

有关参考资料和详细说明,您可以查看一般的API page of MediaWiki以及有关如何使用某些数据元素的API到parse Wikipedia页的参数列表。