如何从维基百科页面获取表格数据?
问题描述:
是否有人知道如何使用Wikipedia API
从特定Wikipedia页面上的表中获取JSON
或XML
数据?如何从维基百科页面获取表格数据?
是否有其他方法可以做到这一点?
例如从这里https://en.wikipedia.org/wiki/List_of_action_films_of_the_2010s
答
可以curl
(或使用任何其他方法/工具)来检索和/或通过公共API维基百科的URL的解析。这里有两个例子,应该帮助你:
检索List_of_action_films_of_the_2010s的:
- 通过
query
行动 -
JSON parsed通过
parse
行动
接下来JSON unparsed,你需要解析和/或选择与分析相关的子元素。在这种情况下,我会假设:wikitable
元素。
有关参考资料和详细说明,您可以查看一般的API page of MediaWiki以及有关如何使用某些数据元素的API到parse Wikipedia页的参数列表。