使用PHP,如何使用MediaWiki API获取维基百科文章的第一段?
如何使用PHP
通过其MediaWiki API获取维基百科任何文章的第一段?使用PHP,如何使用MediaWiki API获取维基百科文章的第一段?
我接受所有建议。最有可能的CURL
或XML
将派上用场。
我会用file_get_contents('http://wikipedia.com/'.$rest_of_url)
那么就使用字符串分析来选择一切形式
到
http://php.net/manual/en/function.substr.phphttp://wiki.dbpedia.org – jaguarhaus 2012-02-21 17:30:37
您可以使用API像这样:
http://en.wikipedia.org/w/api.php?action=parse&page=Stack_overflow&format=xml&prop=text§ion=0
这将返回的XML文件带结构:
<?xml version="1.0"?>
<api>
<parse title="Article Title">
<text xml:space="preserve">Text you wanted goes here</text>
</parse>
</api>
注意变量:page=Article_Title_Goes_Here
format=xml
prop=text
有没有一种方法可以跳过所有额外的内容,只是得到第一个页面的简介部分。我似乎在拍摄图像和右侧表格细节等 – 2014-07-01 19:30:36
是什么让你觉得这是平凡的可能?据我所知,API中没有任何关于第一段的内容...... – lonesomeday 2012-02-21 16:31:05
您拥有的问题不是维基百科的问题,而是与您找回的结果一起工作。您应该使用示例页面文本/数据创建一个新问题,询问如何解析第一段。 – Brad 2012-02-21 16:40:24