获得“参见”一节中
问题描述:
维基百科页面
我希望得到一个维基百科的文章,在“又见”一节中的所有链接,但蟒蛇维基API(Wikipedia documentation)不提供这些信息。即使我使用“页面”功能获得一个网页的全部内容以“另见”部分中提取,这部分通常是空的! (如果你使用浏览器浏览该网页,它不会是空的!)。获得“参见”一节中
所以,我认为,对于获取这些信息的唯一方法是解析HTML页面。任何意见,帮助我提取这些信息,而不解析HTML页面,是值得赞赏的。
答
似乎是一个合理的问题给我。无论如何,你可能还是要解析HTML,但RESTBase API提供了“移动部分”端点组由部分的标题输出HTML。该API端点看起来是这样的:
https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook
的API响应包含的对象与 '部分' 财产这样
"remaining": {
"sections": [
{
"id": 39,
"text": ...,
"toclevel": 1,
"line": "See also",
"anchor": "See_also"
},
...
]
}
有了这种反应,你可以选择HTML从其line
属性字符串“又见”相匹配的部分。
这是荒谬的!没有收到任何评论,两个人只给了我负面的评价! – woody