从RSS源获取全文文章

问题描述:

您好,我正在使用GDataXML来解析RSS源。从RSS源获取全文文章

但是,大多数今天的Feed没有显示全文。所以大多数时候我只是整个事情的一小部分而已。 我在很多iPhone和iPad阅读器中看到了这一功能 - 它有点从网络上获取文章并将其放入全文。

那么我该怎么做呢?

我的想法是这样的 - 根元素从文章的开头开始。 所以如果根元素[文章] 我需要去网站,获取启动div之间的html代码,然后显示在我的应用程序。

那么,如何获得这些divs之间的代码?正则表达式还是什么?我想要示例感谢。

最后,如何在以html格式获取完整文章后显示图像?

谢谢你们的问候。

+0

任何人都可以帮我吗? – DevFly 2012-08-13 17:26:24

+0

你有没有想过这件事,或只是放弃和走另一条路? – 2013-03-04 20:00:17

+0

使用可读性api – DevFly 2013-09-25 12:39:47

使用MWFeedParser你会得到RSS订阅在

标识,标题,链接,日期,更新,汇总,内容,机箱

+0

不。我没有做我所需要的,它肯定没有得到全文。也没有外壳。 – DevFly 2012-08-13 12:21:42

+0

给我你的RSS饲料链接,我会告诉你是否工作或没有。 – freelancer 2012-08-13 12:23:50

我用MWFeedParser为好,因为它会得到所有元素的Feed条目,但是您确实无法对Feed条目中的所有链接进行“深入分析”。

如果您想从链接中获取完整内容以及附件中的完整内容(例如来自播客的音频或视频),那么您基本上正在讨论保存网页以供脱机查看。对于完整的html页面,您必须保存该HTML,并抓取整个页面并保存图像,然后更改这些图像的路径,以便能够离线加载它。 RSS应用程序的作用并不是将HTML内容保存为脱机使用,而是获取RSS提要的元素。一旦你有所有的链接,你想要保存离线使用,你需要提供的代码,将采取一个URL并保存离线。

我搜索了ios save html offline,发现这个帖子看起来很积极,使用ASIHttpRequest来保存离线页面:https://stackoverflow.com/a/6698854/1072068。我建议你尝试使用类似的东西,一旦你从MWFeedParser获得rss feed条目的部分。