从python中的feedparser解析不同的日期格式?
问题描述:
我想通过feedparser从两个不同的RSS源中获取日期。从python中的feedparser解析不同的日期格式?
下面是我在做什么:
import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date
而这里就是他们如何走出来:
2008-10-21T22:23:28.033841+00:00
Wed, 15 Oct 2008 10:06:10 +0000
我想在那里我可以找出哪些是新的容易点。
我试过使用Python的日期时间模块,并通过feedparser文档搜索,但我无法过去这个问题。任何帮助将非常感激。
答
解析日期是一个非常棘手的RSS源,这就是其中feedparser
可以是一个很大的帮助。
如果您使用*_parsed
属性(如updated_parsed
),feedparser
将完成此工作,并将以UTC形式返回9元组Python日期。
查看http://packages.python.org/feedparser/date-parsing.html更多血淋淋的细节。