使用python请求获取HTML页面的内容取决于Content-Type?

问题描述:

使用Python请求库,是否有一种方法来获取HTTP响应头并只在Content-Type头是某种特定类型时通过网络获取正文?使用python请求获取HTML页面的内容取决于Content-Type?

我当然可以发出HEAD请求,检查内容类型,如果类型匹配,发出GET请求。但有没有办法避免两次获取HTTP标头?

我选择做requests.head(),检查内容类型,如果类型是应该提取的类型,请执行requests.get()以获取正文。

通过不获取其他内容类型的主体,超过了读取标头两次的额外网络I/O。