使用python请求获取HTML页面的内容取决于Content-Type？

问题描述：

使用Python请求库，是否有一种方法来获取HTTP响应头并只在Content-Type头是某种特定类型时通过网络获取正文？使用python请求获取HTML页面的内容取决于Content-Type？

我当然可以发出HEAD请求，检查内容类型，如果类型匹配，发出GET请求。但有没有办法避免两次获取HTTP标头？

答

我选择做requests.head()，检查内容类型，如果类型是应该提取的类型，请执行requests.get()以获取正文。

通过不获取其他内容类型的主体，超过了读取标头两次的额外网络I/O。