获取python中tgz文件的目录结构

问题描述:

我有一个包含多个文本文件的.tgz文件。我可以使用gzip模块在Python中阅读它,并且我看到第一行包含有关后续文件的一些信息,但是我不清楚如何正确地遍历Python中的文件。我希望能够做一些事情,如:获取python中tgz文件的目录结构

for file in tgzFile: 
    read file 
    do stuff for file 

我可以读取gzip压缩文件的每一行,我可以尝试确定从该行的内容的文件的开头,但我宁愿更清洁的方法。谢谢。

import tarfile 
tar = tarfile.open("file.tgz") 
for file in tar.getmembers(): 
    print file.name 

Tar.getmembers()返回可以相应使用的TarInfo对象列表。 http://docs.python.org/2/library/tarfile.html#tarfile.TarInfo