tqdm模块在处理文件阅读时,如何显示出进度条?

问题提出

最近,使用tqdm模块,对于大文件的阅读进行进度监控。然而我发现有个问题,即在tqdm模块使用一定没错的情况下,进度条死活打印不出来。情况如下:

tqdm模块在处理文件阅读时,如何显示出进度条?

如上图所示,这样read file是没有进度条显示的。

问题解决

先说为什么,再说怎么解决。

为什么没有进度条

tqdm模块的进度条显示,是依赖于已知可迭代模块的总迭代数的。如迭代一个list,该list有支持len()方法获取其长度,这样,进度条才能正确显示。

但read file的思路显然不是这样。因为read file的时候的迭代器,是每次阅读以一个\n为结尾的一行内容,当没有newline的时候,迭代器结束迭代。这样一来,read file的迭代器肯定无法自动提供len()方法,以获取其迭代器的iter数。

如何解决

当然就是先提前获取行数咯。这个东西没什么捷径,唯一好的方法,可能就是

num_file = sum([1 for i in open("your-file-path.txt", "r")])

然后将num_file传到tqdm中,赋值给total关键词即可。具体如图

tqdm模块在处理文件阅读时,如何显示出进度条?