覆盖大熊猫数据帧后HDF5文件增长大小

问题描述:

我试图覆盖hdf5文件中的熊猫数据帧。每次我这样做时,文件大小都会增长,而存储的帧内容相同。如果我使用mode ='w',那么我失去了所有其他记录。 这是一个错误还是我错过了什么?覆盖大熊猫数据帧后HDF5文件增长大小

import pandas 
df = pandas.read_csv('1.csv') 
for i in range(100): 
    store = pandas.HDFStore('tmp.h5') 
    store.put('TMP', df) 
    store.close() 

tmp.h5尺寸增大。

在此section

底部阅读大警告这是HDF5是如何工作的。

+0

非常感谢!每次关闭商店时,我都会运行h5repack工具,这可以解决问题。尺寸不会增长。 –