Caffe快照:.solverstate vs .caffemodel
问题描述:
在训练网络时,每N次迭代拍摄的快照一起以两种形式出现。一个是.solverstate文件,我认为它正是它听起来的样子,存储丢失函数和渐变的状态等。另一个是.caffemodel文件,我知道它存储了训练过的参数。Caffe快照:.solverstate vs .caffemodel
如果你想要一个预先训练好的模型,.caffemodel是你需要的文件,所以我想如果你要测试你的网络,它也是你想要的文件。
WWhat是.solverstate的优点吗?在this tutorial看起来你可以重新开始训练,但是与使用.caffemodel有什么不同呢? .solverstate是否也包含与.caffemodel相同的信息?换句话说,.caffemodel只是.solverstate的一个子集?
答
solverstate文件,因为其名称传达,存储解算器的状态,而不是任何有关分类结果的信息。该模型被保存为caffemodel文件,您可以使用它来获取数据的分类结果。如果你想微调你的网络,你可以使用预先训练好的caffemodel文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果您目前的培训需要停止,由于停电或意外重启,您可以恢复您以前的solverstate快照的培训。使用solverstate和caffemodel文件的区别在于,前者允许您以预定方式完成训练,而后者可能需要更改某些训练参数,如最大迭代次数。