使用Visdom监控PyTorch训练进程
最近用上了Facebook开发的远程可视化神器Visdom,特此记录一下。
安装
pip install visdom -i https://pypi.douban.com/simple
使用scatter函数
import visdom
viz = visdom.Visdom()
win = viz.scatter(X=np.asarray([[0,0]]))
pass
for epoch in range(args.start_epoch, args.epochs):
# train for one epoch
loss_avg = train(train_loader, model, criterion, optimizer, epoch, args)
viz.scatter(X=np.array([[epoch,loss_avg]]),
name="train",
win=win,
update="append")
# evaluate on validation set
loss_avg = validate(val_loader, model, criterion, args)
viz.scatter(X=np.array([[epoch,loss_avg]]),
name='val',
win=win,
update='append')
pass
scatter
有几个参数:X
代表二维或三维中的点的坐标,格式是array或者tensor;Y
代表label ID,从1到k,图像会自动显示不同的颜色;update
如果是append就是添加点,如果是replace就是替换,是remove就删除;name
会指定trace的名字;win
可以指定显示图像的窗口。
演示一下
我在实验室服务器上跑PyTorch,需要ssh登陆到服务器上查看动态(虽然有了progressbar已经感觉自己很帅了):
但如果想看最近验证集的loss,跑程序前就要记得用tee记录日志,把日志cat出来再grep出loss信息…总之非常麻烦。
现在有了visdom,Chrome打开服务器ip,端口8097,直接看图就完事了!嘻嘻。
注:需要先在服务器上启动visdom server:
python -m visdom.server
可以放tmux后台一直开着,或者干脆直接用nohup &