pytorch 训练face出现的问题
在使用pytroch训练face 的时候:
复现:https://github.com/wujiyang/Face_Pytorch
参数设置好:在运行python train.py 的时候遇到问题:(189 和183 都有这个问题)
1. python 版本3.6
2. andaconda 版本3.5.2
3. pytoch 版本1.0
问题:
File "/home/geguojing/local/anaconda3/lib/python3.6/site-packages/requests/adapters.py", line 449, in send
timeout=timeout
File "/home/geguojing/local/anaconda3/lib/python3.6/site-packages/urllib3/connectionpool.py", line 639, in urlopen
_stacktrace=sys.exc_info()[2])
File "/home/geguojing/local/anaconda3/lib/python3.6/site-packages/urllib3/util/retry.py", line 388, in increment
raise MaxRetryError(_pool, url, error or ResponseError(cause))
urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host='localhost', port=8097): Max retries exceeded with url: /events (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f6e9e17c6d8>: Failed to establish a new connection: [Errno 111] Connection refused',))
解决方法:
从这个上面我们可以看到大概是在visdom 这个里面出错的,这个是可视化的时候用到的。
因为可视化的时候要用到tensorbord 所以会连到一个网站上去。
但是之前可视化的时候就发现服务器是连不上的去,本机可以。
所以在train.py 里面去掉与可视化相关的语句就可以了。
--perfect
2. 现在目测第二个可能的问题是:运行几个epoch,但是tran acc 为0.
这个要等着多跑几轮才能下这个结论。
但是有个可能的问题是我的txt 给的label不是从0 开始的。
首先修正这个问题在189上跑一下。