为什么tensorflow的利用率低于GEFORCE 1080 ti(11GB)的20%?
问题描述:
我正在使用GEFORCE GTX 1080 ti(11GB)的tf-seq2seq包来训练NMT模型。在训练模型期间,执行nvidia-smi
表明,在所有CPU内核繁忙时,GPU易失性利用率始终小于25%。为什么?为什么tensorflow的利用率低于GEFORCE 1080 ti(11GB)的20%?
我怎么能找到,如果我利用我的GPU的全部潜力?
答
上述实验中的模型太小,无法充分利用GPU的所有潜力。
在上述实验中,扩大模型(利用更多图层,增加词汇量,增加序列长度......)会提高利用率(小于80-90%)。