第五讲,DataLoader和DataSet以及

注:此部分的实现会在后续更新人民币识别和猫狗识别的实战中进行演示,请读者跟帖自行学习。

一,数据读取流程

第五讲,DataLoader和DataSet以及

第五讲,DataLoader和DataSet以及

二,DataLoader:构建可迭代的数据装载器

  • torch.utils.data.Dataloader

    • dataset:Dataset类,决定数据从哪里读取以及如何读取
    • batchsize:批大小
    • num_works:是否多进程读取数据
    • shuffle:每个epoch是否打乱顺序
    • drop_last:当样本数不能不batchsize整除时,是否舍弃掉最后一批数据
      第五讲,DataLoader和DataSet以及

三,Dataset:Dataset抽象类,所有自定义的Dataset都需要继承他,并且需要将其复写__getitem__()

  • torch.utils.data.Dataset

    • getitem:接收一个索引,反回一个样本。