处理数据不平衡

1.海康威视“类别重组”:

首先按照类别顺序对原始样本进行排序,之后计算每个类别的样本数量,并记录样本最多的那个类别的样本数量。之后根据这个最多样本数对没类样本产生一个随机排列列表,然后用此列表中的随机数对个自类别的样本数取余,得到对应的索引值。根据索引从该类的图像中提取图像,生成该类的图像随机列表。把索引类别的随机表连接在一起随机打乱顺序,即可得到最终图像列表。根据此列表训练模型,放训练列表遍历完毕,重复上述操作进行第二轮,如此反复。

处理数据不平衡