机器学习和不同大小的图像
问题描述:
可以说我有一个机器学习系统,已经学会识别图像是否包含对象(例如汽车)。机器学习和不同大小的图像
我的问题是以下几点,当系统接收到不同大小的图像时该怎么办?例如训练集可以由1000x700像素的图像组成,但是真实世界不是那么统一,并且可以预期图像为700x1000,700x400 ...
第一个冲动是将图像调整为具有与训练集大小相同,但感觉肮脏,并不真正有用。
我在这里错过了一些明显的东西吗?另外,即使对于训练集,我也认为假设每个图像的大小都是固定的(再次假设为1000x700像素)并不合理。另外,如果使用滑动窗口技术,可能会出现同样的问题,因为确定正确的窗口大小并不容易。
我想这应该是一个相对普遍的问题,所以必须有一套共同的解决方案,它的任何想法?
答
是的。共同的解决方案是
- 调整大小和裁剪 - 缩小或放大图像,直到两个维度至少是所需的。然后将照片裁剪为通用尺寸。
- 作物 - 提取普通大小的作物,如果需要填充。
现在...裁剪通常是通过一系列裁剪照片完成的:所有四个角落和中心。在上面的(1)中,将只有三个图像,而不是5.
滑动窗口的大小如何? –
四角法是滑动窗口的退化版本。你仍然保持窗户到所需的大小。当原件比所需尺寸大得多(至少2倍)时,滑动窗口很好,并且在所有区域都具有有用的功能。 – Prune