关于树模型的缺陷

假如训练集,验证集,测试集如下。很明显数据有时间顺序,且y随着时间线性增长。

关于树模型的缺陷

假如我们使用gbdt模型,并且使用前6周的数据做训练,而测试数据是第7周的。

由于树模型的固有特性,第七周的数据 将会被 分到第六周数据所在的叶子节点。那么对第七周数据的预测值将约等于第六周的y。

这个预测结果将是不准确的!

而线性模型就不会有这个问题,线性模型能准确地把握住y随time上升的趋势。