coursera deep learning course3 week1
- 正交化(orthogonlization)
每个算法、技巧只解决一个问题,而不要对很多方面都产生影响。
早停(early stopping)既影响对训练集的训练,又对验证集有提高。 - 单一数字评估指标(single number evaluation metric)
以一个指标作为最终优化的指标。 满意指标与优化指标(satisficing and optimizing metric)
选择一个指标作为优化指标,其他指标只要达到一定阈值就算满意。以手机唤醒词为例,优化指标为准确率,而假阳性情况(即不是说唤醒词是手机被唤醒)只要低于一天一次的频率就是可以的。保持验证集与测试集分布的一致性
可以将验证集与指标比喻成靶子与靶心,而把分布不一致的测试集当作另一个靶子,通过训练训练集可以使模型对验证集的靶心越来越准,但测试集上的效果却不一定很好。数据集分割(splitting data)
小数据集时可以采用类似60/20/20的分割方式,但当数据很多时应将大部分都分如训练集。没有测试集也是可以的,但不推荐。评价指标可能需要改变,在给用户推送猫照片时,将准确率作为评估指标是不合适的,因为用户难以容忍出现黄图,因此此时需要改变评估指标。
bayes optimal error(理论最高准确率) and human level performance
natural data -图像、语音
对改进bias还是variance的选择- 错误问题记录
第 14 个问题
You’ve handily beaten your competitor, and your system is now deployed in Peacetopia and is protecting the citizens from birds! But over the last few months, a new species of bird has been slowly migrating into the area, so the performance of your system slowly degrades because your data is being tested on a new type of data.
使用已有的数据定义考虑新品种鸟的评估指标。