一、训练集、验证集和测试集
为了进行模型的评估,一般将数据划分为3个集合:训练集、验证集和测试集。
(1)训练集是用于模型的学习或训练,可以形象比喻成学生的课本;学生根据课本里的内容来掌握知识。
(2)验证集主要用于调超参数,或者监控模型是否发生过拟合,可以比作作业,通过作业可以知道 不同学生学习情况、进步的速度快慢,需要注意的是验证集并不是必须的。
(3)测试集通常用于评估最终模型的预测性能,可以比作考试,考的题是平常都没有见过,考察学生举一反三的能力。
二、训练误差、验证误差和测试误差
学习了三种数据集,自然对应在三种数据集产生的误差。
(1)在训练模型过程中训练集上产生的误差,就是训练误差,代表模型在训练集上的错分样本比率。可以简单理解成课堂练习中的错误率。
(2)在验证集上进行多次调参,最终模型在验证集上的误差就是验证误差。可以比作学生课下练习中做题的错误率。
(3)当模型训练完毕、调参完毕后,在新的测试集上的误差,就是测试误差,反映了模型对未知数据的预测能力。也就是代表在测试集上的错分样本比率。形象比作是考试中做错题的比率。
测试误差小的模型表示具有很好的预测能力。