五、模型性能评估和优化:
训练完成后,我们需要对机器学习的算法模型进行性能评估,具体包括以下几个方面:
(1)训练时长:
指需要花多长时间来训练这个模型。对一些海量数据的训练可能需要1个月甚至更长的时间,这个时候算法的训练性能就变得很重要了。
(2)判断数据集是否足够多:
一般而言,对于复杂特征系统,训练数据集越大越好。然后,还需要判断模型的准确性,即对一个新的数据能否准确地进行预测。
(3)判断模型是否能满足应用场景的性能要求:
如果不能满足要求,就需要优化,然后继续对模型进行训练和评估,或者更换为其他模型。
六、模型应用:
训练出来的模型可以把参数保存起来,下次使用时直接加载即可。
一般来讲,模型训练需要的计算量很大,需要的时间也较长,这是因为一个好的模型参数,需要对大型数据集进行训练后才能得到。
而真正使用模型时,其计算量是比较少的,一般是直接把新样本作为输入,然后调用模型即可得出预测结果。
七、提问
机器学习应用开发的典型步骤有哪些?