一、机器学习定义
(1)一般定义
机器学习就是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。
(2)工程化的定义
一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现(也就是用以衡量的P)随着E的增加而增加,那么,就可以称其为学习。
二、案例
(1)案例说明
垃圾邮件过滤器是一个机器学习的程序,它通过垃圾邮件(比如用户手动标记的垃圾邮件)以及常规邮件(非垃圾邮件)的示例,来学习标记垃圾邮件。
训练集:系统用来学习的示例,每一个训练示例称为训练实例或者是训练样本。
(2)定义说明
A. 任务T:标记新邮件是否为垃圾邮件
B. 经验E:训练数据获得经验
C. 指标P:衡量性能表现(需要我们来定义,例如:我们可以使用被正确分类的邮件的比率来衡量,这个特殊的性能衡量标准称为精度,经常用于衡量分类任务。