机器学习中常见的数据形式
下面我们来了解一下机器学习中最常见的数据形式,数据集的组成通常是二维表结构,如下图:
其中,表中的每一行代表一条数据,我们通常称为一个样本sample,所有的样本构成一个样本集(samples);而数据集中的每一个用于预测的列,我们称为特征feature,也可以称为属性。最后是机器学习中用于预测的目标列,通常称为标签lable或target。
这里要注意的是,有的数据集中是没有目标列存在的。