二、无监督机器学习
(1)定义
无监督学习(Unsupervised learning)指对不带任何标签的数据特征进行建模,通常被看成是一种 “让数据自己介绍自己” 的过程,建模完成后便可根据模型对新样本做出结果预测。
(2)问题分类
无监督机器学习可以分为聚类(clustering)问题和降维(dimensionality reduction)问题。
A. 聚类问题
聚类问题就是将一组数据中相似的对象聚合在一起的过程,通过聚类分析我们可以挖掘出样本中哪些对象有共同的特性。
B. 降维问题
降维的基本思想是将数据转换到更低维度的空间,在压缩数据的同时,让信息损失最小化。
(3)提问
判断下面问题的具体类别。
(1)预测明天的气温是多少度?
(2)预测明天是阴、晴还是雨?
(3)人脸年龄预测?
(4)人脸识别?