一、让迭代停下来的参数介绍
在之前描述 KMeans 的基本流程时我们提到过,当质心不再移动, KMeans 算法就会停下来。但在完全收敛之前,我们也可以使用 最大迭代次数max_iter,或者两次迭代间簇内误差平方和 Inertia 下降的量tol,这两个参数来让迭代提前停下来。
有时候,当我们的 n_clusters 选择不符合数据的自然分布,或者我们为了业务需求,必须要填入与数据的自然分布不合的 n_clusters,提前让迭代停下来反而能够提升模型的表现。
二、参数说明:
参数 |
说明 |
max_iter |
整数,默认300 单次运行K-Means允许的最大迭代次数 |
tol |
浮点数,默认1e-4 两次迭代间Inertia下降的量,如果两次迭代之间Inertia下降的值小于tol所设定的值,迭代就会停下 |