3. Part I – K‑Means 聚类分析
K‑Means 基于最小化簇内平方差高效划分球状结构样本,是聚类任务中的入门方法与性能基线。
|
40
|
|
1050 字
|
8 分钟
2. 数据准备:先洗澡、再聚
聚类结果高度依赖数据质量,需通过标准化、异常值剔除和降维操作确保距离度量的有效性和稳定性。
|
40
|
|
646 字
|
5 分钟
1. 动机:为什么“让数据自己分组”?
聚类分析在无标签大数据背景下提供了一种揭示样本潜在结构和系统异质性的基本方法
|
48
|
|
1441 字
|
6 分钟