type
Post
status
Published
date
Dec 7, 2022
slug
summary
1. 快速理解 2. 算法步骤 3. 实例讲解
tags
文字
机器学习
category
笔记
icon

K均值聚类算法

  1. 快速理解
  1. 算法步骤
  1. 实例讲解

  • K均值聚类算法 K-Means Clustering Algorithm
    • 快速理解:
      1.有四个牧师去郊区布道,一开始牧师们随意选了几个布道点,并且把这几个布道点的情况公告给了郊区所有的居民,于是每个居民到离自己家最近的布道点去听课。
      2.听课之后,大家觉得距离太远了,于是每个牧师统计了一下自己的课上所有的居民的地址,搬到了所有地址的中心地带,并且在海报上更新了自己的布道点的位置。
      3.牧师每一次移动不可能离所有人都更近,有的人发现A牧师移动以后自己还不如去B牧师处听课更近,于是每个居民又去了离自己最近的布道点……就这样,牧师每个礼拜更新自己的位置,居民根据自己的情况选择布道点,最终稳定了下来。
      图片理解:
      步骤
      • 先定义总共有多少个类/簇(cluster)
      • 将每个簇心(cluster centers)随机定在一个点上
      • 将每个数据点关联到最近簇中心所属的簇上
      • 对于每一个簇找到其所有关联点的中心点(取每一个点坐标的平均值)
      • 将上述点变为新的簇心
      • 不停重复,直到每个簇所拥有的点不变
      例子
      题目:有以下6个点,将A3和A4作为两个簇的初始簇心。问最后的簇的所属情况
      notion image
      1.计算每个点到簇心距离(根据距离公式),将距离近的点归为一类
      notion image
      2.将蓝色每个点,和紫色每个点的X,Y值分别求平均。获得新的簇心
      notion image
      3.计算每个点到簇心的新距离,将距离近的点归为一类
      notion image
      4.由于关联点没有变化,所以之后的计算结果不会改变。停止计算。
      1. 蓝色簇:A1,A3,A5。紫色簇:A2,A4,A6。
基于信息熵的决策树算法朴素贝叶斯分类法与贝叶斯定理

  • Twikoo
  • Giscus
  • Utterance