Domov audio Čo je k-klastrovanie? - definícia z technológie

Čo je k-klastrovanie? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená K-znamená Klastrovanie?

K-znamená klastrovanie je jednoduchý bezohľadový algoritmus výučby, ktorý sa používa na riešenie problémov klastrovania. Nasleduje jednoduchý postup klasifikácie daného súboru údajov do niekoľkých zoskupení definovaných písmenom „k“, ktoré je vopred stanovené. Klastre sa potom umiestnia ako body a všetky pozorovania alebo dátové body sa priradia k najbližšiemu klastru, vypočítajú sa, upravia a potom sa proces začne znova používať s novými úpravami, až kým sa nedosiahne požadovaný výsledok.

K-znamená zoskupovanie má použitie vo vyhľadávačoch, segmentácii trhu, štatistikách a dokonca aj astronómii.

Techopedia vysvetľuje K-Means Clustering

K-znamená klastrovanie je metóda používaná na klastrovú analýzu, najmä pri ťažbe údajov a štatistike. Jeho cieľom je rozdeliť súbor pozorovaní do niekoľkých zhlukov (k), čo vedie k rozdeleniu údajov do Voronoiho buniek. Môže sa to považovať za metódu zisťovania, do ktorej skupiny určitý objekt skutočne patrí.

Používa sa hlavne v štatistike a dá sa použiť takmer v každom študijnom odbore. Napríklad v marketingu sa môže použiť na zoskupenie rôznych demografických údajov ľudí do jednoduchých skupín, ktoré uľahčujú marketingovým pracovníkom zacielenie. Astronómovia ju používajú na preosievanie obrovského množstva astronomických údajov; Keďže nedokážu analyzovať každý objekt jeden po druhom, potrebujú spôsob, ako štatisticky nájsť zaujímavé miesta na pozorovanie a vyšetrovanie.

Algoritmus:

  1. K-body sa umiestnia do údajového priestoru objektu, ktorý predstavuje počiatočnú skupinu centroidov.
  2. Každý objekt alebo dátový bod je priradený k najbližšiemu k.
  3. Po priradení všetkých objektov sa prepočítajú polohy centroidov k.
  4. Kroky 2 a 3 sa opakujú, až kým sa polohy centroidov už nepohybujú.
Čo je k-klastrovanie? - definícia z technológie