Obsah:
Definícia - Čo znamená K-najbližší sused (K-NN)?
Algoritmus k-najbližšieho suseda, často skrátený k-nn, je prístup k klasifikácii údajov, ktorý odhaduje pravdepodobnosť, že údajový bod bude členom jednej skupiny alebo druhej skupiny v závislosti od toho, v ktorej skupine sú údajové body najbližšie k nej.,
K-najbližší sused je príkladom algoritmu „lenivý učiaci sa“, čo znamená, že nevytvára model pomocou výcvikovej sady, kým sa nevykoná dotaz na množinu údajov.
Techopedia vysvetľuje K-Nearest Neighbor (K-NN)
K-najbližší sused je algoritmus klasifikácie údajov, ktorý sa pokúša zistiť, v ktorej skupine je dátový bod, keď sa pozrie na údajové body okolo neho.
Algoritmus, ktorý sa pozerá na jeden bod na mriežke a snaží sa zistiť, či je bod v skupine A alebo B, sa zameriava na stavy bodov, ktoré sú v jeho blízkosti. Rozsah je určený ľubovoľne, ale ide o odber vzorky údajov. Ak je väčšina bodov v skupine A, potom je pravdepodobné, že príslušným dátovým bodom bude A a nie B a naopak.
K-najbližší sused je príkladom algoritmu „lenivý učiaci sa“, pretože vopred nevytvára model súboru údajov. Výpočty, ktoré robí, sú iba vtedy, keď je požiadaný o prieskum susedov údajového bodu. Vďaka tomu je k-nn veľmi ľahko implementovateľný na dolovanie dát.