Obsah:
Definícia - Čo znamená charakterizácia?
Charakterizácia je metodológia veľkých údajov, ktorá sa používa na generovanie opisných parametrov, ktoré účinne opisujú vlastnosti a správanie konkrétnej údajovej položky. To sa potom používa v nepodporovaných algoritmoch učenia s cieľom nájsť vzory, zoskupenia a trendy bez začlenenia označení triedy, ktoré môžu mať predpojatosti. Má svoje využitie v klastrovej analýze a dokonca aj v hlbokom učení.
Techopedia vysvetľuje charakterizáciu
Charakterizácia veľkých dát je technika na transformáciu nespracovaných údajov na užitočné informácie, ktorá sa používa v algoritmoch strojového učenia a získavania údajov. Charakterizácia v podstate generuje zhustené znázornenia všetkého obsahu informácií, ktorý je skrytý v údajoch. Preto ho možno použiť ako prostriedok na meranie a sledovanie udalostí, zmien a nových vznikajúcich správ vo veľkých dynamických tokoch údajov.
Niektoré výhody charakterizácie:
- Môže generovať užitočné metriky na sledovanie a meranie udalostí a anomálií v súboroch údajov
- Vytvára malé reprezentácie základných informácií
- Rýchlo realizuje konverziu údajov na informácie, vďaka čomu sa odvetvie priblíži k úplnej transformácii údajov na informácie.
- Je užitočný na indexovanie a označovanie konkrétnych objektov, udalostí a ďalších funkcií v kolekcii údajov