Q:
Prečo je vizualizácia údajov užitočná pre algoritmy strojového učenia?
A:Disciplína vizualizácie údajov nám poskytuje prakticky nekonečné spôsoby, ako predviesť, čo sa deje s algoritmami strojového učenia. Za zmienku stojí práve to, prečo je vizualizácia údajov taká dôležitá a prečo uvoľňuje toľko tvorivej sily pre toľko ľudí, ktorí sa zapájajú do procesov strojového učenia.
Aby ste pochopili hodnotu vizualizácie dát pre strojové učenie, stačí sa pozrieť na niektorý z algoritmov, ktoré sa používajú na vytvorenie týchto priekopníckych a inovatívnych programov.
Jedným z najjednoduchších je strom rozhodovania. Bez toho, aby sme sa dostali do aktivačných funkcií alebo skrytých vrstiev alebo podobne, strom rozhodovania je jednoducho množina binárnych uzlov. Ale aj ten jednoduchý strom rozhodovania je pre ľudí veľmi ťažké opísať alebo o ňom písať. Je to omnoho jednoduchšie, keď sa vizualizuje na obrazovke alebo na stránke. Keď vidíte každý uzol a jeho spojenie s ostatnými uzlami, celá vec bude zrejmá.
Teraz si vezmime jeden z najviac byzantských a prepracovaných typov algoritmov strojového učenia - neurónovú sieť.
V niektorých ohľadoch sú neurónové siete skutočne zbierkou algoritmov strojového učenia. Základné nastavenie pozostáva zo vstupnej vrstvy, skrytých vrstiev a výstupnej vrstvy. Aktivačné funkcie pomáhajú jednotlivým digitálnym neurónom spracovať vážené vstupy.
Všetky tieto položky a všetky tieto procesy sa dajú oveľa ľahšie vysvetliť vizualizáciou údajov, ako prostredníctvom verbálnych alebo písomných popisov. Dá sa povedať, že neurónová sieť má vážené vstupy, ktoré tečú do vstupnej vrstvy a že sa zhlukujú v nejakej skrytej vrstve a konsolidujú sa do daného výstupu, ale keď použijete vizuálnu postavu, aby ste ukázali, ako to funguje, ľudské oko a ľudské mozog k tomu pristupuje oveľa priamejším a užitočnejším spôsobom.
V istom zmysle môžete vidieť výkon vizualizácie dát aj bez toho, aby ste vzali do úvahy strojové učenie. V dňoch lineárneho programovania by kompilátory a počítačové jazykové štúdiá umožňovali programátorom zvoliť si krok za krokom testovací program, v ktorom by mohli skontrolovať hodnoty premenných v malých vizuálnych rámčekoch. Opäť to pomohlo ukázať, čo sa deje pri exekúcii, omnoho lepšie, než len čítanie prostredníctvom kódovej základne.
Strojové učenie je veľmi náročné programovanie - je to pravdepodobnostné programovanie, a preto nám vizualizácia údajov skutočne pomáha oboznámiť sa s tým, čo sa deje s daným algoritmom alebo procesom.