Domov V správach Prečo je výber funkcií taký dôležitý pri strojovom učení?

Prečo je výber funkcií taký dôležitý pri strojovom učení?

Anonim

Q:

Prečo je výber funkcií taký dôležitý pri strojovom učení?

A:

Výber funkcií je v strojovom vzdelávaní mimoriadne dôležitý predovšetkým preto, lebo slúži ako základná technika na nasmerovanie použitia premenných na to, čo je pre daný systém strojového vzdelávania najúčinnejšie a najúčinnejšie.

Odborníci hovoria o tom, ako výber prvkov a ich extrahovanie fungujú, aby minimalizovali prekliatie rozmerov alebo pomohli vyrovnať sa s nadmerným prispôsobením - to sú rôzne spôsoby, ako osloviť myšlienku príliš zložitého modelovania.

Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží

Ďalším spôsobom, ako to povedať, je, že výber funkcií pomáha vývojárom poskytnúť nástroje na používanie iba najdôležitejších a najužitočnejších údajov v súboroch strojového vzdelávania, čo dramaticky znižuje náklady a objem údajov.

Jedným príkladom je myšlienka merania komplexného tvaru v mierke. Počas škálovania programu sa identifikuje väčší počet údajových bodov a systém sa stáva oveľa komplexnejším. Komplexný tvar však nie je typický súbor údajov, ktorý používa systém strojového učenia. Tieto systémy môžu používať súbory údajov, ktoré majú veľmi rozdielne úrovne rozptylu medzi rôznymi premennými. Napríklad pri klasifikácii druhov môžu inžinieri použiť výber funkcií na štúdium iba premenných, ktoré im poskytnú najlepšie zacielené výsledky. Ak má každé zviera v mape rovnaký počet očí alebo nôh, tieto údaje sa môžu odstrániť alebo sa môžu extrahovať ďalšie relevantné údaje.

Výber funkcií je diskriminačný proces, ktorým inžinieri nasmerujú systémy strojového učenia k cieľu. Okrem myšlienky odstránenia komplexnosti zo systémov vo veľkom meradle môže byť výber funkcií užitočný aj pri optimalizácii aspektov, ktoré odborníci nazývajú „kompromis rozptylu odchýlky“ v strojovom učení.

Dôvody, prečo výber funkcií pomáha pri analýze zaujatosti a variancie, sú zložitejšie. Štúdia z Cornell University o výbere prvkov, variantoch odchýlok a baggingu slúži na ilustráciu toho, ako výber prvkov pomáha projektom.

Podľa autorov článok „skúma mechanizmus, ktorým výber funkcií zvyšuje presnosť učenia pod dohľadom“.

Štúdia ďalej uvádza:

Empirická analýza skreslenia / rozptylu v priebehu postupu výberu prvkov naznačuje, že najpresnejšia súprava prvkov zodpovedá najlepšiemu kompromisnému bodu skreslenia odchýlok pre algoritmus učenia.

Pri diskusii o použití silnej alebo slabej relevantnosti autori hovoria o výbere funkcie ako o „metóde redukcie rozptylu“ - to dáva zmysel, keď si myslíte, že rozptyl je v podstate veľkosť variácie v danej premennej. Ak nedochádza k žiadnym odchýlkam, dátový bod alebo pole môžu byť v podstate zbytočné. Ak existuje extrémne vysoký rozptyl, môže sa presunúť na to, čo môžu inžinieri považovať za „hluk“ alebo irelevantné, svojvoľné výsledky, ktoré systém riadenia strojov dokáže ťažko zvládnuť.

Z tohto hľadiska je výber prvkov základnou súčasťou návrhu strojového učenia.

Prečo je výber funkcií taký dôležitý pri strojovom učení?