Domov audio Ako môžu inžinieri vyhodnotiť školiace súpravy a testovacie sady, aby zistili možné nadmerné vybavenie v strojovom učení?

Ako môžu inžinieri vyhodnotiť školiace súpravy a testovacie sady, aby zistili možné nadmerné vybavenie v strojovom učení?

Anonim

Q:

Ako môžu inžinieri vyhodnotiť školiace súpravy a testovacie sady, aby zistili možné nadmerné vybavenie v strojovom učení?

A:

Aby sme pochopili, ako sa to robí, je potrebné mať základné znalosti o rolách rôznych súborov údajov v typickom projekte strojového učenia. Tréningová súprava je nastavená tak, aby poskytla technológii referenčný rámec - základ údajov, ktorý program používa na prijímanie prediktívnych a pravdepodobnostných rozhodnutí. Testovacia súprava je miestom, kde testujete zariadenie na dátach.

Overfitting je syndróm v strojovom učení, kde model nezodpovedá údajom alebo účelu úplne.

Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží

Jedným z hlavných prikázaní strojového učenia je, že školiace a testovacie údaje by mali byť samostatnými dátovými súbormi. O tom existuje pomerne široký konsenzus, prinajmenšom v mnohých aplikáciách, kvôli niektorým špecifickým problémom s použitím rovnakej súpravy, ktorú ste použili na výcvik na testovanie programu strojového vzdelávania.

Keď program strojového učenia využíva školiacu súpravu, ktorá by sa mohla nazývať v podstate množinou vstupov, pracuje na tom, aby sa rozhodovalo o prediktívnych výsledkoch. Jedným veľmi základným spôsobom, ako o tom premýšľať, je to, že školiaca súprava je „potravou“ pre proces intelektuálnych výpočtov.

Teraz, keď sa na testovanie použije rovnaká súprava, môže stroj často vracať vynikajúce výsledky. Je to preto, že už tieto údaje videli. Celkovým cieľom strojového učenia je však v mnohých prípadoch dosiahnuť výsledky o údajoch, ktoré sa predtým nevideli. Univerzálne strojové vzdelávacie programy sú vyrobené tak, aby fungovali na rôznych súboroch údajov. Inými slovami, princípom strojového učenia je objavovanie a zvyčajne ho nedostanete tak, že použijete počiatočnú tréningovú súpravu na testovacie účely.

Pri vyhodnocovaní výcvikových súprav a testovacích súprav pre možné nadmerné vybavenie môžu inžinieri posúdiť výsledky a zistiť, prečo by program mohol urobiť odlišne pri porovnávacích výsledkoch týchto dvoch súprav, alebo v niektorých prípadoch, ako by stroj mohol robiť príliš dobre na samotných údajoch o školení.,

V popise niektorých z týchto problémov strojového učenia v diele z roku 2014 popisuje Jason Brownlee z Strojového učenia majstrovstva nadmerné vybavenie týmto spôsobom:

„Model, ktorý je vybraný skôr kvôli svojej presnosti v súbore údajov o odbornej príprave, ako s ohľadom na jeho presnosť v súbore údajov o neviditeľnom teste, má veľmi pravdepodobne nižšiu presnosť v súbore údajov o neviditeľnom teste, “ píše Brownlee. „Dôvod je ten, že model nie je taký zovšeobecnený. Špecifikoval štruktúru štruktúry tréningového súboru (doplnené kurzívou). Nazýva sa to preplnenie a je to viac zákerné, ako si myslíte.“

Z pohľadu laikov by ste mohli povedať, že pri špecializácii na súbor údajov o školení je program príliš nepružný. To je ďalší metaforický spôsob, ako sa pozrieť na to, prečo nie je program strojového vzdelávania optimálne obsluhovaný pomocou tréningovej sady pre testovaciu súpravu. Je to tiež dobrý spôsob, ako pristupovať k hodnoteniu týchto dvoch rôznych súborov, pretože výsledky ukážu inžinierom veľa o tom, ako program funguje. Chcete menšie rozdiely medzi presnosťou pre oba modely. Chcete sa ubezpečiť, že systém nie je preplnený alebo „presne fúzovaný“ s konkrétnou množinou údajov, ale že je všeobecnejší a je schopný rásť a vyvíjať sa na základe príkazu.

Ako môžu inžinieri vyhodnotiť školiace súpravy a testovacie sady, aby zistili možné nadmerné vybavenie v strojovom učení?