Obsah:
Definícia - Čo znamená testovacia sada?
Testovacia súprava v strojovom vzdelávaní je sekundárna (alebo terciárna) dátová sada, ktorá sa používa na testovanie programu strojového učenia potom, čo bol vyškolený v počiatočnom školiacom dátovom súbore. Ide o to, že prediktívne modely majú vždy nejaký druh neznámej kapacity, ktorú je potrebné otestovať, na rozdiel od analýzy z hľadiska programovania.
Testovacia súprava je známa aj ako testovacia dátová sada alebo testovacie dáta.
Techopedia vysvetľuje Test Set
Mnohí odborníci tvrdia, že najlepšou praxou je mať testovacie údaje, ktoré sú „sekvestrované“ alebo uchovávané až do konca procesu. Inžinieri hľadajú overfitting modelu a ďalšie problémy vo vzdelávacom procese. V ideálnom prípade existuje tretia sada, sada validačných údajov, ktorá testuje parametre klasifikátora. Potom a iba potom sa dá ukázať testovacia súprava, aby sa zistilo, ako dobre bol program trénovaný a či je jeho prediktívny model presný pre nové údaje. Aj keď niektoré modely nemusia tvoriť rozdelenú testovaciu sadu úplne, často sa to považuje za krátkozraké, pretože nedostatok praktických testov môže spôsobiť, že program bude náchylný na nepresnosť.