Q:
Ako môžu spoločnosti používať náhodné lesné modely na predpovede?
A:Spoločnosti často používajú náhodné lesné modely na vytváranie predpovedí s procesmi strojového učenia. Náhodný les používa viac rozhodovacích stromov na komplexnejšiu analýzu daného súboru údajov.
Jeden rozhodovací strom funguje na základe oddelenia určitej premennej alebo premenných podľa binárneho procesu. Napríklad pri posudzovaní súborov údajov týkajúcich sa súboru automobilov alebo vozidiel by jediný rozhodovací strom mohol triediť a klasifikovať každé jednotlivé vozidlo podľa hmotnosti a rozdeľovať ich na ťažké alebo ľahké vozidlá.
Náhodný les vychádza z modelu stromu rozhodovania a robí ho sofistikovanejším. Odborníci hovoria o náhodných lesoch ako o „stochastickej diskriminácii“ alebo metóde „stochastického hádania“ na údajoch aplikovaných na viacrozmerné priestory. Stochastická diskriminácia je spôsob, ako vylepšiť analýzu dátových modelov nad rámec toho, čo môže urobiť jediný rozhodovací strom.
V podstate náhodný les vytvára veľa individuálnych rozhodovacích stromov pracujúcich na dôležitých premenných s použitým určitým súborom údajov. Jedným z kľúčových faktorov je to, že v náhodnom lese sa množina údajov a analýza premenných každého rozhodovacieho stromu zvyčajne prekrývajú. Je to dôležité pre model, pretože náhodný model lesa berie priemerné výsledky pre každý strom rozhodovania a premieňa ich do váženého rozhodnutia. Analýza v podstate preberá všetky hlasy rôznych rozhodovacích stromov a vytvára konsenzus, ktorý ponúka produktívne a logické výsledky.
Jeden príklad produktívneho použitia náhodného lesného algoritmu je k dispozícii na stránke R-blogger, kde spisovateľ Teja Kodali berie príklad určovania kvality vína pomocou faktorov, ako sú kyslosť, cukor, hladiny oxidu siričitého, hodnota pH a obsah alkoholu. Kodali vysvetľuje, ako náhodný doménový algoritmus používa malú náhodnú podmnožinu funkcií pre každý jednotlivý strom a potom využíva výsledné priemery.
Z tohto hľadiska podniky, ktoré chcú používať prognostické algoritmy náhodného modelovania lesov, najprv izolujú prediktívne údaje, ktoré je potrebné zredukovať, do súboru produkcií a potom ich použijú na model náhodných lesov s využitím určitej sady školení. dát. Algoritmy strojového učenia berú tieto školiace údaje a spolupracujú s nimi na vývoji za obmedzeniami svojho pôvodného programovania. V prípade náhodných lesných modelov sa táto technológia učí vytvárať sofistikovanejšie prediktívne výsledky, pričom pomocou týchto individuálnych rozhodovacích stromov vytvára svoj náhodný lesný konsenzus.
Jedným zo spôsobov, ako sa to dá uplatniť v podnikaní, je vziať rôzne premenné vlastností produktu a použiť náhodný les na označenie potenciálneho záujmu zákazníkov. Napríklad, ak existujú známe faktory záujmu zákazníkov, ako je farba, veľkosť, trvanlivosť, prenosnosť alebo čokoľvek iné, o čo zákazníci prejavili záujem, tieto atribúty sa môžu vložiť do súborov údajov a analyzovať na základe ich vlastného jedinečného dopadu na multifaktor. analýza.