Q:
Ako môže byť "náhodné chodenie" užitočné v algoritmoch strojového učenia?
A:Pri strojovom učení sa môže použiť postup „náhodnej chôdze“ rôznymi spôsobmi, aby sa technológii umožnilo preosiať sa prostredníctvom veľkých súborov údajov o odbornej príprave, ktoré poskytujú základ pre prípadné porozumenie stroja.
Matematicky je náhodná prechádzka opísaná niekoľkými rôznymi technickými spôsobmi. Niektorí ho popisujú ako náhodný súbor premenných; iní by to mohli nazvať „stochastický proces“. Bez ohľadu na to náhodná prehliadka uvažuje o scenári, v ktorom množina premenných prechádza cestou, ktorá je vzorom založeným na náhodných prírastkoch, podľa celočíselnej množiny: Napríklad prechádzka po číselnej linke, kde sa premenná pohybuje v každom kroku plus alebo mínus jedna,
Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží |
Ako taký môže byť na algoritmy strojového učenia aplikovaný náhodný chod. Jeden populárny príklad opísaný v diele v Wired sa vzťahuje na niektoré priekopnícke teórie o tom, ako môžu neurónové siete fungovať pri simulácii ľudských kognitívnych procesov. Charakterizujúca prístup náhodnou chôdzou v scenári strojového vzdelávania vlani v októbri, autorka Wired Natalie Wolchover pripisuje veľkú časť metodiky priekopníkom v oblasti vedy o údajoch Naftali Tishby a Ravid Shwartz-Ziv, ktorí navrhujú cestovnú mapu pre rôzne fázovania aktivít strojového učenia. Wolchover konkrétne opisuje „kompresnú fázu“, ktorá súvisí s filtrovaním irelevantných alebo polorelevantných znakov alebo aspektov v obrazovom poli podľa zamýšľaného účelu programu.
Všeobecnou myšlienkou je, že počas zložitého a viacstupňového procesu stroj pracuje na „zapamätaní“ alebo „zabudnutí“ rôznych prvkov obrazového poľa na optimalizáciu výsledkov: Vo fáze kompresie by sa program mohol opísať ako „nulovanie“ in "o dôležitých črtách s výnimkou periférnych.
Odborníci používajú na označenie tohto typu aktivity výraz „zostup stochastického gradientu“. Iným spôsobom, ako to vysvetliť s menšou technickou sémantikou, je to, že skutočné programovanie algoritmu sa mení stupňami alebo iteráciami, aby sa „jemne doladil“ tento vzdelávací proces, ktorý prebieha podľa „krokov náhodných krokov“, ktoré nakoniec povedú k nejakej forme syntéza.
Zvyšok mechaniky je veľmi podrobný, pretože inžinieri pracujú na tom, aby procesy strojového učenia prešli fázou kompresie a iným súvisiacim fázovaním. Všeobecnejšou myšlienkou je, že technológia strojového učenia sa v priebehu svojho hodnotenia veľkých tréningových sád dynamicky mení: Namiesto toho, aby sa na jednotlivé flash karty v jednotlivých prípadoch pozeralo, stroj viackrát prezerá rovnaké flash karty alebo ich priťahuje náhodne, pozerať sa na ne meniacim sa, iteračným, náhodným spôsobom.
Vyššie uvedený prístup náhodným chodením nie je jediný spôsob, ako sa dá náhodný chod aplikovať na strojové učenie. V každom prípade, keď je potrebný randomizovaný prístup, môže byť náhodná prechádzka súčasťou súpravy nástrojov matematika alebo vedca údajov, aby sa opäť zdokonalil proces učenia údajov a poskytli vynikajúce výsledky v rýchlo sa rozvíjajúcej oblasti.
Náhodná chôdza je vo všeobecnosti spojená s určitými hypotézami z matematiky a informatiky. Niektoré z najpopulárnejších vysvetlení náhodnej chôdze súvisia s akciovým trhom a jednotlivými burzovými grafmi. Ako sa popularizovalo v Burton Malkiellovej knihe „Random Walk Down Wall Street“, niektoré z týchto hypotéz tvrdia, že budúca aktivita akcie je v zásade nepoznateľná. Iní však naznačujú, že je možné analyzovať a predpovedať náhodné vzory chôdze a nie je náhoda, že moderné systémy strojového učenia sa často používajú pri analýze akciového trhu a dennom obchodovaní. Snaha o znalosť v oblasti techniky je a vždy sa spájala so snahou o znalosti o peniazoch a myšlienka použitia náhodných prechádzok pri strojovom učení nie je výnimkou. Na druhej strane, náhodná prechádzka ako jav môže byť použitá na akýkoľvek algoritmus na ľubovoľné účely, podľa niektorých matematických princípov uvedených vyššie. Inžinieri môžu použiť náhodný vzorec chôdze na testovanie technológie ML alebo na jej orientáciu na výber prvkov alebo na iné použitie súvisiace s gigantickými byzantskými hradmi vo vzduchu, ktoré sú modernými systémami ML.