Domov vývoj Ako môže koncept rovnováhy informovať o projektoch strojového učenia?

Ako môže koncept rovnováhy informovať o projektoch strojového učenia?

Anonim

Q:

Ako môže koncept rovnováhy informovať o projektoch strojového učenia?

A:

Rovnováha bude všeobecne informovať o strojovom učení tým, že sa bude snažiť stabilizovať prostredie strojového vzdelávania a vytvoriť výsledky s kompatibilnou kombináciou deterministických a pravdepodobnostných komponentov.

Experti opisujú „rovnováhu“ ako situáciu, keď racionálni aktéri v systéme strojového učenia dosahujú konsenzus v strategickej činnosti - najmä rovnováha Nash v teórii hier zahŕňa dva alebo viac z týchto racionálnych aktérov, ktoré konsolidujú stratégie tým, že uznávajú, že žiadny hráč nemá úžitok z zmena konkrétnej stratégie, ak ju ostatní hráči nezmenia.

Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží

Obzvlášť populárna a jednoduchá demonštrácia rovnováhy Nash zahŕňa jednoduchú maticu, v ktorej si dvaja hráči vyberú binárny výsledok.

Vyššie uvedené je celkom technický spôsob, ako opísať rovnováhu a ako to funguje. Mnohem neformálnejším spôsobom, ako ilustrovať koncept rovnováhy, najmä vyššie uvedený príklad dvoch racionálnych aktérov, z ktorých každý má binárny výber, je premýšľať o tom, čo by ste mohli nazvať scenárom „kráčania k sebe navzájom na chodbe na vysokej škole“.

Predpokladajme, že dvaja ľudia kráčajú rôznymi smermi dolu chodbou vysokej školy (alebo iným druhom oblasti), ktorá má iba šírku miesta pre dve osoby. Dve otvorené cesty sú binárnymi výsledkami. Ak si dvaja racionálni herci vyberú odlišné binárne výstupy, ktoré nie sú v konflikte, vzájomne prechádzajú a pozdravia sa. Ak si vyberú dva protichodné binárne výsledky - kráčajú v rovnakom priestore a jeden z nich sa bude musieť vzdať.

V uvedenom príklade, ak si dvaja racionálni aktéri vyberú dva zlučiteľné a nekonfliktné výsledky, všeobecne platí, že ani jeden nezíska zmenou svojej stratégie - v tomto prípade smerom chôdze - ak druhá osoba nezmení svoje.

Vyššie uvedené predstavuje rovnováhu, ktorú je možné modelovať v ktoromkoľvek danom konštrukte strojového učenia. Na základe tohto jednoduchého príkladu budú výsledkom vždy dvaja racionálni aktéri, ktorí spolupracujú, alebo inými slovami, dvaja ľudia, ktorí kráčajú okolo seba.

Opak by sa mohol nazývať „nerovnováha“ - ak si dvaja racionálni aktéri vyberú protichodné výsledky, ako už bolo uvedené, jeden z nich bude musieť priniesť. Programovanie modelu ML by sa však mohlo hodiť do nekonečnej slučky, ak by sa obaja rozhodli vzdať sa - podobne ako dvaja ľudia sa pohnú, aby sa navzájom prispôsobili a stále pokračovali v kolízii.

Rovnováhy ako vyššie uvedené sa všeobecne používajú v strojovom učení na vytvorenie konsenzu a stabilizáciu modelov. Inžinieri a vývojári budú hľadať tie scenáre a situácie, z ktorých profitujú rovnováhy, a budú sa snažiť zmeniť alebo zvládnuť tie, ktoré tak nie sú. Pri pohľade na príklady z reálneho sveta, ktoré zodpovedajú rovnovážnym bodom ML, je ľahké zistiť, ako je tento druh analýzy v systéme strojového učenia jedinečne poučný na to, ako zistiť, ako modelovať ľudské správanie vytváraním racionálnych aktérov a agentov. To je len jeden vynikajúci príklad toho, ako sa dá rovnováha použiť na dosiahnutie pokroku pri uplatňovaní systémov strojového učenia.

Ako môže koncept rovnováhy informovať o projektoch strojového učenia?