Q:
Prečo je strojový zaujatosť problémom v strojovom učení?
A:Na túto otázku je možné odpovedať dvoma rôznymi spôsobmi. Po prvé, prečo je problém so zaujatosťou stroja, ako v tom, prečo existuje v procesoch strojového učenia?
Strojové učenie, hoci je sofistikované a zložité, je do určitej miery obmedzené na základe súborov údajov, ktoré používa. Konštrukcia súborov údajov zahŕňa vlastnú predpojatosť. Rovnako ako v médiách, kde opomenutia a zámerné rozhodnutia o inklúzii môžu ukázať konkrétny sklon, v strojovom vzdelávaní sa musia použité súbory údajov preskúmať, aby sa zistilo, aký druh skreslenia existuje.
Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží |
Napríklad bežným problémom pri testovaní technológií a procesoch navrhovania je ukázať preferencie jedného typu používateľa pred druhým. Jedným z veľkých príkladov sú rodové rozdiely vo svete technológií.
Prečo to robí rozdiel a prečo sa to týka strojového učenia?
Pretože nedostatok existujúcich žien v testovacom prostredí môže viesť k produkovanej technológii, ktorá je menej užívateľsky prívetivá pre ženské publikum. Niektorí odborníci to opisujú tak, že bez existujúceho ženského testovania nemusí konečný produkt rozpoznať vstup ženských používateľov - nemusí mať nástroje na rozpoznávanie ženských identít alebo na primerané riešenie vstupov žien.
To isté platí pre rôzne etniká, ľudí rôznych náboženstiev alebo akýkoľvek iný typ demografie. Bez správnych údajov nebudú algoritmy strojového učenia pre daný súbor používateľov fungovať správne, takže údaje o začlenení sa musia do technológie úmyselne pridať. Namiesto toho, aby sa berú len primárne súbory údajov a posilňuje sa prirodzené skreslenie, musia sa osoby zaoberajúce sa ľudskou činnosťou skutočne zaoberať touto otázkou.
Ďalším príkladom je strojový učiaci sa stroj, ktorý preberá informácie o zamestnaní a platoch a vypĺňa výsledky. Ak táto inherentná sada údajov nie je analyzovaná, stroj posilní zaujatosť. Ak vie, že muži zastávajú veľkú väčšinu výkonných funkcií a proces strojového učenia zahŕňa filtrovanie prostredníctvom súboru prvotných údajov a vrátenie zodpovedajúcich výsledkov, vráti výsledky, ktoré ukazujú mužskú zaujatosť.
Druhá časť otázky sa týka toho, prečo je táto zaujatosť tak škodlivá. Bez primeraného dohľadu a testovania môžu nové technológie poškodiť nášmu zmysel pre začlenenie a rovnosť, nie mu pomôcť. Ak sa rozvinie nový technologický produkt, ktorý rozpoznáva tváre s ľahšou pokožkou, ale nie s tmavšou pokožkou, môže to viesť k stupňovaniu etnického napätia a pocitu, že príslušná spoločnosť nie je citlivá na rozmanitosť. Ak algoritmus strojového učenia reprodukuje a zvyšuje skreslenie v množinách údajov, táto umelá inteligencia pridá svoj hlas k ľudským hlasom a ľudským tendenciám, ktoré už existujú v sociálnom systéme a uprednostňujú jednu skupinu ľudí pred druhou.
Najlepším spôsobom, ako sa s tým vyrovnať, je dôkladne sa pozrieť na základné súbory údajov, použiť výber funkcií, pridať variabilný vstup a manipulovať so samotnými súbormi surových údajov a zvýšiť skutočnú silu strojového učenia pomocou úmyselného vytvárania údajov ľuďmi, aby ste získali výsledok, ktorý poskytuje veľkú analytickú silu, ale aj niektoré z tých ľudských poznatkov, ktoré počítače ešte nemôžu replikovať.