Q:
Prečo si niektoré projekty strojového učenia vyžadujú obrovské množstvo aktérov?
A:Keď uvažujete o strojovom učení, zvyčajne máte na mysli skúsených vedcov údajov pracujúcich na klávesniciach v počítačových učebniach. Mimoriadny dôraz sa kladie na kvantitatívnu analýzu a algoritmy. Pre mnohé z týchto programov nie je veľa bezprostredných súvislostí v reálnom svete - aspoň to si mnohí myslia.
Avšak niektoré z najmodernejších programov strojového učenia sa dnes využívajú skutočné armády ľudských činiteľov na ulici, v obchodoch a všade, kde môžu modelovať základné ľudské činnosti, ako je chôdza, práca alebo nakupovanie.
Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží |
Káblový článok Toma Simonita to veľmi dobre ilustruje s výstižným názvom „Ak chcete urobiť inteligentnejšiu inteligenciu, ľudia vykonávajú nízko platené úlohy v Oddball“.
Simonite pomocou príkladu krátkych videí zhotovených v obchode s potravinami Whole Foods vyzdvihuje druhy práce, ktoré pomôžu vybudovať časť ďalšej fázy strojového učenia.
To vedie k otázke, prečo sa všetci títo ľudia zaoberajú natáčaním krátkych a jednoduchých videí, ktoré dokumentujú také základné akcie, ako je pohyb paže alebo nohy.
Odpoveď vrhá trochu svetla na to, kde je strojové učenie a kam ide.
"Vedci a podnikatelia chcú, aby AI rozumeli a konali vo fyzickom svete, " píše Simonite a vysvetľuje, prečo on a ostatní sa vyrovnávajú s kamerami. „Preto je potrebné, aby pracovníci konali scény v supermarketoch a domácnostiach. Vytvárajú inštruktážny materiál na výučbu algoritmov o svete a ľuďoch v ňom. “
Ako mnohí odborníci zdôraznia, medzi najväčšie hranice strojového učenia patrí spracovanie obrazu a spracovanie prirodzeného jazyka. Sú to mimoriadne kvantitatívne postupy - inými slovami, neexistuje široké spektrum vstupov, aké existujú v „výkonných“ prostrediach v reálnom svete. Namiesto toho programy strojového učenia používajú vizuálne a zvukové údaje veľmi špecifickým spôsobom na vytváranie modelov. Pri spracovaní obrazu vyberá funkcie z (konečného) zorného poľa. Pre NLP ide o zostavenie fonémov.
Prekračovanie týchto konkrétnych vstupných kategórií zahŕňa niečo, čo by ste mohli nazvať „medzerou v obraze a reči“ - ak idete nad rámec vecí, ako je spracovanie obrazu a rozpoznávanie reči, presúvate sa do oblastí, v ktorých musia byť počítače analyzované rôznymi spôsobmi. Školiace súpravy sa budú zásadne líšiť.
Vstúpte do armády videografov. V niektorých z týchto nových projektov strojového učenia sú najmenšími myšlienkami ľudských aktivít vzdelávacie súbory. Počítače namiesto toho, aby boli trénované na vyhľadávanie funkcií a hrán a pixelov, ktoré sa skladajú z klasifikačných úloh, namiesto toho používajú školiace videá na hodnotenie toho, ako vyzerajú rôzne typy akcií.
Kľúčové je, čo môžu inžinieri s týmito údajmi urobiť, keď sú agregované a načítané a keď je na nich počítač vyškolený. Čoskoro uvidíte výsledky v rôznych oblastiach - napríklad, vďaka tomu bude dohľad mimoriadne efektívny. Počítače budú môcť „vidieť“ vo vizuálnej oblasti, čo ľudia robia, a aplikovať ich na oblasti ako marketing a predaj, prípadne v niektorých prípadoch práca vládnych agentúr alebo trestné súdnictvo.
Dôsledky tiež objasňujú diskusiu medzi otázkami maximálneho prínosu a súkromia. Väčšina z týchto videí vytvorí modely strojového učenia, ktoré pracujú pre dohľad - ale čo ľudia, ktorí nechcú dostávať prieskum? Ak sú tieto nové programy strojového vzdelávania rozmiestnené vo verejnom priestore, aké sú práva jednotlivca a kde je táto línia nakreslená?
V každom prípade spoločnosti využívajú tieto druhy ľudských a obrazových zdrojov na to, aby sa skutočne vykopali do niekoľkých kôl pokroku strojového učenia, ktoré skutočne umožnia počítačom rozpoznať, čo sa okolo nich deje, a nielen klasifikovať obrázky alebo pracovať s fonémami reči. Je to mimoriadne zaujímavý a kontroverzný vývoj v oblasti umelej inteligencie, ktorý si zaslúži svoj podiel pozornosti v technologických médiách aj mimo nich.