Q:
Ako môžu nové schopnosti strojového učenia umožniť získavanie skladových dokladov pre finančné údaje?
A:Jednou z vzrušujúcich nových hraníc strojového učenia a umelej inteligencie je to, že vedci a inžinieri sa púšťajú do rôznych spôsobov, ako využiť úplne nové typy zdrojov na predpovedanie pohybu zásob a výsledkov investícií. Vo finančnom svete je to obrovský menič hier a veľmi dômyselne spôsobí revolúciu v investičných stratégiách.
Jednou zo základných myšlienok rozšírenia tohto typu výskumu zásob je výpočtová lingvistika, ktorá zahŕňa modelovanie prirodzeného jazyka. Odborníci skúmajú, ako používať textové dokumenty, od podania SEC po akcionárske listy až po ďalšie periférne textové zdroje s cieľom rozšíriť alebo doladiť analýzu zásob alebo vypracovať úplne nové analýzy.
Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží |
Dôležitým vyhlásením je, že toto všetko je možné len prostredníctvom úplne nových pokrokov v neurónových sieťach, strojovom učení a analýze prirodzeného jazyka. Pred príchodom ML / AI využívali počítačové technológie na čítanie vstupov väčšinou lineárne programovanie. Textové dokumenty boli príliš neštruktúrované na to, aby boli užitočné. S pokrokom dosiahnutým v analýze prirodzeného jazyka v posledných rokoch však vedci zistili, že je možné „ťažiť“ prírodný jazyk pre kvantifikovateľné výsledky alebo, inými slovami, výsledky, ktoré sa dajú nejakým spôsobom vypočítať.
Niektoré z najlepších dôkazov a najužitočnejších príkladov sú rôzne dizertačné práce a dizertačné práce dostupné na webe. V dokumente „Aplikácie strojového učenia a výpočtovej lingvistiky vo finančnej ekonomike“ uverejnenom v apríli 2016 Lili Gao dokáže vysvetliť relevantné procesy špecifické pri ťažbe firemných podaní SEC, výziev akcionárov a správ v sociálnych médiách.
„Získavanie zmysluplných signálov z neštruktúrovaných a vysokorozmerných textových údajov nie je ľahká úloha, “ píše Gao. „S vývojom strojového učenia a výpočtových lingvistických techník je však možné vykonať úlohy spojené so spracovaním a štatistickou analýzou textových dokumentov a mnohé aplikácie štatistickej analýzy textu v spoločenských vedách sa ukázali ako úspešné.“ Z abstraktnej diskusie Gao o modelovaní a kalibrácii ukazuje celý vyvinutý dokument, ako niektoré z týchto typov analýz fungujú podrobne.
Medzi ďalšie zdroje aktívnych projektov patria stránky ako je tento krátky projekt GitHub a tento zdroj IEEE hovorí konkrétne o získavaní cenných finančných informácií z analýzy sentimentu Twitter.
Pointa je, že použitie týchto nových modelov NLP vedie k rýchlej inovácii vo využívaní najrôznejších textových dokumentov, nielen pri finančnej analýze, ale aj pri iných druhoch špičkových objavov, ktoré stierajú tradične ustanovenú hranicu medzi „jazykom“ a "dát."