Domov audio Ako pomáha maximálna oblasť združovania urobiť z alexnetu vynikajúcu technológiu na spracovanie obrázkov?

Ako pomáha maximálna oblasť združovania urobiť z alexnetu vynikajúcu technológiu na spracovanie obrázkov?

Anonim

Q:

Ako pomáha maximálny pooling urobiť z AlexNet skvelú technológiu pre spracovanie obrázkov?

A:

V AlexNet, inovatívnej konvolučnej neurónovej sieti, sa koncept maximálneho združovania vkladá do komplexného modelu s viacerými konvolučnými vrstvami, čiastočne s cieľom pomôcť s prispôsobením a zefektívniť prácu, ktorú neurónová sieť robí pri práci s obrázkami s tým, čo odborníci nazývajú. „nelineárna stratégia prevzorkovania“.

AlexNet je všeobecne považovaný za veľmi skvelú CNN, keď zvíťazil v roku 2012 ILSVRC (ImageNet Large-Scale Visual Recognition Challenge), ktorý je vnímaný ako povodeň pre strojové učenie a postupovanie neurónovej siete (niektorí to nazývajú „olympiádou“ počítačového videnia). ).

V rámci siete, kde je školenie rozdelené do dvoch GPU, existuje päť konvolučných vrstiev, tri úplne spojené vrstvy a niektoré maximálne implementácie združovania.

Maximálne združovanie v podstate berie „súbor“ výstupov zo súboru neurónov a aplikuje ich na hodnoty nasledujúcej vrstvy. Ďalším spôsobom, ako to pochopiť, je, že prístup maximálneho spoločného využívania zdrojov môže konsolidovať a zjednodušiť hodnoty kvôli vhodnejšiemu prispôsobeniu modelu.

Maximálne združovanie môže pomôcť vypočítať prechody. Dalo by sa povedať, že „znižuje výpočtovú záťaž“ alebo „zmenšuje nadmerné prispôsobenie“ - prostredníctvom nadmerného vzorkovania sa maximálnym združovaním zapája to, čo sa nazýva „zníženie rozmerov“.

Zníženie rozmerov sa zaoberá otázkou existencie nadmerne komplikovaného modelu, ktorý je ťažké preniknúť neurónovou sieťou. Predstavte si zložitý tvar s mnohými malými zubatými kontúrami a každú malú časť tejto čiary predstavuje dátový bod. Vďaka zmenšeniu rozmerov inžinieri pomáhajú strojovému vzdelávaciemu programu „oddialiť“ alebo vzorkovať menej údajových bodov, aby sa model ako celok zjednodušil. Preto, ak sa pozriete na maximálnu spoločnú vrstvu a jej výstup, môžete niekedy vidieť jednoduchšiu pixeláciu, ktorá zodpovedá stratégii redukcie rozmerov.

AlexNet tiež používa funkciu nazývanú rektifikované lineárne jednotky (ReLU) a maximálne združovanie môže byť komplementárne k tejto technike pri spracovávaní obrazov prostredníctvom CNN.

Odborníci a tí, ktorí sa podieľajú na projekte, poskytli bohaté vizuálne modely, rovnice a ďalšie podrobnosti, aby ukázali konkrétnu zostavu AlexNet, ale vo všeobecnom zmysle môžete uvažovať o maximálnom združení ako o zlúčení alebo konsolidácii produkcie viacerých umelých neurónov. Táto stratégia je súčasťou celkovej výstavby siete CNN, ktorá sa stala synonymom špičkového strojového videnia a klasifikácie obrazov.

Ako pomáha maximálna oblasť združovania urobiť z alexnetu vynikajúcu technológiu na spracovanie obrázkov?