Q:
Prečo spustiť školenie strojového učenia (ML) na lokálnom počítači a potom spustiť pravidelné vykonávanie na serveri?
A:Otázka, ako štruktúrovať projekt strojového vzdelávania a jeho fázy prípravy a skúšok, má veľa spoločného s tým, ako sa pohybujeme v „životnom cykle“ ML a prinášame program zo vzdelávacieho prostredia do produkčného prostredia.
Jedným z najjednoduchších dôvodov na použitie vyššie uvedeného modelu umiestnenia výcviku ML na lokálnom počítači a následného presunu vykonávania do systému založeného na serveri je výhoda nevyhnutného oddelenia povinností. Vo všeobecnosti chcete, aby bol tréningový súbor izolovaný, aby ste mali jasnú predstavu o tom, kde sa školenie začína a ako sa končí a kde sa začína testovanie. Tento článok KDNuggets hovorí o princípe hrubým spôsobom a zároveň prechádza niektorými ďalšími dôvodmi na izoláciu tréningových súprav na lokálnom stroji. Jedným z ďalších základných návrhov pre tento model je, že so súbormi školení a testov na veľmi odlišných architektúrach sa nikdy nebudete mýliť pri spoločnom prideľovaní vlakov / testov!
Ďalšou zaujímavou výhodou je kybernetická bezpečnosť. Odborníci poukazujú na to, že ak máte počiatočné procesy vlaku na lokálnom stroji, nemusí byť pripojený k internetu! Toto zásadne rozširuje bezpečnosť, „inkubuje“ proces, až kým nenarazí na svet výroby, kde potom musíte do modelu servera zabudovať primerané zabezpečenie.
Niektoré z týchto „izolovaných“ modelov môžu navyše pomôcť s problémami, ako sú napr. Drift koncepcie a skryté kontexty - princíp „nestacionality“ varuje vývojárov, že údaje „v priebehu času (v závislosti od toho, čo sa meria)“ že môže trvať veľa adaptability, aby sa testovacia fáza zhodovala s fázou vlaku. Alebo v niektorých prípadoch sa procesy vlaku a skúšky navzájom kombinujú a vytvárajú zmätok.
Prvé nasadenie testovacej fázy na server môže uľahčiť rôzne modely „čiernych skriniek“, v ktorých vyriešite problém s adaptabilitou údajov. V niektorých prípadoch eliminuje zbytočný proces zadávania príkazov na zmenu na viacerých platformách.
Potom serverové prostredie potom samozrejme slúži v reálnom čase alebo v dynamických procesoch, v ktorých inžinieri budú chcieť získať prístup k modelom prenosu údajov a kódov, ktoré najlepšie fungujú pri výrobe v ML. Napríklad AWS Lambda môže byť atraktívnou možnosťou pre manipuláciu s mikrofunkciami výroby (alebo kombináciou ukladania objektov Lambda a S3) a bez možnosti pripojenia (bez servera), čo sa stáva nemožným.
Toto sú niektoré z problémov, ktoré môžu vývojári premýšľať, keď uvažujú o tom, ako rozdeliť tréningové fázy ML od testovania a výroby.