Od zamestnancov Techopedia, 22. septembra 2016
Jedlo s sebou: Hostiteľka Rebecca Jozwiak diskutuje o analytike okrajov s Dr. Robinom Bloorom, Dezom Blanchfieldom a Shawn Rogersom od spoločnosti Dell Statistica.
Momentálne nie ste prihlásení. Ak chcete vidieť video, prihláste sa alebo sa zaregistrujte.
Rebecca Jozwiak: Dámy a páni, ahoj, vitajte v Hot Technologies roku 2016. Dnes máme „Edge Analytics: konečná ekonomika internetu vecí“. Volám sa Rebecca Jozwiak. Budem vašim moderátorom dnešného webového vysielania. Ak sa chcete pripojiť ku konverzácii na Twitteri, urobíme tweet s hashtagom # HOTTECH16.
Takže internet vecí, určite tento rok horúca téma a internet vecí, je to naozaj o strojových údajoch, údajoch senzorov, protokolových údajoch, údajoch o zariadeniach. Nič z toho nie je nové, mali sme tento typ údajov naveky, ale je to tak, že sme ich naozaj nemohli použiť a teraz vidíme iba veľa nových spôsobov použitia týchto údajov. Najmä v lekárskom priemysle, na finančných trhoch, s ropou a plynom, komoditami, je to len množstvo informácií, ktoré sa predtým nevyužili. A nie veľa ľudí skutočne pochopilo, ako to urobiť dobre. Hovoríme o veľkom množstve údajov, ale je to veľa údajov a, viete, sú tu problémy so sieťou, je to hardvér alebo je potrebné ich spracovať a ako to robíte bez upchatia systému? O tom sa dnes budeme učiť.
Tu je naša zostava odborníkov. Máme Dr. Robina Bloora, nášho hlavného analytika v skupine The Bloor Group. Máme tiež Dez Blanchfielda, nášho vedca údajov v skupine The Bloor Group. A sme radi, že máme Shawn Rogers, riaditeľa globálneho marketingu a kanálov spoločnosti Dell Statistica. A s tým idem odovzdať loptu Robinovi.
Robin Bloor: Dobre, ďakujem za to. Stlačím tlačidlo a vyhodím snímku. Neviem, prečo som vytvoril tento apokalyptický obraz pre internet vecí. Možno preto, že si myslím, že to nakoniec bude chaotické. Pôjdem rovno. Toto je rovnocenné s kurzom v akejkoľvek prezentácii internetu vecí. Tak či onak musíte povedať niečo poburujúce o tom, kam všetko ide. A v skutočnosti je väčšina z toho pravdepodobne pravda. Ak sa skutočne pozriete na to, ako sa tieto krivky postupne rozširujú. Vieš, osobné počítače, smartfóny a tablety pravdepodobne ďalej porastú. Smart TV pravdepodobne porastie. Nositeľné, pravdepodobne explodujú práve teraz, v porovnaní s tým, čo boli pred niekoľkými rokmi. Prepojené autá, nevyhnutné, že takmer všetky autá budú neustále dôkladne prepojené a dôkladne prenášajú údaje. A všetko ostatné. A tento konkrétny graf BI Intelligence naznačuje, že všetko ostatné preváži zjavné veci veľmi, veľmi rýchlo.
Čo teda povedať o IoT? Prvá vec je iba architektonický bod. Viete, keď máte údaje a spracovávate vás, tak či onak, budete ich musieť dať dokopy. A s údajmi v objemoch, ktoré sa teraz nachádzajú, a zhromažďujúcimi sa na rôznych miestach už tieto dve prirodzene spolu nie sú. Myslím, že bývali v starých sálových dňoch. Takže si môžete myslieť, že existuje vrstva na spracovanie, transportná vrstva a vrstva údajov. A tak či onak, transportná vrstva sa dnes chystá presunúť spracovanie okolo alebo presunúť dáta okolo sietí. Takže tu sú možnosti: Môžete presunúť údaje do spracovania, môžete presunúť spracovanie k údajom, môžete presunúť spracovanie a údaje na vhodné miesto vykonania alebo môžete spracovanie spracovať a obmedziť údaje. Pokiaľ ide o internet vecí, údaje sú pri narodení do značnej miery už chránené. Pravdepodobnosť je taká, že hrozí veľké množstvo spracovania, aby sa mohli uskutočniť aplikácie, ktoré je potrebné spustiť.
Tak som maľoval obrázok. Zaujímavé je pre mňa internet vecí, hovorím o agregačnej doméne v tomto diagrame a poukazujem na to, že existujú subdomény. Takže si viete predstaviť, že doména 1 internetu Iot je tu nejakým druhom auta a doména 2 a doména 3 a doména 4 sú vozidlá nejakého druhu a miestne budete zhromažďovať údaje, na ktorých budete spúšťať miestne aplikácie a dáte do činnosti rôzne veci. Ak však chcete mať k dispozícii analytické údaje o všetkých automobiloch, budete musieť preniesť údaje do centra, nie všetky údaje, ale budete musieť agregovať v centre. A ak o tom premýšľate, možno budete chcieť mať mnoho, veľa rôznych agregačných domén s rovnakou sadou vecí internetu vecí. A samotné domény sa môžu ďalej agregovať. Takže by ste mohli mať túto opakujúcu sa hierarchiu. A v podstate to, čo tu máme, je neuveriteľne zložitá sieť. Oveľa zložitejšie ako čokoľvek, čo sme predtým museli mať.
Tu mám poznámku. Všetky sieťové uzly vrátane listových uzlov môžu byť tvorcami údajov, skladmi údajov a bodmi spracovania. A to vám dáva možnosť distribúcie, ktorú sme doteraz nevideli. Dez o tom bude hovoriť trochu viac, takže sa budem venovať tomuto konkrétnemu bodu. Akonáhle sme na internete vecí a všetky údaje sa skutočne vyriešili ako udalosti, zmyslom tejto snímky je len naznačiť, že budeme musieť štandardizovať udalosti. Budeme to musieť prinajmenšom mať. Budeme mať čas, kedy k udalosti došlo, geografické umiestnenie, ktoré sa vyskytlo, virtuálne alebo logické umiestnenie procesu, ktorý ho vytvoril, zdrojové zariadenie, ktoré ho vytvorilo, ID zariadenia, takže presne viete, ktoré zdrojové zariadenie ho vytvorilo, vlastníctvo údajov a hercov, tých ľudí, ktorí majú právo tieto údaje nejakým spôsobom používať, musí s nimi niesť svoje povolenia, čo v skutočnosti znamená, že s nimi bude musieť niesť bezpečnosť, a potom je tu samotné údaje. A keď sa na to pozriete, uvedomíte si, že aj keď máte snímač, ktorý nerobí nič viac, ako oznamuje teplotu niečoho každú sekundu, v skutočnosti existuje dosť údajov, aby sa presne zistilo, kde sú údaje. a čo to vlastne je. Mimochodom, toto nie je vyčerpávajúci zoznam.
Takže pokiaľ ide o budúce IT prostredie, tak to vidím takto: že to nie je len internet vecí, je tu tiež skutočnosť, že sa nachádzame vo svete aktivít zameraných na udalosti, a preto budú musieť mať architektúry založené na udalostiach a tieto architektúry budú musieť pokrývať veľké siete. A druhá vec je všetko v reálnom čase, nie je to nevyhnutne tak, aby sme boli v reálnom čase, ale existuje niečo, o čom hovorím ako o obchodnom čase, čo je čas, v ktorom musia byť údaje skutočne doručené a pripravené spracované. Možno to nie je milisekunta po jej vytvorení. Vždy však existuje taký čas na každé údaje a keď budete mať architektúru založenú na udalostiach, začne byť rozumnejšie uvažovať o prístupe k fungovaniu sveta v reálnom čase.
Takže varenie nadol, pretože to, o čom skutočne hovoríme, je analytika v oblasti internetu vecí. Napriek tomu všetkému je ešte stále čas na nahliadnutie a nie je to len čas na nahliadnutie, po nahliadnutí musia nasledovať činy. Takže čas na pochopenie a čas na konanie je to, na čo by som to uvaril. Po tom, čo som povedal, odovzdám loptu späť Dezovi.
Dez Blanchfield: Ďakujem, Robin. Insightful ako vždy. Milujem skutočnosť, že je ťažké postupovať v každom prípade, ale urobím maximum.
Jedna z vecí, ktoré vidím, a často ma to baví, aby som bol úprimný, a nie v nenápadnej a negatívnej sklonenej podobe, ale je tu veľa obáv a paniky o internete vecí, ktoré preberajú svet. a automatizujete nás a začnete strácať svoje údaje, takže sa chcem trochu pozrieť na niektoré z vecí, ktoré sme urobili predtým v posledných dvoch až troch desaťročiach a ktoré boli internetom blízkym vecí, ale možno nie úplne v rovnakom rozsahu. A len aby sme si ukázali, že sme tu skutočne boli a vyriešili niektoré problémy, nie na tejto úrovni a nie touto rýchlosťou. Pretože to znamená, že môžeme skutočne problém vyriešiť a že vieme, aké sú niektoré z odpovedí; práve sme sa museli schovávať a znovu použiť niektoré poznatky, ktoré sme mali predtým. A viem, že toto je celá konverzácia, ktorú sa chystáme viesť, a ja mám celú škálu zábavných vecí, ktoré si môžem len porozprávať v sekcii Otázky a odpovede.
Keď však premýšľame o internete vecí v kruhu, v súčasnosti existuje značná centralizácia na úrovni dizajnu, ktorá bola napísaná v prvých dňoch. Napríklad Fitbit zariadenia majú tendenciu ísť na jedno centrálne miesto a je pravdepodobné, že budú niekde hostované v cloudovej platforme a všetky tieto údaje zo všetkých týchto zariadení zasiahnu to isté, povedzme, predný koniec stohu, vrátane webu a aplikačné a dátové služby. V priebehu času si však táto škála bude vyžadovať prepracovanie, aby sa dokázalo vyrovnať s množstvom údajov, ktoré na ne prichádzajú, a prepracujú ju tak, že existuje viac frontendov a viac kópií stohu na viacerých miestach a regiónoch. A vidíme to a existuje niekoľko príkladov, ktoré vám dám, aby sme mohli diskutovať.
Kľúčovým bodom je to, že aj keď sme videli niektoré z týchto riešení, ktoré sa chystám pokryť, rozsah a objem údajov a sieťový prenos, ktorý internet vecí vytvorí, si naliehavo vyžaduje prechod od centrálneho distribuované architektúry podľa môjho názoru, a my to vieme, ale nemuseli sme nevyhnutne pochopiť, čo je riešením. Keď premýšľame o tom, čo je internet vecí, ide o rozsiahly sieťový model. Teraz je veľa a veľa vecí, ktoré teraz vydávajú hluk. Veci, ktoré až donedávna nezaznamenali hluk. A v skutočnosti si myslím, že to bolo včera, žartoval som o komíne, ale išiel som kúpiť nový hriankovač a prišiel som s možnosťou, ktorá by mi mohla povedať rôzne veci, vrátane prípadov, keď je potrebné vyčistiť. A nová mikrovlnná rúra s veľmi podobnou funkciou a mohla by dokonca v skutočnosti pingovať aplikáciu na telefóne a povedať, že to, čo som zohrieval, sa teraz stalo. A veľmi si myslím, že ak so mnou nechce hovoriť pár vecí, je to moja chladnička, mikrovlnná rúra a hriankovače. Som celkom spokojný s tým, že sú hlúpi zariadenia. Ale nedávno som dostal nové auto, trochu Audi, a to so mnou hovorí a som s tým celkom spokojný, pretože veci, o ktorých hovorí, sú predmetom záujmu. Rovnako ako aktualizácia máp v reálnom čase, aby mi povedala, kde je lepšia cesta, ako sa dostať z bodu A do bodu B, pretože detekuje prenos prostredníctvom rôznych mechanizmov s údajmi, ktoré dostane.
Mám túto snímku. Už sme videli, že veľkoobjemové sieťové modely vyžadujú prechod od centrálneho k distribuovanému zachytávaniu a doručovaniu modelov spracovania a analýzy údajov. Videli sme, ako sa veci pohybujú z troch malých grafov na pravom okraji, kde sa nachádzame, v ľavom z troch, existuje centralizovaný model so všetkými malými zariadeniami prichádzajúcimi do centrálneho umiestnenia a zhromažďujú údaje a mierka nie je taká veľká, zvládnu tam dobre. Uprostred máme trochu decentralizovanejší model a rozbočovač a hovoril, čo si myslím, že budeme potrebovať s internetom vecí v budúcej generácii. A na pravej strane máme túto plne distribuovanú a sieťovo prepojenú sieť, v ktorej bude internet vecí a stroj-stroj v budúcnosti v blízkej budúcnosti fungovať, ale nie sme celkom tam z rôznych dôvodov. A hlavne preto, že zatiaľ využívame internetové platformy pre väčšinu komunikácií a v skutočnosti sme nevytvorili druhú sieť na prenášanie veľkého množstva týchto údajov.
Existujú už aj druhé siete, napríklad sieť Batelco. Mnoho ľudí nemyslí na skutočnosť, že telekomunikačné siete nie sú internet. Internet je v mnohých ohľadoch veľmi samostatnou vecou. Smerujú údaje zo smartfónov cez telefónne siete a potom cez telefónne siete a do internetu všeobecne, kde ich vlastne vrstvia do dvoch sietí. Je však celkom možné a pravdepodobné, že internet vecí bude potrebovať inú sieť. O priemyselnom internete hovoríme všeobecne ako o téme, o ktorej sa teraz nebudeme podrobne zaoberať, ale v podstate hovoríme o inej sieti, ktorá je špeciálne navrhnutá pre typy prepravy dát alebo internetu vecí a stroj-stroj. komunikácie.
Niektoré z príkladov, ktoré som chcel zdieľať a kde sme videli, že siete s veľkým objemom a distribuované údaje fungujú veľmi dobre, sú napríklad internet. Internet bol špeciálne navrhnutý a navrhnutý od prvého dňa, aby dokázal prežiť jadrovú vojnu. Ak dôjde k výbuchu častí USA, internet bol navrhnutý tak, aby sa údaje mohli pohybovať po internete bez straty paketov z dôvodov, že sme stále pripojení. A to aj dnes existuje v globálnom meradle. Internet má viac možností okolo redundancie a smerovania paketov. Internet je v skutočnosti kontrolovaný pomocou tzv. BGP, protokolu Border Gateway Protocol a protokolu Border Gateway Protocol BGP, ktorý je špeciálne navrhnutý tak, aby sa vysporiadal s výpadkom smerovača alebo prepínača alebo servera. Ak pošlete alebo prijmete e-mail, ak pošlete tri e-maily za sebou, nie je zaručené, že každý z týchto e-mailov bude nasledovať rovnakú cestu k rovnakému cieľovému cieľu. Môžu sa pohybovať v rôznych častiach internetu z rôznych dôvodov. Mohlo by dôjsť k výpadku, mohli by sa vyskytnúť údržbové okná, kde by sa veci aktualizovali v režime offline, mohlo by dôjsť iba k preťaženiu v sieti a vidíme, že s vecami, ako sú dopravné siete s automobilmi a verejnou dopravou a lode a lietadlá. Obsah získavame do našich zariadení, ako sú naše notebooky a tablety a počítače, prostredníctvom prehliadačov a podobne každý deň prostredníctvom sietí na doručovanie obsahu. Siete na doručovanie obsahu sú o tom, ako kopírovať obsah z vašej primárnej obslužnej platformy, ako je webový server, a jeho pohybujúce sa kópie a vyrovnávacia pamäť sú malé množstvá na okraj siete a doručujú sa vám iba z najbližšej časti okraja.
Anti-spam a kybernetická bezpečnosť - ak sa v Kanade koná udalosť proti spamu a spoločnosť Microsoft ju zistí a zistí, že je veľa kópií toho istého e-mailu odosielaných skupine náhodných ľudí, kontroluje sa kontrolný súčet, podpis tejto správy je vytvorené a vložené do siete a okamžite distribuované. A aby sa e-mail nikdy nedostal do mojej doručenej pošty, alebo ak áno, okamžite sa označí ako spam, pretože sa zistil niekde inde na okraji siete. A tak sa o tomto podpise spamovej správy dozvedeli ďalšie časti okraja siete a vložili sa do indexu databázy a ak sa tieto správy začnú objavovať na druhej strane planéty, zistíme ich a vieme, že ide o spam. To isté platí pre kybernetickú bezpečnosť. Hack, ktorý sa odohráva na jednej strane planéty, je detekovaný a zaregistrovaný a zmapovaný. Zrazu na druhej strane siete môžeme bojovať proti nemu a zadávať pravidlá a politiky a meniť, aby sme zistili, či ho môžeme zablokovať. Najmä s novým vplyvom vecí ako je odmietnutie služby alebo distribuované odmietnutie služby, pri ktorých sa tisíce strojov používajú na útok na centrálnu webovú stránku.
Bitcoin a blockchain sú v predvolenom nastavení vo svojej podstate distribuovaná kniha, blockchain a vyrovnávajú sa s akýmikoľvek výpadkami alebo zlommi v sieti. Detekcia a prevencia podvodov, energetické a vodárenské služby - vidíme, viete, elektrickú sieť, ak jedna časť siete dostane stromovú pôdu a vytiahne tyč a drôt, môj dom bude mať stále energiu. Ani o tom neviem, často to ani v správach neuvidím. A my všetci sme zvyknutí na dopravné siete, kde pôvodne existoval centralizovaný model „Všetky cesty viedli do Ríma“, ako sa hovorí, a potom sme nakoniec museli ísť na decentralizovaný model s rozbočovačmi a lúčmi a potom sme išli do sieťovej siete, kde by ste sa mohli dostať z jednej strany mesta na druhú rôznymi sieťami a rôznymi križovatkami. A tu vidíme, že tento centralizovaný model toho, čo robíme teraz s internetom vecí, sa bude musieť posunúť na okraj siete. A to platí pre analytiku viac ako inokedy, a preto musíme tlačiť analytiku von do siete. A to si podľa môjho názoru vyžaduje úplne nový prístup k tomu, ako pristupujeme k týmto údajom a ich tokom a spracúvame ich. Teraz hovoríme o scenári, v ktorom sa domnievam, že na zariadeniach pripojených k internetu tlačia na okraj siete obmedzené spravodajské informácie, ale čoskoro uvidíme, ako tieto zariadenia zvyšujú inteligenciu a zvyšujú úroveň analytiky, ktorú chcú. robiť. A v dôsledku toho budeme musieť tieto inteligentné počítače vytlačiť ďalej a ďalej prostredníctvom siete.
Napríklad inteligentné aplikácie a sociálne médiá - ak uvažujeme o sociálnych médiách a niektorých inteligentných aplikáciách, sú stále veľmi ústredné. Viete, existujú iba dve alebo tri dátové strediská pre používateľov Facebooku. Google sa stal oveľa decentralizovanejším, ale stále existuje obmedzený počet dátových centier po celom svete. Keď potom premýšľame o personalizácii obsahu, musíte premýšľať na veľmi miestnej úrovni. Veľa toho sa deje vo vašom prehliadači alebo na miestnej sieťovej vrstve na doručovanie obsahu. A myslíme na zdravotné a kondičné sledovače - veľa údajov, ktoré sa od nich zhromažďujú, sa analyzuje lokálne, takže nové verzie zariadení Garmin a Fitbit, ktoré si položíte na zápästie, sa stávajú inteligentnejšie a múdrejší v zariadení, Teraz neposielajú všetky údaje o vašej srdcovej frekvencii späť na centralizovaný server, aby sa pokúsili vykonať analýzu; zabudujú túto inteligenciu priamo do zariadenia. Navigácia vo vozidle bývala tak, že auto by neustále dostávalo aktualizácie a mapy z centrálneho miesta, teraz sú smartfóny v aute a rozhodnutia vozidla sa robia samy osebe a nakoniec sa autá zaplnia. Autá budú spolu komunikovať prostredníctvom bezdrôtových sietí nejakej formy, ktorá môže byť v budúcej generácii cez bezdrôtovú sieť 3G alebo 4G, ale nakoniec to bude zariadenie od zariadenia. A jediný spôsob, ako sa s týmto objemom vyrovnať, je vylepšiť zariadenia.
Už máme núdzové varovné systémy, ktoré budú zhromažďovať informácie na miestnej úrovni a posielať ich centrálne alebo do sieťových sietí a rozhodovať o tom, čo sa deje na miestnej úrovni. Napríklad v Japonsku existujú aplikácie, ktoré ľudia používajú na svojich smartfónoch s akcelerometrom v smartfóne. Akcelerometre v telefóne zisťujú vibrácie a pohyb a môžu určiť rozdiel medzi bežným každodenným pohybom a trasmi a otrasmi zemetraseniami. A ten telefón vás okamžite upozorní lokálne. Skutočná aplikácia vie, že zistí zemetrasenie. Zároveň však zdieľa tieto údaje prostredníctvom siete v distribuovanom rozbočovači a hovoril modelom, aby ľudia vo vašom okolí boli varovaní okamžite alebo čo najskôr, ako údaje prechádzajú sieťou. A nakoniec, keď sa dostane do centrálneho umiestnenia alebo do distribuovanej kópie centrálneho umiestnenia, tlačí späť k ľuďom, ktorí nie sú v bezprostrednej blízkosti, nezistil pohyb planéty, ale musí byť na to upozornený, pretože možno príde cunami.
A inteligentná mestská infraštruktúra - koncept inteligentnej infraštruktúry, inteligenciu už zabudujeme do inteligentných budov a inteligentnej infraštruktúry. V skutočnosti som včera zaparkoval svoje auto v meste v novej oblasti, kde sa časť mesta renovuje a prestavuje. A urobili všetky ulice, a na uliciach sú senzory a skutočný parkovací meter vie, že keď som vjel autom, vie, že keď idem na občerstvenie na dvojhodinový limit, auto sa nepohybovalo a vlastne by ma to nedovolilo doplniť a zostať ešte dve hodiny. Musel som nastúpiť do auta, vytiahnuť z priestoru a potom zatiahnuť späť, aby som ho podviedol, aby som tam mohol zostať ďalšie dve hodiny. Čo je však zaujímavé, je to, že nakoniec ideme do bodu, keď to nie je len detekcia vjazdu automobilu do oblasti ako lokalizovaného senzora, ale veci ako optické charakteristiky, kde sa rozpoznávanie bude aplikovať s kamerami pri pohľade na moju poznávaciu značku, a bude to vedieť že som vlastne len vytiahol a vtiahol sa späť a oklamal to, a to mi nedovolí obnoviť sa a pôjdem ďalej. A potom tieto údaje distribuuje a ubezpečí sa, že to nemôžem urobiť nikde inde a priebežne tiež trikujem sieťou. Pretože to musí byť, prirodzene, múdrejší, inak to všetci budeme blázniť.
Je to príklad, že som vlastne osobne žil tam, kde v technológii brány firewall, na konci 80. a začiatkom 90. rokov, produkt s názvom Check Point FireWall-1. Veľmi jednoduchá technológia brány firewall, ktorú sme používali na vytváranie pravidiel a vytváranie politík a pravidiel týkajúcich sa určitých vecí, ktoré hovoria, že typy prenosu prostredníctvom určitých portov a IP adries a sietí, aby sa dostali k sebe a od seba, webový prenos z jedného miesta na druhé, z prehliadača a klienta na náš server. Tento problém sme vyriešili skutočným vyňatím logiky zo samotných brán firewall a ich presunutím do integrovaného obvodu špecifického pre aplikáciu ASIC. Riadila porty v ethernetových prepínačoch. Zistili sme, že serverové počítače, počítače, ktoré sme vlastne používali ako servery na prijímanie rozhodnutí ako brány firewall, neboli dostatočne výkonné na to, aby zvládli objem prenosu, ktorý nimi prechádza, na každú malú kontrolu paketov. Tento problém sme vyriešili presunutím logiky potrebnej na vykonanie kontroly paketov a detekcie internetu do sieťových prepínačov, ktoré boli distribuované a boli schopné spracovať objem údajov prechádzajúcich sieťovou úrovňou. Na centralizovanej úrovni sme s firewally neobávali starostí, presunuli sme ich k prepínačom.
A tak sme mali výrobcov, aby pre nás vybudovali schopnosť tlačiť cesty, pravidlá a politiky do ethernetového prepínača tak, aby na skutočnej úrovni ethernetového portu, a možno mnohí ľudia v bazéne, neboli oboznámení, pretože sme všetky teraz žijú v bezdrôtovom svete, ale naraz sa všetko muselo zapojiť cez Ethernet. Teraz na úrovni ethernetového portu sme robili kontrolu paketov, aby sme zistili, či sa pakety dokonca mohli presunúť do prepínača a do siete. Niektoré z týchto problémov teraz riešime túto výzvu, ktorou je zachytávanie údajov v sieti, konkrétne zo zariadení IRT, ich kontrola a analýza v nej a pravdepodobne analytika v nej v reálnom čase, aby sme sa mohli rozhodnúť. A niektoré z nich majú získať informácie o podnikovej inteligencii a informáciách o tom, ako ľudia robia lepšie rozhodnutia a ďalšie analýzy a výkonnosť vecí na úrovni strojov, kde zariadenia hovoria so zariadeniami a rozhodujú sa.
A toto bude trend, ktorý sa musíme pozrieť na riešenie v najbližšej budúcnosti, pretože ak to neurobíme, tak skončíme s touto záplavou hluku. A videli sme vo svete veľkých dát, videli sme veci, ako sa dátové jazerá premieňajú na dátové močiare, ktoré sme nakoniec skončili so záplavou hluku, na ktorú sme neprišli na to, ako vyriešiť analytiku spracovania v centralizovanom systéme. fashion. Ak podľa môjho názoru tento problém nevyriešime okamžite s IoT a veľmi rýchlo nájdeme platformové riešenie, skončíme na veľmi, veľmi zlom mieste.
A s týmto vedomím sa budem venovať svojej myšlienke, že som presvedčený, že jedna z najväčších zmien, ku ktorej dochádza vo veľkom dátovom a analytickom priestore, je v súčasnosti poháňaná okamžitou potrebou reagovať na vplyv internetu. vecí na analytiku s veľkým objemom a v reálnom čase, v ktorej potrebujeme presunúť analytiku von do siete a potom nakoniec na okraj siete, aby sme si poradili s jej úplným objemom, len aby sme ju spracovali. A nakoniec, dúfajme, vložíme inteligenciu do siete a na okraj siete do rozbočovača a hovoríme modelom, ktorý môžeme skutočne spravovať a získať prehľady v reálnom čase a získať z toho hodnotu. A s tým idem prejsť k nášmu hosťovi a uvidíme, kam nás táto konverzácia zavedie.
Shawn Rogers: Ďakujem veľmi pekne. Toto je Shawn Rogers z Dell Statistica a chlapec, na začiatok, úplne súhlasím so všetkými hlavnými témami, ktorých sa tu dotýkame. A Rebecca, vy ste začali s jednou myšlienkou, viete, že tieto dáta nie sú nové, a je mi pozoruhodné, koľko času a energie sa venuje diskusii o údajoch, údajoch a údajoch IoT. A je to určite relevantné, viete, Robin urobil dobrý bod, aj keď robíte niečo naozaj jednoduché a poklepávate do termostatu raz za sekundu, viete, robíte to 24 hodín denne a skutočne máte, viete, niektoré zaujímavé údaje. Ale nakoniec viete - a myslím si, že veľa ľudí v tomto odvetví hovorí o údajoch týmto spôsobom - že to nie je naozaj všetko také zaujímavé a, podľa Rebeccy, bolo to okolo dobrého, dlhého času, ale v minulosti sme to nedokázali dobre využiť. A myslím si, že priemysel pokročilých analytikov a priemysel BI všeobecne začínajú skutočne smerovať k IoT. A Dez, do vášho posledného bodu, myslím si, že je to časť alebo jeden z náročných bodov veľkého prostredia údajov veľmi pravdivý. Myslím si, že všetci sú veľmi nadšení z toho, čo s týmto typom údajov môžeme urobiť, ale zároveň, ak nedokážeme prísť na to, ako aplikovať prehľad, podniknúť kroky a, viete, získať analytiku, kde sú údaje, myslím, budeme mať problémy, ktoré ľudia nevidia, ako sa skutočne dostanú na cestu.
S tým bolo povedané, že v priestore pokročilých analytikov sme veľkými fanúšikmi toho, čo si myslíme, že sa môže stať s údajmi IoT, najmä ak naň aplikujeme analytiku. A na tomto snímke je veľa informácií a nechám všetkých, aby lovili a siahali po okolí, ale ak sa pozriete na rôzne odvetvia, ako je napríklad maloobchod s krajnou pravou rukou, vidia svoje príležitosti, ktoré vznikajú okolo toho, že môžu byť inovatívnejšie alebo mať nejaké Úspora nákladov alebo optimalizácia alebo vylepšenie procesov sú veľmi dôležité a vidia za tým veľa prípadov použitia. Ak sa pozriete, viete, zľava doprava v diapozitíve, uvidíte, ako si každý z týchto jednotlivých odvetví nárokuje nové schopnosti a nové možnosti rozlišovania, keď aplikujú analytiku na internet vecí. A myslím si, že konečný výsledok je, že ak sa budete snažiť ísť touto cestou, nemusíte sa len obávať údajov, ako sme diskutovali, a architektúry, ale musíte sa tiež pozrieť, ako najlepšie aplikovať naň analýzu a tam, kde je potrebné uskutočniť analýzu.
Pre mnohých z nás v dnešnej výzve viete, že sme sa s Robinom poznali veľmi dlho a mali sme v minulosti nespočetné rozhovory o tradičných architektúrach, architektúrach okolo centralizovaných databáz alebo podnikových dátových skladov atď., A ako Zistili sme, že v poslednom desaťročí sme urobili celkom dobrú prácu, keď sme obmedzili obmedzenia týchto infraštruktúr. A nie sú tak vytrvalí alebo takí silní, ako by sme chceli, aby dnes boli, aby podporili všetky skvelé analytické údaje, ktoré aplikujeme na informácie, a samozrejme, že informácie tiež narušujú architektúru, viete, rýchlosť údajov, objem údajov atď. rozhodne obmedzujú obmedzenia niektorých našich tradičnejších prístupov a stratégií k tomuto typu práce. A tak si myslím, že je to tak trochu začiatočné, že je potrebné, aby spoločnosti zaujali agilnejší a možno flexibilnejší pohľad na to, a to je časť, myslím, rád by som hovoril trochu o strane internetu vecí.
Predtým, ako to urobím, urobím chvíľku, aby som všetkých nechal volať, aby som vám dal trochu podrobností o tom, čo je Štatistica a čo robíme. Ako môžete vidieť na názve tohto snímky, Štatistica je prediktívna analýza, veľké dáta a vizualizácia pre platformu IoT. Samotný produkt je starší ako 30 rokov a súťažíme s ostatnými lídrami na trhu, s ktorými ste pravdepodobne oboznámení v súlade s tým, že dokážete aplikovať prediktívnu analýzu, pokročilú analytiku na údaje. Videli sme príležitosť rozšíriť náš dosah, na ktorý sme nasadili našu analytiku, a chvíľu sme začali pracovať na niektorých technológiách, ktoré nás dosť dobre využili na to, o čom dnes hovorili Dez aj Robin, čo je tento nový prístup a kam idete umiestniť analytiku a ako to spojíte s údajmi. Pozdĺž tejto stránky prichádzajú ďalšie veci, ktoré musíte byť schopní riešiť s platformou, a ako som už spomenul, Štatistica bola na trhu už dosť dlho. Sme veľmi dobrí v oblasti spájania údajov a myslím si, že viete, že sme dnes veľa nehovorili o prístupe k údajom, ale sme schopní osloviť tieto rôzne siete a dostať vaše ruky na správne údaje na správny čas je pre koncových používateľov stále zaujímavejší a dôležitejší.
Nakoniec tu uvediem ešte jednu poznámku, pretože Dez urobil dobrú poznámku o samotných sieťach, mal určitú úroveň kontroly a zabezpečenia nad analytickými modelmi vo vašom prostredí a spôsob, akým sa pripájajú k dátam, ktoré sú veľmi dôležité. Keď som sa dostal do tohto odvetvia pred niekoľkými rokmi - myslím si takmer 20 - v tomto bode - keď sme hovorili o pokročilej analytike, bolo to veľmi kurátorské. Ruku na tom mali iba pár ľudí v organizácii, nasadili ju a dali ľuďom odpoveď podľa potreby alebo poskytli potrebné informácie. To sa skutočne mení a my vidíme veľa ľudí, ktorí pracovali s jedným alebo viacerými rôznorodými a flexibilnejšími spôsobmi získavania údajov, uplatňovaním bezpečnosti a riadenia údajov a následnou schopnosťou na nich spolupracovať. Toto sú niektoré z dôležitých vecí, na ktoré sa spoločnosť Dell Statistica pozerá.
Chcem sa však venovať téme, ktorá je trochu bližšia dnešnému názvu, ktorým je, ako by sme sa mali zaoberať údajmi, ktoré pochádzajú z internetu o veciach a čo by ste mohli hľadať, keď hľadáte iné riešenia. Snímka, ktorú práve teraz mám pred vami, je trochu tradičný pohľad a Dez aj Robin sa toho dotkli, viete, táto myšlienka hovoriť so senzorom, či už je to automobil alebo hriankovač alebo veterná turbína alebo čo máte a potom presuniete tieto údaje zo zdroja údajov do vašej siete späť do centralizovanej konfigurácie, ako spomínal Dez. A to siete celkom dobre a mnoho spoločností sa dostane do priestoru internetu vecí pôvodne s týmto modelom.
Ďalšou vecou, ktorá prišla, keď sa pozriete na spodnú časť snímky, je táto myšlienka vziať ďalšie tradičné zdroje údajov, rozšíriť vaše dáta IoT a potom na tento druh jadra, či už je vaše jadro dátovým centrom alebo nie môže byť v cloude, nezáleží na tom, vzali by ste produkt, ako je Štatistica, a potom naň v tomto bode použili analytiku a potom poskytli tieto informácie spotrebiteľom napravo. A myslím si, že v tomto bode ide o stoly. Musíte niečo urobiť a musíte mať dostatočne otvorenú architektúru pre pokročilú analytickú platformu a hovoriť so všetkými z nich, rôznymi druhmi zdrojov údajov, všetkými týmito senzormi a všetkými týmito rôznymi cieľmi, kde máte údaje. A myslím si, že je to niečo, čo musíte urobiť, a myslím si, že zistíte, že je pravda, že veľa lídrov na trhu je schopný robiť tieto veci. Tu v Statistike o tom hovoríme ako o základnej analýze. Choďte a získajte údaje, preneste ich späť do jadra, spracujte ich, v prípade potreby alebo podľa potreby pridajte ďalšie údaje a vykonajte svoju analýzu a potom tieto informácie zdieľajte, aby ste mohli konať alebo získať prehľad.
A tak si myslím, že sú určite z funkčného hľadiska, pravdepodobne by sme všetci súhlasili s tým, že, viete, je to len nevyhnutnosť a každý to musí urobiť. Tam, kde to začína byť zaujímavé, je to, že máte obrovské množstvo údajov, viete, pochádzajúcich z rôznych zdrojov údajov, ako sú senzory IoT, ako som už spomenul, či už ide o auto alebo bezpečnostnú kameru alebo výrobný proces, začína sa to stávať výhodou je to, že dokážeme robiť analytické práce tam, kde sa údaje skutočne vyrábajú. A výhodou pre väčšinu ľudí je, že keď začneme presúvať analytiku od jadra k okraju, je táto schopnosť rozptýliť niektoré z problémov s údajmi, ktoré sa dejú, a Dez a Robin sa k tomu pravdepodobne na konci vyjadria. dnes, ale myslím si, že musíte byť schopní monitorovať údaje a konať s nimi na okraji, aby nebolo vždy potrebné presunúť všetky tieto údaje do vašej siete. Robin o tom hovoril vo svojich typoch architektonických obrázkov, ktoré zostavil, kde máte všetky tieto rôzne zdroje, ale zvyčajne existuje nejaký bod agregácie. Agregačný bod, ktorý často vidíme, je buď na úrovni senzora, ale ešte častejšie na úrovni brány. A tieto brány existujú ako druh sprostredkovateľa v toku údajov zo zdrojov údajov skôr, ako sa vrátite k jadru.
Jednou z príležitostí, ktorú spoločnosť Dell Statistica využila, je to, že naša schopnosť exportovať model z našej centralizovanej analytickej platformy pre pokročilých analytikov umožňuje vziať model a potom ho vykonať na okraji na inej platforme, ako napríklad brána alebo vo vnútri. databázy alebo čo máte. A myslím si, že flexibilita, ktorá nám dáva, je skutočne zaujímavým bodom dnešného rozhovoru, máte to dnes vo svojej infraštruktúre? Ste schopní presunúť analytické údaje na miesto, kde údaje žijú, a jednoducho ich presunúť na miesto, kde žijú vaše analytické údaje? A to je niečo, na čo sa Štatistica už nejaký čas zameriava, a keď sa pozriete bližšie na snímky, uvidíte, že v našej sesterskej spoločnosti Dell Boomi je nejaká iná technológia. Dell Boomi je platforma na integráciu dát a integráciu aplikácií v cloude a my vlastne využívame Dell Boomi ako zariadenie na obchodovanie s ľuďmi, aby sme mohli naše modely presúvať z Dell Statistica, cez Boomi a off to edge equipment. A myslíme si, že toto je agilný prístup, ktorý budú spoločnosti vyžadovať, rovnako ako sa im páči verzia, ktorú som vám ukázal pred minútou, čo je druh základnej myšlienky presunu údajov zo senzorov späť do V tom istom čase sa spoločnosti budú chcieť dokázať urobiť takým spôsobom, aký tu uvádzam. A výhodou je, že robia aj Robin a Dez, čo znamená, že sa môžete rozhodnúť a konať rýchlo pri svojom podnikaní? Dokážete presunúť analytiku z jedného miesta na druhé a byť schopní ušetriť čas, peniaze a energiu a komplexnosť neustáleho presúvania okrajových údajov späť do jadra.
Teraz som prvý, kto povedal, že niektoré okrajové údaje budú vždy dostatočne kvalitné, ak by bolo rozumné tieto údaje ukladať a uchovávať a prenášať späť do vašej siete. Aká analýza okrajov vám však umožní je schopnosť robiť rozhodnutia rýchlosťou, ku ktorej sa dáta skutočne dostávajú, že? Že ste schopní aplikovať informácie a akciu rýchlosťou tak, aby bola najvyššia možná hodnota. A myslím si, že to je niečo, čo budeme všetci hľadať, pokiaľ ide o využitie pokročilých analytických a IoT údajov, je táto príležitosť posunúť sa rýchlosťou podnikania alebo rýchlosťou, ktorú zákazník požaduje. Myslím si, že naša pozícia je, že si myslím, že musíte byť schopní urobiť oboje. A myslím si, že veľmi skoro a veľmi rýchlo, pretože stále viac spoločností skúma rozmanitejšie súbory údajov, najmä tie zo strany internetu vecí, začnú skúmať priestor dodávateľa a požadujú to, čo dokáže Štatistica urobiť. Čo je nasadenie modelu v jadre, ako sme to už tradične robili už mnoho rokov, alebo jeho nasadenie na platformách, ktoré sú možno netradičné, ako je napríklad brána IoT, a aby boli skutočne schopné vyhodnocovať a aplikovať analytické údaje na údaje na hrane, ako sa vytvárajú údaje. A myslím si, že to je miesto, kde prichádza vzrušujúca časť tejto konverzácie. Pretože vďaka tomu, že dokážeme aplikovať analytiku na okraji v čase, keď údaje prichádzajú zo senzora, nám umožňuje konať tak rýchlo, ako je potrebné, ale zároveň nám umožňuje rozhodnúť sa, musia tieto údaje okamžite ísť späť do jadra? Môžeme ho tu rozdeliť a potom ho poslať späť na kúsky a po častiach a vykonať ďalšiu analýzu neskôr? A to je to, čo vidíme veľa našich popredných zákazníkov.
Spôsob, akým to robí spoločnosť Dell Statistica, je schopný ju využívať, napríklad povedzme, že si v rámci Štatistiky vybudujete neurónovú sieť a chceli by ste umiestniť neurónovú sieť niekde inde v dátovom prostredí. Máme schopnosť vydávať tieto modely a všetky jazyky, ktoré ste si všimli v pravom rohu - Java, PPML, C a SQL a tak ďalej, zahrnujeme tiež Python a sme schopní exportovať aj naše skripty - a keď presuniete tento produkt z našej centralizovanej platformy, potom môžete tento model alebo algoritmus nasadiť kdekoľvek to potrebujete. A ako som už spomenul, pomocou nástroja Dell Boomi ho umiestnime a zaparkujeme tam, kde ho potrebujeme spustiť, a potom môžeme priniesť výsledky späť, alebo môžeme pomôcť priviesť údaje späť alebo ich vyhodnotiť a podniknúť kroky pomocou nášho modulu pravidiel, Keď začneme pozerať na tento typ údajov a rozmýšľame, všetky tieto veci sa stávajú dôležitými.
To je niečo, čo väčšina z vás v telefóne bude musieť urobiť, pretože to bude veľmi nákladné a zdaňovanie vo vašej sieti, ako uviedol Dez, presunúť údaje zľava z týchto diagramov napravo od týchto diagramov čas. Neznie to ako veľa, ale videli sme výrobné zákazníkov s desiatimi tisíckami senzorov vo svojich továrňach. A ak máte vo vašej továrni desať tisíc senzorov, aj keď práve tieto robíte druhýkrát druh testov alebo signálov, hovoríte o osemdesiatich štyroch tisíc riadkoch údajov z každého z týchto jednotlivých senzorov za deň. A tak sa dáta určite hromadí a Robin to spomínal. Vopred som spomenul niekoľko odvetví, v ktorých vidíme ľudí, ako sa pomocou nášho softvéru a údajov IoT dokážu urobiť niektoré zaujímavé veci: automatizácia budov, energetika, verejné služby sú skutočne dôležitým priestorom. Vidíme veľa práce na optimalizácii systému, dokonca aj na zákazníckom servise a samozrejme na celkovej prevádzke a údržbe, v rámci energetických zariadení a v rámci budovy na automatizáciu. A to sú niektoré prípady použitia, ktoré, ako vidíme, sú dosť silné.
Už sme robili okrajovú analytiku, myslím, termín bol vytvorený. Ako som už spomenul, v spoločnosti Statistica máme hlboké korene. Spoločnosť bola založená takmer pred 30 rokmi, takže sme sa už nejaký čas vracali zákazníkom, ktorí integrujú údaje IoT s ich analytikou a už nejakú dobu pôsobia. A Alliant Energy je jedným z našich prípadov použitia alebo referenčných zákazníkov. A viete si predstaviť problém, ktorý má energetická spoločnosť s fyzickým závodom. Škálovanie za tehlové steny fyzického závodu je ťažké, a tak energetické spoločnosti, ako je Alliant, hľadajú spôsoby, ako optimalizovať svoj energetický výkon, v podstate zlepšiť svoj výrobný proces a optimalizovať ho na najvyššiu úroveň. A používajú Štatistiku na riadenie pecí vo svojich závodoch. A pre všetkých z nás, ktorí sa vracajú do našich skorých dní vo vedeckej triede, všetci vieme, že pece vyrábajú teplo, teplo vytvára pary, turbíny sa točia, dostávame elektrinu. Problémom pre spoločnosti ako Alliant je vlastne optimalizácia toho, ako sa veci zohrievajú a horia v týchto veľkých cyklónových peciach. A optimalizácia výstupu, aby sa predišlo dodatočným nákladom na znečistenie, vytesnenie uhlíka atď. A tak musíte byť schopní monitorovať vnútro jednej z týchto cyklónových pecí so všetkými týmito zariadeniami, senzormi a potom zobrať všetky tieto údaje senzorov a priebežne meniť energetické procesy. A to je presne to, čo Štatistica robí pre Alliant od roku 2007, ešte predtým, ako bol termín IoT veľmi populárny.
Pokiaľ ide o to, že Rebecca je na začiatku, údaje určite nie sú nové. Schopnosť ho spracovať a správne ho používať je skutočne miestom, kde sa odohrávajú zaujímavé veci. Dnes sme v rozhovore trochu hovorili o zdravotnej starostlivosti a my vidíme všetky druhy aplikácií, ktoré môžu ľudia robiť, ako je lepšia starostlivosť o pacientov, preventívna údržba, riadenie dodávateľského reťazca a prevádzková efektívnosť v zdravotníctve. A to už celkom prebieha a existuje veľa rôznych prípadov použitia. Ten, na ktorý sme tu v Statistike veľmi hrdí, je s našim zákazníkom Shire Biopharmaceuticals. A Shire vyrába špeciálne lieky pre skutočne ťažko liečiteľné choroby. A keď pre svojich zákazníkov vytvárajú dávku svojho lieku, je to mimoriadne nákladný proces a tento mimoriadne nákladný proces si vyžaduje aj čas. Keď vidíte, že výrobný proces je výzvou, zjednocujú sa všetky údaje, sú dostatočne flexibilné pri rôznych spôsoboch vkladania údajov do systému, overujú sa informácie a potom môžu byť prediktívne o tom, ako tomuto zákazníkovi pomáhame. A procesy, ktoré ťahali väčšinu informácií z našich výrobných systémov a samozrejme zariadení a senzorov, ktoré poháňajú tieto výrobné systémy. Je to vynikajúci prípad, keď sa spoločnosti vyhýbajú stratám a optimalizujú svoje výrobné procesy pomocou kombinácie údajov senzorov, údajov IoT a bežných údajov zo svojich procesov.
Takže viete, dobrý príklad toho, kde výroba a najmä high-tech výroba sú prínosom pre zdravotnícky priemysel okolo tohto druhu práce a údajov. Myslím, že mám pár ďalších bodov, ktoré by som chcel uviesť skôr, ako ich zabalím a vrátim ich Dezovi a Robinovi. Ale viete, myslím si, že táto myšlienka schopnosti posúvať analytiku kdekoľvek vo vašom prostredí je pre väčšinu spoločností mimoriadne dôležitá. Spojenie s tradičným formátom ETL-ing údajov zo zdrojov späť do centrálnych umiestnení bude mať vždy miesto vo vašej stratégii, ale nemala by byť vašou jedinou stratégiou. Dnes musíte k veciam pristupovať oveľa pružnejšie. Aby ste mohli uplatniť uvedené zabezpečenie, vyhnite sa zdaňovaniu vašej siete, aby ste mohli spravovať a filtrovať údaje tak, ako to prichádza od okraja, a určiť, ktoré údaje sa oplatí uchovávať z dlhodobého hľadiska, ktoré údaje sa oplatia pohybovať do našej siete alebo aké údaje je potrebné v čase vytvorenia analyzovať, aby sme mohli robiť najlepšie možné rozhodnutia. Tento analytický prístup všade a kdekoľvek je niečo, čo v spoločnosti Statistica berieme k srdcu a je to niečo, v čom sme veľmi zdatní. A ide o jednu z tých snímok, ktoré som už spomínal, schopnosť exportovať vaše modely do rôznych jazykov, aby sa mohli prispôsobiť a prispôsobiť platformám, na ktorých sa údaje vytvárajú. A potom samozrejme máme distribučné zariadenie pre tieto modely, čo je tiež niečo, čo prinášame k stolu a na čo sme veľmi nadšení. Myslím si, že dnešný rozhovor je taký, že ak skutočne uvažujeme o týchto údajoch, ktoré boli v našich systémoch už dosť dlho a chceli by sme nájsť konkurenčnú výhodu a inovatívny uhol na ich využitie, musíte použiť nejaká technológia, ktorá vám umožní vyhnúť sa niektorým z tých reštriktívnych modelov, ktoré sme používali v minulosti.
Opäť by som chcel zdôrazniť, že ak sa chystáte robiť IoT, myslím si, že musíte byť schopní to urobiť v jadre a priniesť údaje a porovnať ich s inými údajmi a vykonať svoju analýzu. Ale rovnako dôležitá alebo dokonca dôležitejšia je, že musíte mať túto flexibilitu, aby ste mohli analyzovať údaje a presunúť analytiku z centrálnej strany vašej architektúry na hranicu výhod, ktoré som spomenul. pred. To je trochu o tom, kto sme a čo robíme na trhu. A my sme nadšení IoT veľmi nadšení, myslíme si, že určite dospeje a všetci tu majú veľké príležitosti ovplyvniť svoje analytické a kritické procesy pomocou tohto typu údajov.
Rebecca Jozwiak: Shawn, ďakujem veľmi pekne, bola to skutočne fantastická prezentácia. A viem, že Dez pravdepodobne chce položiť pár otázok, takže Dez, nechám ťa ísť prvý.
Dez Blanchfield: Mám milión otázok, ale budem sa držať, pretože viem, že bude mať aj Robin. Jednou z vecí, ktoré vidím široko ďaleko, je otázka, ktorá sa objaví, a som naozaj rád, aby som získal nejaký prehľad o vašich skúsenostiach v tejto veci, pretože ste priamo v centre vecí. Organizácie zápasia s touto výzvou a zdá sa, že niektoré z nich si práve prečítali „Štvrtú priemyselnú revolúciu“ Klausa Schwaba a potom zažili panický útok. A tí, ktorí nie sú oboznámení s touto knihou, v podstate ide o pohľad pána pána Klausa Schwaba, o ktorom si myslím, že je profesor, ktorý je zakladateľom a výkonným predsedom Svetového ekonomického fóra z pamäte, a kniha je v podstate o tento všadeprítomný internet vecí, výbuch vecí a niektoré z vplyvov na svet všeobecne. Organizácie, s ktorými hovorím, si nie sú istí, či by mali ísť a vybaviť súčasné prostredie alebo investovať všetko do budovania nového prostredia, infraštruktúry a platforiem. Vidíte aj v spoločnosti Dell Statistica, ako ľudia modernizujú súčasné prostredie a nasadia vašu platformu do existujúcej infraštruktúry, alebo vidíte, ako sa zameriavajú na budovanie všetkej novej infraštruktúry a na túto záplavu?
Shawn Rogers: Viete, mali sme príležitosť slúžiť obidvom typom zákazníkov a byť na trhu, pokiaľ máme, tieto príležitosti získate tak, aby boli široké. Máme zákazníkov, ktorí za posledných pár rokov vytvorili úplne nové bájové závody a vybavili ich údajmi senzorov, IoT, analytikmi od začiatku do konca počas celého procesu. Musím však povedať, že väčšina našich zákazníkov sú ľudia, ktorí už nejaký čas pracujú, ale boli nútení tieto údaje ignorovať. Vieš, Rebecca urobila bod priamo vpredu - toto nie sú nové údaje, tento druh informácií je už veľmi dlho k dispozícii v mnohých rôznych formátoch, ale tam, kde bol problém, je jeho pripojenie, presunúť ho, priniesť ho niekde, kde by ste s tým mohli urobiť niečo inteligentné.
A tak by som povedal, že väčšina našich zákazníkov sa pozerá na to, čo dnes majú, a Dez, už ste to predtým zdôraznili, že je to súčasť revolúcie v oblasti veľkých dát a myslím si, že to, o čo vlastne ide, je to o všetkých dátová revolúcia, však? Už nemusíme ignorovať určité systémové údaje alebo výrobné údaje ani údaje z automatizácie budov, teraz máme správne hračky a nástroje, aby sme ich dostali a potom s nimi robili inteligentné veci. A myslím si, že v tomto priestore je veľa vodičov, ktorí to robia, a niektorí z nich sú technologickí. Ako viete, riešenia veľkých dátových infraštruktúr ako Hadoop a iné spôsobili, že pre niektorých z nás bolo trochu lacnejšie a trochu ľahšie premýšľať o vytvorení dátového jazera tohto typu informácií. A teraz sa rozhliadame po podniku, aby sme šli: „Hej, máme vo výrobnom procese analytiku, ale mohli by sa vylepšiť, keby sme z týchto procesov mohli získať nejaký prehľad?“ A to je, myslím si, čo najviac naši zákazníci to robia. Nie je to tak veľa od základov, ale rozširovanie a optimalizácia analytiky, ktorú už majú, s údajmi, ktoré sú pre nich nové.
Dez Blanchfield: Áno, v niektorých najväčších odvetviach, ktoré sme videli, prichádzajú niektoré zaujímavé veci, ktoré ste videli, a vy ste spomenuli silu a verejné služby. Letectvo práve prechádza týmto rozmachom, kde jedno z mojich najobľúbenejších zariadení, o ktorých pravidelne hovorím, Boeing 787 Dreamliner a určite ekvivalent Airbusu, A330 prešiel rovnakou cestou. V roku 787, keď bolo prvýkrát vydané, bolo asi šesť tisíc senzorov a myslím si, že v novej verzii hovoria o pätnástich tisíc senzoroch. A zvláštne na rozhovore s niektorými ľuďmi, ktorí sú v tomto svete, bolo to, že myšlienka umiestniť senzory do krídla a tak ďalej, a úžasná vec okolo 787 v dizajnovej platforme je, že viete, oni objavili všetko v lietadlo. Napríklad, keď krídla vzlietajú, krídla sa ohýbajú až do dvanástich a pol metra. Ale v extrémoch sa krídla môžu ohýbať na špičke až do 25 metrov. Táto vec vyzerá ako mávanie vtákov. Nemali však čas sa napraviť, bolo vypracovanie analýzy všetkých týchto údajov, takže majú senzory, ktoré spôsobujú, že LED diódy blikajú zelene a červeno, ak sa stane niečo zlé, ale v skutočnosti nekončia hlbokými informáciami o reálny čas. A tiež nevyriešili problém, ako posúvať objem údajov, pretože v domácom vzdušnom priestore v USA je denne 87 400 letov. Keď každé lietadlo doháňa svojimi odkúpeniami lietadiel typu Dreamliner 787, je to 43 petabajtov za deň, pretože tieto lietadlá v súčasnosti vytvárajú každý približne pol terabajtu údajov. A keď vynásobíte, že 87 400 letov denne na domácom trhu v USA bodom päť alebo pol terabajtu, skončíte so 43, 5 petabajtov údajov. Fyzicky to nemôžeme pohnúť. Takže podľa návrhu musíme analytiku vytlačiť do zariadenia.
Ale jedna z vecí, ktorá je zaujímavá, keď sa pozriem na túto celú architektúru - a ja by som rád videl, čo si o tom myslíte - je, že sme sa posunuli smerom k správe kmeňových dát, k akýmsi prvým zásadám správy údajov, k vytiahnutiu všetko do centrálneho umiestnenia. Máme dátové jazerá a potom vytvárame malé dátové nádrže, ak sa vám páči, výpisy z ktorých robíme analýzy, ale distribúciou na okraj jednej z vecí, ktoré neustále prichádzajú, najmä od databázových ľudí a správcov údajov. alebo ľudia v oblasti riadenia informácií, čo sa stane, keď mám veľa distribuovaných malých miniatúrnych dátových jazier? Aké veci sa použili na toto myslenie v súvislosti s analýzou okrajov vo vašom riešení, že v tradičnom prípade by všetko prichádzalo centrálne s dátovým jazerom, teraz končíme s týmito malými kalužami údajov všade, aj keď môžeme vykonajte na nich analýzu na miestnej úrovni, aby ste získali miestny prehľad, aké sú niektoré z výziev, ktorým ste čelili a ako ste to vyriešili, keď máte tento distribuovaný súbor údajov, a najmä keď získate mikrokozmy dátových jazier a distribuovaných oblastí?
Shawn Rogers: Myslím, že to je jedna z výziev, však? Keď ideme ďalej, viete, prepravujete všetky údaje späť do centra alebo do základného analytického príkladu, ktorý som uviedol, a potom urobíme distribuovanú verziu, že skončíte so všetkými týmito malými silami, že? Presne tak, ako ste to znázornili, však? Robia trochu práce, niektoré analytiky bežia, ale ako ich privediete späť k sebe? A myslím si, že kľúčom bude v tom všetkom orchestrácia a myslím si, že vy so mnou budete súhlasiť, ale som šťastný, ak tak neurobíte, že si myslím, že tento vývoj sledujeme celkom nejaký čas.
Vráťme sa do čias našich priateľov pán Inmon a pán Kimball, ktorí pomáhali všetkým s architektúrou ich počiatočných investícií do dátového skladu, s tým rozdielom, že sme sa od tohto centralizovaného modelu už dlho vzdali. Prijali sme túto novú myšlienku umožniť, aby údaje dokázali svoju závažnosť pre to, kde by sa mali najlepšie nachádzať vo vašom ekosystéme, a zarovnať údaje s najlepšou možnou platformou, aby sa dosiahol čo najlepší výsledok. A my sme začali, podľa môjho názoru, viac utrácaný prístup k nášmu ekosystému ako zastrešujúci spôsob, ako robiť veci, ako je to, kde sa snažíme všetky tieto kúsky vyrovnať naraz. Aký typ analýzy alebo práce budem robiť s údajmi, aký typ údajov to je, to pomôže určiť, kde by mali žiť. Kde sa údaje vyrábajú a aký druh závažnosti majú údaje?
Viete, vidíme veľa z týchto veľkých príkladov údajov, keď ľudia hovoria o tom, že majú 10 a 15-petabajtové dátové jazerá. Ak máte dátové jazero, ktoré je také veľké, je pre vás veľmi nepraktické ho presúvať, takže k nemu musíte byť schopní priniesť analytiku. Ale keď to urobíte, k jadru vašej otázky si myslím, že to prináša všetkým nové výzvy, aby všetci zvládli prostredie a uplatňovali správu a bezpečnosť, a pochopili, čo je potrebné urobiť s týmito údajmi, aby ich spravovali a aby získajte z toho najvyššiu hodnotu. A aby som bol k tebe úprimný - rád by som tu počul váš názor - myslím, že sme v prvých dňoch a myslím, že ešte treba urobiť veľa dobrej práce. Myslím si, že programy ako Štatistica sa zameriavajú na to, aby viac ľudí malo prístup k údajom. Určite sa zameriavame na tieto nové persony, ako napríklad vedec údajov o občanoch, ktorí chcú nasmerovať prediktívnu analýzu na miesta v rámci organizácie, ktoré predtým nemuseli byť. A myslím si, že to sú niektoré z prvých dní okolo tohto obdobia, ale myslím si, že arc splatnosti bude musieť preukázať vysokú úroveň alebo orchestráciu a vyrovnanie medzi týmito platformami a pochopenie toho, čo je na nich a prečo. A to je vekový problém pre všetkých ľudí, ktorí pracujú s údajmi.
Dez Blanchfield: V skutočnosti to je a ja s tým úplne súhlasím a myslím si, že skvelá vec, ktorú tu dnes počujeme, je prinajmenšom predný koniec problému so skutočným zaznamenávaním údajov, myslím, na úrovni brány na okraji. a schopnosť analytiky v tomto bode je v súčasnosti vyriešená. A teraz nás oslobodzuje, aby sme začali uvažovať o ďalšej výzve, ktorou sú distribuované dátové jazerá. Ďakujem vám za to, bola to fantastická prezentácia. Naozaj si vážim príležitosť s vami o tom hovoriť.
Teraz pôjdem na Robina, pretože viem, že má, a potom Rebecca má po Robinovi aj dlhý zoznam veľkých otázok od publika. Robin?
Robin Bloor: Dobre. Shawn, chcel by som, aby ste povedali trochu viac a nesnažím sa vám dať šancu inzerovať, ale v skutočnosti je to veľmi dôležité. Mám záujem o informácie o tom, v akom čase spoločnosť Statistica skutočne vygenerovala schopnosť exportu modelu. Ale tiež by som chcel, aby ste niečo povedali o Boomi, pretože všetko, čo ste doposiaľ povedali o Boomi, je to, že je to ETL a skutočne je to ETL. Ale v skutočnosti je celkom schopný ETL a pre také druhy načasovania, o ktorých hovoríme, a o niektorých situáciách, o ktorých tu diskutujeme, je to veľmi dôležitá vec. Mohli by ste mi povedať tieto dve veci?
Shawn Rogers: Jasne, áno, určite môžem. Náš pohyb týmto smerom bol určite opakujúci sa a bol to druh postupu krok za krokom. Tento týždeň sa chystáme na spustenie verzie 13.2 programu Statistica. A obsahuje najnovšie aktualizácie všetkých funkcií, o ktorých dnes hovoríme. Ale späť k verzii 13, pred rokom v októbri, sme oznámili našu schopnosť exportovať modely z našej platformy a vtedy sme to nazvali NDAA. Skratka predstavuje Native Distributed Analytics Architecture. Urobili sme veľa času, energie a sústredili sme sa na otvorenie našej platformy s možnosťou využiť ju ako centrálne veliteľské centrum pre vašu pokročilú analytiku, ale tiež na nasadenie odtiaľ. A prvé miesta, Robin, ktoré sme nasadili, sme urobili skutočne, naozaj skvelý doplnok k platforme okolo strojového učenia. A tak sme mali možnosť nasadiť zo Statistiky do Azure Cloud od Microsoftu, aby sme využili silu Azure na výučbu strojového zariadenia, ako viete, je veľmi intenzívna a je to skvelý spôsob, ako využiť cloudové technológie. A tak to bol prvý kúsok.
Teraz sme vyvážali naše modely do Azure a pomocou Azure ich spúšťali a potom posielali dáta alebo výsledky späť na platformu Statistica. A potom sme sa presunuli do iných jazykov, z ktorých sme chceli byť schopní exportovať, a samozrejme jedným z nich je Java, ktorý nám otvára dvere, aby sme mohli začať exportovať naše modely von na iné miesta, ako je napríklad Hadoop, takže to dalo hráme tam aj my.
Nakoniec sme sa zamerali na to, aby sme mohli s týmto vydaním preniesť naše modely do databáz. A tak to bola prvá iterácia a aby som bol k vám úprimný, posledná hra bola IoT, minulý rok v októbri sme však ešte neboli s verziou 13. Od tej doby sme sa tam dostali a to súvisí so schopnosťou robiť všetky veci, ktoré som práve spomenul, ale potom mať nejaké prepravné zariadenie. A keď sa vrátime k Dezovej otázke, viete, aká je výzva a ako to urobíme, keď budeme mať všetky tieto analytiky k dispozícii? Používame Boomi ako druh distribučného uzla a preto, pretože je v cloude a pretože je taký výkonný, ako som už spomenul, ide o platformu na integráciu údajov, ale je to aj platforma na integráciu aplikácií a používa JVM, aby nám to umožnila zaparkovať a pracovať kdekoľvek, kde môžete pristátie virtuálneho počítača Java. To je to, čo skutočne otvorilo dvere pre všetky tieto brány a okrajové počítačové platformy a okrajové servery, pretože všetky majú počítač a platformu, ktorá je k dispozícii na spustenie JVM. A pretože môžeme JVM prevádzkovať kdekoľvek, Boomi sa obrátila byť úžasnou distribúciou a pomocou môjho slova z predchádzajúcich, orchestračným zariadením.
A je to naozaj dôležité, pretože všetci vieme, myslím si, že scenár lietadla pred chvíľou bol vynikajúci, a spomenul som, viete, výrobcovia ako Shire, ktorí majú v jednej zo svojich tovární desaťtisíc senzorov. v určitom okamihu musia začať riešiť druh centrálneho prístupu k pokročilej analytike. Byť ad hoc o tom už viac nefunguje. Bývalo to, keď objem modelov a algoritmov, ktoré sme používali, bol minimálny, ale teraz je maximálny. V organizácii sú ich tisíce. Takže máme, časť našej platformy je založená na serveroch a keď máte náš podnikový softvér, máte tiež možnosť vyladiť a skóre a spravovať svoje modely v celom prostredí. A to je tiež súčasť tej orchestračnej veci. Potrebovali sme vrstvu, Robin, na mieste, ktorá vám nielen umožnila dostať model na prvom mieste, ale tiež vám poskytla pomôcku na vyladenie modelov a ich priebežné nahrádzanie tak často, ako ste potrebovali, pretože to nie je niečo, čo môžete urobiť ručne. Nemôžete chodiť po rafinérii s palcovou jednotkou, ktorá sa pokúša odovzdať modely do brán. Medzi tým musíte mať dopravný a riadiaci systém, takže kombinácia Statistica a Boomi to dáva našim zákazníkom.
Robin Bloor: Áno. Budem veľmi stručný, ale viete, toto vyhlásenie, ktoré bolo urobené predtým, o dátovom jazere a myšlienke akumulácie petabytov na akomkoľvek danom mieste a skutočnosti, že má gravitáciu. Viete, keď ste začali hovoriť o orchestrácii, začalo ma to myslieť na veľmi jednoduchý fakt, že viete, dátové jazero, ktoré je na jednom mieste veľmi veľké, pravdepodobne znamená, že ho musíte skutočne zálohovať a pravdepodobne to znamená, že napriek tomu musíte presunúť veľa údajov. Vieš, architektúra skutočných údajov je podľa môjho názoru oveľa viac, v smere, o ktorom hovoríte. To je to, čo by som mal rozdeliť na rozumné miesta. A zdá sa, že na to máte veľmi dobrú schopnosť. Myslím tým, že som o Boomi dobre informovaný, takže je tak či tak či onak takmer nespravodlivé, že to vidím a možno publikum nemôže. Podľa môjho názoru je však Boomi nevyhnutná z hľadiska toho, čo robíte, pretože má aplikačné schopnosti. A tiež preto, že pravdou je, že tieto analytické výpočty nerobíte bez toho, aby ste z nejakého dôvodu chceli niečo konať. A Boomi v tom zohráva úlohu, však?
Shawn Rogers: Áno, určite. A ako viete z predchádzajúcich rozhovorov, spoločnosť Statistica má v sebe zabudovaný mechanizmus obchodných pravidiel. A myslím si, že je to skutočne dôležité, keď sa dostaneme k tomu, prečo to robíme. Viete, žartoval som dopredu, že v skutočnosti nie je dôvod robiť IoT vôbec, pokiaľ nebudete analyzovať, využívať údaje na lepšie rozhodovanie alebo konať. A tak sme sa nezameriavali iba na to, aby sme model umiestnili tam, ale aby sme ho mohli označiť spolu so súpravou pravidiel. A pretože Boomi je tak robustná, pokiaľ ide o jej schopnosti presúvať veci z jedného miesta na druhé, do atómu Boomi môžeme vložiť aj schopnosť spúšťať, varovať a konať.
A tak začíname získavať taký sofistikovaný pohľad na dáta internetu vecí, kde hovoríme: „Dobre, tieto dáta sa oplatí počúvať.“ Ale skutočne viete, viete, že „svetlo svieti, svetlo svieti, svetlo svieti, svetlo svieti “nie je také zaujímavé, ako keď zhasne svetlo alebo keď zhasne detektor dymu alebo keď sa stane čokoľvek, čo sa stane s naším výrobným procesom. Keď k tomu dôjde, chceme byť schopní okamžite konať. A údaje sa v tomto bode stávajú takmer sekundárnymi. Pretože to nie je také dôležité, aby sme ich všetky zachránili, „je to v poriadku, je to v poriadku, je to v poriadku“. Dôležité je, že si všimneme „Ahoj, je to zlé“ a prijali sme okamžité opatrenia. Či už ide o posielanie e-mailov niekomu, alebo sa môžeme zapojiť do expertízy v oblasti domén, alebo či sme odložili rad ďalších procesov, aby sme okamžite podnikli kroky, či už sú nápravné alebo reagujú na informácie. A myslím si, že preto musíte mať na to tento organizovaný pohľad. Nemôžete sa len sústrediť na riešenie svojich algoritmov všade. Musíte byť schopní ich koordinovať a organizovať. Musíte vedieť, ako sa darí. A čo je najdôležitejšie, myslím tým, prečo by si to sakra urobil, ak nemôžete pridať príležitosť podniknúť okamžité kroky proti údajom?
Robin Bloor: Dobre, Rebecca, myslím, že máte otázky od publika?
Rebecca Jozwiak: Áno . Mám veľa otázok pre divákov. Shawn, viem, že si sa nechcel príliš dlho zdržiavať po špičke. Co si myslis?
Shawn Rogers: Som šťastný. Do toho. Môžem na pár odpovedať.
Rebecca Jozwiak: Pozrime sa. Viem, že jednou z vecí, ktoré ste spomenuli, bolo to, že internet vecí je v prvých dňoch a že má určitú mieru zrelosti, ktorá sa musí uskutočniť, a je to druh rozhovoru k tejto otázke, ktorú položil jeden účastník. Ak bude rámec IPv6 dostatočne robustný na to, aby sa prispôsobil rastu internetu vecí v nasledujúcich piatich alebo desiatich rokoch?
Shawn Rogers: Och, nechám Deza odraziť od mojej odpovede, pretože si myslím, že je bližšie k tomuto typu informácií, ktoré som. Ale vždy som si myslel, že sme na veľmi rýchlej ceste, aby sme ohli a zlomili väčšinu rámcov, ktoré máme zavedené. A aj keď si myslím, že pridanie tohto nového druhu špecifikácie alebo smeru, ktorým ideme s rámcami IPv6, je dôležité a otvára sa nám dvere, aby sme mali oveľa viac zariadení a mohli sme dať všetko, čo môžeme chcete dať adresu. Myslím si, že všetko, čo čítam a vidím so svojimi zákazníkmi, a počet požadovaných adries, si myslím, že v určitom okamihu spôsobí ďalší posun v tejto krajine. Ale nie som naozaj odborník na vytváranie sietí, takže nemôžem povedať sto percent, že ho v určitom okamihu zlomíme. Moja skúsenosť mi však hovorí, že tento model niekedy narušíme.
Rebecca Jozwiak: Nebol by som prekvapený. Myslím si, že rámce sa prelomia pod záťažou všetkého druhu. A to je len logické, však? Chcem tým povedať, že nemôžete poslať e-mail s písacím strojom. Ďalší účastník sa pýta: „Môžete použiť rámec Hadoop?“ Myslím, že by som to však mohol zmeniť a povedať, ako by ste použili rámec Hadoop pre distribuovanú analytiku?
Shawn Rogers: No, Robin mi urobil priazeň, keď sa ma opýtal na historickú otázku, a tak od verzie 13 asi pred rokom pre Statisticu sme mali možnosť vytlačiť modely z nášho systému a do Hadoopu. A veľmi úzko spolupracujeme so všetkými veľkými príchuťami Hadoop. Máme naozaj veľké úspechy týkajúce sa schopnosti pracovať so spoločnosťou Cloudera ako jednej z hlavných distribúcií spoločnosti Hadoop, s ktorou pracujeme. Pretože však dokážeme produkovať v jazyku Java, dáva nám túto schopnosť byť otvorený a umiestniť našu analýzu kdekoľvek. Ich umiestnenie do klastra Hadoop je pre mnohých našich zákazníkov normálnym, pravidelným a každodenným spôsobom. Krátka odpoveď je áno.
Rebecca Jozwiak: Výborne. A ja na teba hodím ešte jednu a nechám ťa pokračovať v dovolenke. Ďalší účastník žiada, s IoT analytics plus strojovým učením, myslíte si, že všetky údaje musia byť uložené na historické účely a ako to ovplyvní architektúru riešenia?
Shawn Rogers: Nemyslím si, že všetky údaje musia byť uložené. Myslím si však, že je veľmi zaujímavé mať možnosť zabávať sa, počúvať akýkoľvek zdroj údajov, ktorý chceme v našej organizácii, odkiaľkoľvek pochádza. A myslím si, že zmeny, ktoré sme zaznamenali na trhu v posledných rokoch, nám umožnili zaujať prístup založený na všetkých údajoch a zdá sa, že sa to skutočne vyplatí. Bude to však odlišné pre každú spoločnosť a každý prípad použitia. Viete, keď sa pozeráme na zdravotné údaje, teraz je tu veľa regulačných problémov, veľa problémov s dodržiavaním predpisov, ktoré je potrebné znepokojovať, a to nás vedie k ukladaniu údajov, ktoré ostatné spoločnosti nemusia pochopiť, prečo je potrebné ich ukladať, správne ? Vo výrobných procesoch je pre mnohých našich výrobných zákazníkov skutočná výhoda, aby mohli svoje procesy historicky preveriť a mohli sa obzrieť späť na veľké množstvo týchto údajov, aby sa z nich poučili a aby z nich vytvorili lepšie modely.
Myslím si, že bude treba uchovávať veľa údajov, a myslím si, že máme riešenia, ktoré dnes robia ekonomickejšie a škálovateľnejšie. Zároveň si však myslím, že každá spoločnosť nájde hodnotu v údajoch, ktoré nemusia uchovávať na atómovej úrovni, ale budú chcieť analyzovať v reálnom čase a robiť rozhodnutia, aby podporili inovácie v rámci ich spoločnosť.
Rebecca Jozwiak: Dobre, dobre. Nie, publikum, dnes som sa nedostal na otázky všetkých, ale pošlem ich spolu s Shawnom, aby vás mohol priamo osloviť a odpovedať na tieto otázky. Ďakujem vám všetkým za účasť. Ďakujem Shawn Rogersovi zo spoločnosti Dell Statistica a všetkým našim analytikom, Dezovi Blanchfieldovi a Dr. Robinovi Bloorovi. Archív nájdete tu na stránke insideanalysis.com, SlideShare. Začíname to znova vkladať a my vylepšujeme naše YouTube, takže to tiež hľadajte. Vďaka toľko ľudí. A s tým sa rozlúčim a uvidíme sa nabudúce.