Domov audio Využitie ohniska: získanie obchodnej hodnoty pomocou streamovacej analýzy: prepis webinára

Využitie ohniska: získanie obchodnej hodnoty pomocou streamovacej analýzy: prepis webinára

Anonim

Od zamestnancov Techopedia, 24. februára 2016

Jedlo s sebou: Hostiteľka Rebecca Jozwiak diskutuje o analytike streamovania s najlepšími odborníkmi v tomto odbore.

Momentálne nie ste prihlásení. Ak chcete vidieť video, prihláste sa alebo sa zaregistrujte.

Rebecca Jozwiak: Dámy a páni, ahoj a vitajte v Hot Technologies roku 2016! Dnešný titul je „Využívanie Firehose: Získanie obchodnej hodnoty zo streamovacieho nástroja Analytics“. Toto je Rebecca Jozwiak. Som druhým veliteľom hostiteľa webového vysielania vždy, keď tu nemôže byť náš drahý Eric Kavanagh, takže je pekné vidieť tam dnes tak veľa z vás.

Táto epizóda sa trochu líši od našich ostatných. Rozprávali sme sa o tom, čo je horúce, a tento rok je, samozrejme, horúco. Posledných niekoľko rokov bolo horúcich. Vždy prichádzajú nové veci. Dnes hovoríme o streamovacej analýze. Analytika streamovania je sama osebe úplne nová. Streamovanie, stredové údaje, údaje RFID samozrejme nie sú nevyhnutne nové. Ale v súvislosti s dátovými architektúrami sme sa už desaťročia sústredili na údaje v pokoji. Databázy, systémy súborov, archívy údajov - všetko za účelom hlavne hromadného spracovania. Teraz však s prechodom na vytváranie hodnôt zo streamovaných údajov, dátových emócií, niektorí to nazývajú živé toky, skutočne vyžadujú architektúru založenú na toku, nie architektúru dát v pokoji, na ktorú sme boli zvyknutí, a musí byť schopná zvládnutie rýchleho príjmu, spracovanie v reálnom čase alebo takmer v reálnom čase. Musí byť schopný postarať sa nielen o internet vecí, ale aj o internet všetkého.

V ideálnom prípade by samozrejme bolo príjemné, keby obidve architektúry bývali bok po boku, jedna ruka si tak druhou umývala. Aj keď dni staré údaje, údaje staré týždne, údaje staré roky majú samozrejme hodnotu, historickú analýzu, analýzu trendov, práve tieto údaje sú hnacou silou živej inteligencie v súčasnosti a preto je tak dôležitá streamovacia analýza.

Dnes o tom hovorím viac. Máme nášho vedca údajov Dez Blanchfielda, ktorý volá z Austrálie. Práve pre neho je skoro ráno. Máme nášho hlavného analytika, Dr. Robina Bloora. Pripojili sme sa k Anand Venugopal, produktovej hlave spoločnosti StreamAnalytix v spoločnosti Impetus Technologies. Sú naozaj zamerané na analytické aspekty tohto priestoru.

S týmto idem pokračovať a odovzdať ho Dezovi.

Dez Blanchfield: Ďakujem. Musím sa chytiť ovládania obrazovky a vyskočiť dopredu.

Rebecca Jozwiak: Tu máš.

Dez Blanchfield: Zatiaľ čo schmatávame snímky, dovoľte mi, aby som sa venoval iba hlavnej téme.

Budem si to udržiavať na pomerne vysokej úrovni a nechám to zhruba 10 minút. Toto je veľmi veľká téma. Zúčastnil som sa na udalosti, kde sme strávili dva až tri dni potápaním sa v detailoch o tom, čo je spracovanie toku a o súčasných rámcoch, ktoré vyvíjame, a čo by malo znamenať analytické spracovanie v týchto veľkoobjemových tokoch.

Chceme objasniť, čo tým myslíme, streamovaním analytických údajov a potom sa ponoriť do toho, či je možné odvodiť obchodnú hodnotu, pretože práve to podniky skutočne hľadajú. Chcú, aby im ľudia veľmi rýchlo a stručne vysvetlili, kde môžem odvodiť hodnotu aplikovaním nejakej formy analýzy na naše údaje o streame?

Čo je to streamovacia analytika?

Analytika streamovania poskytuje organizáciám spôsob, ako extrahovať hodnotu z veľkoobjemových a vysokorýchlostných údajov, ktoré prešli podnikom v rôznych formách v pohybe. Významný rozdiel tu spočíva v tom, že sme mali dlhú históriu vývoja analytiky a šošoviek a pohľadov na údaje, ktoré sme od vynájdenia mainframe spracovávali už celé desaťročia. Masívny posun paradigmy, ktorý sme za posledné tri až päť rokov zaznamenali pri tzv. Webovom meradle, spočíva v prenose údajov prichádzajúcich do nás v reálnom čase alebo takmer v reálnom čase, a nielen pri spracovaní a hľadaní korelácie udalostí alebo udalosti sa spúšťajú, ale vykonávajú veľmi podrobnú a podrobnú analýzu týchto prúdov. Je to významný posun k tomu, čo sme predtým robili, a ktorý buď zhromažďuje údaje, vkladá ich do nejakého úložiska, v súčasnosti tradične veľké databázy, veľké veľké dátové rámce, ako je platforma Hadoop, a vykonáva na tom dávkové spracovanie a získava nejaký prehľad.

Robíme to veľmi dobre a veľmi rýchlo sa snažíme robiť veľa ťažkého železa. Stále však zaznamenávame údaje, ukladáme a potom na ne pozeráme a získame k nim nejaké informácie alebo analýzy. Posun k vykonávaniu týchto analytických údajov, keď sa údaje prenášajú, bol veľmi novou a vzrušujúcou oblasťou rastu pre typy vecí, ktoré sa dejú okolo veľkých údajov. Vyžaduje si úplne odlišný prístup k zachytávaniu, ukladaniu a spracovávaniu a analýze údajov.

Jedným z kľúčových faktorov posunu a zamerania sa na vykonávanie analýzy v streame je to, že môžete získať významnú obchodnú hodnotu tým, že získate tieto informácie rýchlejšie a ľahšie, pretože údaje sa k vám dostávajú, pretože informácie sa sprístupňujú podniku. Myšlienka vykonávať spracovanie na konci dňa už nie je v niektorých odvetviach relevantná. Chceme byť schopní robiť analytiku za chodu. Na konci dňa už vieme, čo sa stalo tak, ako sa stalo, skôr ako sa dostať na koniec dňa a robiť 24 hodinovú dávkovú prácu a získať tieto informácie.

Analytika streamingu spočíva v tom, že sa priamo do tohto toku pritiahne, zatiaľ čo toky údajov sú zvyčajne viacnásobné toky veľmi veľkých objemov údajov a údajov prichádzajúcich k nám, ktoré sa pohybujú veľmi rýchlo, veľmi rýchlo, a získavanie poznatkov alebo analýz o týchto tokoch, keď k nám prichádzajú na rozdiel aby sme to mohli odpočívať a analyzovať ich.

Ako som už spomínal, vykonávali sme to, čo nazývam dávková analýza, desaťročia a desaťročia. Dal som tu naozaj skvelý obrázok. Toto je obrázok džentlmena stojaceho pred zosmiešňovaným počítačom, ktorý vytvorila spoločnosť RAND Corporation už pred celým životom, a takto vyzerali počítače v dome. Zaujímavé je, že aj potom mali tento koncept všetkých týchto malých číselníkov a tieto číselníky predstavovali informácie prichádzajúce z domu a spracovávané v reálnom čase a hovoriace o tom, čo sa deje. Jednoduchým príkladom je sada barometrického tlaku a teploty, ktorú môžeme vidieť, kde vidíme, čo sa deje v reálnom čase. Ale predstavujem si, že dokonca aj vtedy, keď spoločnosť RAND Corporation dala dohromady ten malý model, v skutočnosti už premýšľali o spracovaní údajov a vykonávaní analytických analýz, keď sa to deje vo formáte stream. Nie som si úplne istý, prečo na počítač umiestnili volant, ale to je celkom v pohode.

Od vynálezu tlačiarne sme mali prehľad o zachytávaní údajov a vykonaní dávkovej analýzy. Ako som už povedal s veľkým posunom a videli sme to od mien hráčov z webového rozsahu, ktorých všetci vieme, sú to všetky značky domácnosti, ako sú Twitter, Facebook a LinkedIn, to interaktívne správanie, ktoré máme s tými sociálnymi Platformy nevyžadujú len zachytávanie, ukladanie a následné spracovanie v dávkovom režime, ale vlastne zachytávajú a poháňajú analytiku za behu z prúdov údajov prechádzajúcich cez. Keď niečo pípam, nielenže musia zachytiť a uložiť a urobiť niečo neskôr, ale tiež musia byť schopní dať ho okamžite späť do môjho streamu a zdieľať ho s ostatnými ľuďmi, ktorí ma sledujú. Toto je model dávkového spracovania.

Prečo by sme mali ísť touto cestou? Prečo by organizácie investovali čas, úsilie a peniaze, dokonca aj pri zvažovaní problému úsilia zameraného na analýzu prúdových tokov? Organizácie majú túto obrovskú túžbu dosiahnuť zvýšenie výkonnosti oproti svojim konkurentom v odvetviach, v ktorých sa nachádzajú, a že zvýšenie výkonnosti sa dá rýchlo implementovať pomocou jednoduchej analýzy prúdov a môže začať jednoduchým sledovaním údajov v reálnom čase, ktoré už máme oboznámený s. Dostal som tam malú snímku obrazovky služby Google Analytics. Pravdepodobne je to prvýkrát, keď sme skutočne dostali praktickú analytiku pre spotrebiteľa. Takže keď ľudia navštevovali vaše webové stránky a vy ste počítať s počtom zásahov, s malým kúskom JavaScriptu v dolnej časti vašej webovej stránky vo formáte HTML vloženým na vašom webe sa tieto malé kódy vyrábali v reálnom čase späť do spoločnosti Google a boli vykonávajú analýzu údajov o tokoch údajov prichádzajúcich zo všetkých stránok na vašom webe, každého objektu na vašom webe v reálnom čase a odosielajú vám ich späť na tejto skutočne roztomilej webovej stránke v informačnom paneli grafu v reálnom čase, roztomilých histogramov a čiarový graf znázorňujúci X počet ľudí, ktorí sa na vašu stránku dostali historicky, ale tu je ich veľa.

Ako vidíte na tejto snímke obrazovky, práve teraz sa hovorí 25. To je teraz 25 ľudí v čase, keď sa na tejto stránke nachádzali snímky obrazovky. Toto je prvá skutočná šanca, ktorú sme hrali s analytickým nástrojom pre spotrebiteľa. Myslím, že to veľa ľudí naozaj pochopilo. Chápali iba silu vedieť, čo sa deje a ako na ne môžu reagovať. Keď uvažujeme o rozsahu avioniky, lietajúcich lietadlách, je v USA iba 18 700 domácich letov denne. Pred časom som čítal noviny - to bolo asi pred šiestimi alebo siedmimi rokmi - že množstvo údajov, ktoré tieto lietadlá produkovali, bolo v starom strojárskom modeli asi 200 až 300 megabajtov. V dnešných konštrukciách lietadiel tieto lietadlá produkujú približne 500 gigabajtov údajov alebo približne pol terabajtov údajov za let.

Keď matematiku robíte veľmi rýchlo z hlavy, 18 800 domácich letov každých 24 hodín len v americkom vzdušnom priestore, ak všetky moderné lietadlá produkujú asi pol terabajtu, je to 43 až 44 petabajtov údajov, ktoré prichádzajú a Deje sa to, keď sú lietadlá vo vzduchu. Stáva sa to, keď pristávajú a robia skládky údajov. To je, keď idú do obchodu a majú úplný výpis údajov od inžinierskych tímov, aby sa pozreli na to, čo sa deje v ložiskách, kolesách a vo vnútri motorov. Niektoré z týchto údajov sa musia spracovať v reálnom čase, aby sa mohli rozhodnúť, či existuje skutočný problém, keď bolo lietadlo vo vzduchu alebo keď bolo na zemi. To jednoducho nemôžete urobiť v dávkovom režime. V iných odvetviach, ktoré tu vidíme okolo financií, zdravotníctva, výroby a strojárstva, sa tiež pozerajú na to, ako sa môžu dostať týmto novým pohľadom na to, čo sa deje v reálnom čase, na rozdiel od toho, čo sa práve ukladá do databáz na termín.

Existuje aj táto koncepcia zaobchádzania s údajmi ako s tým, čo nazývam rýchlo sa kaziacim tovarom alebo komoditou podliehajúcou skaze - že veľa údajov časom stráca hodnotu. To je stále viac prípad aplikácií pre mobilitu a nástrojov sociálnych médií, pretože to, na čo ľudia hovoria a čo je teraz trendom, je to, na čo chcete reagovať. Keď premýšľate o iných častiach nášho života v oblasti logistiky a prepravy potravín, rozumieme v tomto zmysle pojem komodita podliehajúca skaze. Zamyslite sa však nad údajmi, ktoré prechádzajú vašou organizáciou, a s hodnotou, ktorú má. Ak s vami niekto práve obchoduje a môžete s ním komunikovať v reálnom čase, nechcete čakať ani hodinu, aby mohli byť údaje zachytené a vložené do systému, ako je Hadoop, a potom stlačte toto tlačidlo, teraz to nebudeme schopní vyriešiť a chcete to urobiť okamžite na žiadosť klienta. Existuje výraz, v ktorom sa teraz veľa objavíte, keď ľudia hovoria o tom, že majú k dispozícii tento prúd údajov v reálnom čase, ktorý vám môže poskytnúť personalizáciu, a túto melódiu prispôsobenia v systéme, ktorý používate, podľa vašich individuálnych skúseností. Ak napríklad narazíte na nástroj, napríklad na nástroj na vyhľadávanie Google, ak urobím dopyt a urobíte rovnaký dotaz, nezískame vždy rovnaké údaje. V podstate dostaneme to, čo hovorím ako celebrity. Zaobchádzam s jednorazovým opatrením. Svoju osobnú verziu udalostí v týchto systémoch dostávam na základe profilov a údajov, ktoré o mne zhromaždili, a v reálnom čase som bol schopný v streame robiť analýzu.

Táto myšlienka, že údaje sú komoditou podliehajúcou skaze, je v súčasnosti skutočnou vecou a hodnota údajov, ktoré sa časom znižujú, je niečo, s čím sa musíme dnes vysporiadať. Nie je to včerajšia vec. Páči sa mi tento obrázok medveďa, ktorý chytil lososa, ktorý vyskočil z rieky, pretože skutočne maľuje presne to, čo vidím v streamovacej analýze. Je to táto masívna rieka dát prichádzajúcich k nám, ohnivá oheň, ak chcete, a medveď sedí uprostred potoka. Vykoná analýzu v reálnom čase o tom, čo sa deje okolo nej, takže dokáže skutočne navrhnúť svoju schopnosť zachytiť tieto ryby vo vzduchu. Nie je to ako len ponoriť sa do potoka a chytiť ho. Táto vec skočí do vzduchu a musí byť na správnom mieste v pravý čas, aby chytila ​​tieto ryby. Inak nedostane raňajky alebo obedy.

Organizácia chce so svojimi údajmi urobiť to isté. Chcú extrahovať hodnotu z dnešných obrovských objemov dát v pohybe. Chcú vykonávať analýzu týchto údajov a údajov o vysokej rýchlosti, takže to nie je len množstvo údajov, ktoré k nám prichádzajú, ale je to rýchlosť, ktorou z toho prichádzajú. Napríklad z hľadiska zabezpečenia sú to všetky vaše smerovače, prepínače, servery, brány firewall a všetky udalosti, ktoré prichádzajú z týchto zariadení, a desiatky tisíc, ak nie stovky tisíc zariadení, v niektorých prípadoch ide o rýchlo sa kaziace údaje. Keď o tom premýšľame na internete vecí a priemyselnom internete, hovoríme o miliónoch, ak nie miliardách senzorov, a keďže údaje prechádzajú analytickými analýzami, teraz sa zaoberáme komplexným spracovaním udalostí. s veľkosťou a rýchlosťou, akú sme nikdy predtým nevideli, a dnes sa s tým musíme vysporiadať. Okolo toho musíme stavať nástroje a systémy. Je to skutočná výzva pre organizácie, pretože na jednej strane máme veľmi veľké značky, ktoré robia prácu pre domácich majstrov, piecť sami, keď majú kapacitu na to a súbor zručností a inžinierstvo. Ale pre priemernú organizáciu to tak nie je. Nemajú sady zručností. Nemajú kapacitu ani čas ani peniaze na to, aby na to prišli. Všetci sa zameriavajú na tento koncept rozhodovania v reálnom čase.

Použite prípady, s ktorými som sa stretol, a vyskytujú sa v každom širokom spektre všetkých odvetví, ktoré si viete predstaviť. Ľudia si sadnú a venujú pozornosť a hovoria: Ako použijeme nejakú analýzu údajov o našich streamoch? Hovoríme o online službách online. Existujú tradičné platformy sociálnych médií a online e-tailing a maloobchod - napríklad aplikácie. Všetci sa snažia dať nám tento celebrity zážitok v reálnom čase. Keď sa však dostaneme k ďalším službám v oblasti technológií, telefónnym službám, hlasu a videa, vidím ľudí, ktorí chodia okolo telefónov FaceTime. Je to len vybuchujúce. Znepokojuje ma to, že ľudia držia telefón pred nimi a rozprávajú sa s videozáznamom priateľa na rozdiel od toho, aby ho držali pri uchu. Vedia však, že to dokážu a prispôsobili sa im a táto skúsenosť sa im páčila. Vývoj týchto aplikácií a platforiem, ktoré ich poskytujú, musia vykonávať analytiku v reálnom čase na tejto premávke a na profiloch premávky, aby mohli robiť jednoduché veci, ako napríklad smerovanie tohto videa dokonale tak, aby kvalita hlasu v video, ktoré dostanete, je dostatočné na získanie dobrého zážitku. Nemôžete dávkové spracovanie tohto druhu údajov. Z videostreamu v reálnom čase by sa tak nestala funkčná služba.

Vo finančných transakciách je výzva v oblasti správy. Nie je v poriadku dostať sa na koniec dňa a zistiť, že ste porušili zákon a presunuli súkromné ​​údaje po celom svete. V Austrálii máme veľmi zaujímavú výzvu, keď presun údajov týkajúcich sa súkromia mimo pobrežia nie je. Nemôžete si vziať môj PID, moje osobné osobné identifikačné údaje, mimo pobrežia. V Austrálii existujú zákony, ktoré tomu zabránia. Poskytovatelia finančných služieb, najmä vládne služby a agentúry, musia so mnou robiť prúdové analýzy údajov a pokyny, aby sa ubezpečili, že to, čo mi poskytujú, neopúšťa pobrežie. Všetky veci musia zostať na mieste. Musia to urobiť v reálnom čase. Nemôžu porušiť zákon a požiadať o odpustenie neskôr. Detekcia podvodov - je celkom zrejmé, že sa o transakciách s kreditnými kartami dopočujeme. Ale keďže sa typy transakcií, ktoré robíme vo finančných službách, veľmi, veľmi rýchlo menia, existujú rôzne veci, ktoré PayPal robí hneď teraz pri zisťovaní podvodov v reálnom čase, keď sa peniaze nepohybujú z jednej veci na druhú, ale sú finančná transakcia medzi systémami. Platformy ponúkajúce eBay, zisťovanie podvodov, sa musia robiť v reálnom čase v streamingovej kancelárii.

V súčasnosti prebieha trend smerujúci k vykonávaniu ťažby a transformácie zaťažovacej aktivity v tokoch, takže nechceme zachytiť nič, čo bude smerovať do prúdu. To naozaj nemôžeme urobiť. Ľudia sa dozvedeli, že ak chceme zachytiť všetko, údaje sa veľmi rýchlo zlomia. Trik teraz spočíva v tom, že v týchto tokoch vykonáme analýzu a urobíme na nej ETL a len zachytíme to, čo potrebujete, prípadne metadáta, a potom nasmerujeme prediktívnu analýzu, kde môžeme skutočne povedať, čo sa bude diať o niečo ďalej dolu cestou, na ktorej Práve som videl v streame na základe analýzy, ktorú sme vykonali.

Poskytovatelia energie a služieb zažívajú túto obrovskú túžbu spotrebiteľov mať stanovenú cenu. Mohol by som sa rozhodnúť, že chcem kúpiť zelenú energiu v konkrétny čas dňa, pretože som len doma sám a nepoužívam veľa zariadení. Ale ak budem mať večernú párty, možno budem chcieť mať zapnuté všetky svoje zariadenia a nechcem kupovať lacnú energiu a čakať na jej doručenie, ale ochotný zaplatiť za ďalšie náklady, aby ju získal. K tomuto cenovému dopytu, najmä v oblasti verejných služieb a energetiky, už došlo. Napríklad Uber je klasickým príkladom vecí, ktoré môžete robiť každý deň, a to všetko na základe ceny dopytu. Existuje niekoľko klasických príkladov, ako ľudia v Austrálii získavajú cestovné v hodnote 10 000 dolárov z dôvodu obrovského dopytu na Silvestra. Som si istý, že sa týmto problémom zaoberali, ale analýza prúdu sa vykonáva v reálnom čase, zatiaľ čo v aute vám hovorí, koľko by som mal zaplatiť.

Internet vecí a toky senzorov - v tejto oblasti sme iba poškriabali povrch a skutočne sme práve viedli základnú konverzáciu, ale uvidíme zaujímavý posun v tom, ako sa s tým technológia vysporiada, pretože keď nehovoríte iba asi tisíce alebo desiatky tisícov, ale stovky tisíc a potenciálne miliardy zariadení, ktoré sa vám streamujú, takmer žiadny zo stohov technológie, ktoré máme teraz, nie je navrhnutý tak, aby sa s tým vysporiadal.

Existuje niekoľko skutočne horúcich tém, ktoré uvidíme všade, ako je bezpečnosť a riziko počítačov. Sú to pre nás veľmi skutočné výzvy. Na webe je skutočne úhľadný nástroj s názvom Sever, kde môžete na webe sedieť a sledovať rôzne cyberakoty v reálnom čase. Keď sa na to pozriete, myslíte si, že „je to pekná roztomilá webová stránka“, ale asi po piatich minútach si uvedomíte objem údajov, ktoré systém robí analyticky na všetkých rôznych tokoch rôznych zariadení po celom svete. ktoré sa do nich dostávajú. Začína to vrhnúť myseľ na to, ako to robia na okraji záznamu, a poskytuje vám tak jednoduchú malú obrazovku, ktorá vám povie, na čo alebo na čo útočí v reálnom čase a aké typy útokov. Je to však úhľadný malý spôsob, ako získať dobrý prehľad o tom, čo pre vás môže analytika prúdov urobiť v reálnom čase. Stačí sledovať túto stránku a získať pocit len ​​objemu a náročnosti prijímania streamov, spracovania analytických dotazov na a predstavuje to v reálnom čase.

Myslím si, že rozhovor, ktorý mám po zvyšok relácie, sa bude zaoberať všetkými týmito typmi vecí s jedným zaujímavým pohľadom z môjho pohľadu, a to je výzva pre domácich majstrov, piecť sami, vyhovuje niektorým z klasické jednorožce, ktoré si môžu dovoliť stavať tieto druhy vecí. Majú miliardy dolárov na vybudovanie týchto inžinierskych tímov a vybudovanie svojich dátových centier. Ale pre 99, 9% organizácií tam, ktoré chcú zvýšiť hodnotu svojej analytickej činnosti v oblasti streamovania, musia mať k dispozícii službu off-the-shelf. Potrebujú si kúpiť výrobok po vybalení z krabice a zvyčajne potrebujú nejaký konzultačný a profesionálny servis, ktorý im pomôže pri jeho implementácii. Získanú hodnotu získajú späť v podnikaní a predajú ho späť ako pracovné riešenie.

S tým sa vám vrátim, Rebecca, pretože som presvedčený, že to sa teraz chystáme podrobne venovať.

Rebecca Jozwiak: Výborne. Ďakujem vám veľmi pekne, Dez. To je skvelá prezentácia.

Teraz odovzdám loptu Robinovi. Vziať to preč.

Robin Bloor: Dobre. Pretože Dez prešiel do spletitého spracovávania potokov, nezdalo sa mi rozumné, aby som to znova zakryl. Takže budem mať úplne strategický názor. Pri pohľade takmer z veľmi vysokej úrovne na to, čo sa do pekla deje, a na jeho umiestnenie, pretože si myslím, že by to mohlo pomôcť ľuďom, najmä nám ľuďom, ktorí nie sú v táboroch spracovaní vo veľkých hĺbkach predtým.

Spracovanie tokov trvá už dlho. Nazývali sme to CEP. Pred tým existovali systémy v reálnom čase. Pôvodné systémy riadenia procesov v skutočnosti spracovávali toky informácií - samozrejme sa nič také nezmenilo, ako je to v súčasnosti. Tento obrázok, ktorý vidíte na snímke tu; v skutočnosti to poukazuje na veľa vecí, ale poukazuje to nad a za čokoľvek iné - skutočnosť, že existuje spektrum oneskorení, ktoré sa tu zobrazujú v rôznych farbách. Od vynálezu výpočtovej techniky alebo komerčnej výpočtovej techniky, ktorá dorazila okolo roku 1960, sa stalo, že všetko sa stalo rýchlejšie a rýchlejšie. Kedysi sme boli schopní závisieť od toho, ako to skutočne vyšlo, ak sa vám páči vo vlnách, pretože tak to vyzerá. To v skutočnosti záleží. Pretože to všetko bolo riadené Mooreovým zákonom a Mooreov zákon by nám dal faktor asi desaťkrát vyššiu rýchlosť v priebehu približne šiestich rokov. Potom, keď sme sa skutočne dostali do roku 2013, sa to všetko pokazilo a zrazu sme začali zrýchľovať rýchlosťou, akú sme nikdy neurobili, čo je čudne bezprecedentné. Dostali sme faktor asi desať, pokiaľ ide o zvýšenie rýchlosti, a preto zníženie latencie približne každých šesť rokov. Za šesť rokov od roku 2010 máme násobok najmenej tisíc. Tri rády radšej ako jeden.

To sa deje, a preto sa zdá, že priemysel sa tak či onak pohybuje fantastickou rýchlosťou - pretože je. Čiže ide o význam tejto konkrétnej grafiky, časy odozvy sú vlastne mimochodom v algoritmickej mierke dole po zvislej osi. Reálny čas je rýchlosť počítača, rýchlejšia ako ľudské bytosti. Interaktívne časy sú oranžové. Práve pri interakcii s počítačom chcete skutočne od jednej desatiny do jednej sekundy čakať. Hore, existuje transakcia, v ktorej skutočne premýšľame o tom, čo robíte v počítači, ale ak to vyjde asi za pätnásť sekúnd, stane sa to neznesiteľným. Ľudia by vlastne jednoducho nečakali na počítač. Všetko sa robilo v dávkach. Mnoho vecí, ktoré boli vykonané v dávkach, teraz spadá priamo do transakčného priestoru, priamo do interaktívneho priestoru alebo dokonca do priestoru v reálnom čase. Zatiaľ čo predtým sme mohli zvlniť veľmi malé množstvo údajov, mohli by sme niektoré z nich urobiť, teraz však môžeme robiť veľmi veľké množstvá údajov pomocou veľmi rozšíreného prostredia.

V podstate to všetko hovorí o transakciách a časoch interaktívnej ľudskej odozvy. Hrozne veľa toho, čo sa v súčasnosti deje s prúdmi, je informovať ľudí o veciach. Niektoré z nich idú rýchlejšie ako to a dobre to informujú, takže je to v reálnom čase. Potom si vezmeme licenciu, ktorá padne ako kameň, čo umožňuje okamžitú analýzu uskutočniteľnú a mimochodom celkom dostupnú. Nie je to len rýchlosť klesla a horná časť sa práve zrútila. Pravdepodobne najväčší vplyv na všetky tieto aplikácie zo všetkých rôznych aplikácií, môžete vykonať všetky tieto prediktívne analýzy. O chvíľu ti poviem prečo.

Toto je iba železiarstvo. Máte paralelný softvér. Hovoríme o ňom v roku 2004. Škálovateľná architektúra, viacjadrové čipy, zvýšenie pamäte, konfigurovateľný procesor. SSD teraz idú oveľa rýchlejšie ako rotujúci disk. Docela sa môžete rozlúčiť s rotujúcim diskom. SSD sú tiež vo viacerých jadrách, takže opäť rýchlejšie a rýchlejšie. Čoskoro sa objaví, máme pamätníka od spoločnosti HP. Máme 3D XPoint od spoločností Intel a Micron. Sľubom týchto je, že to napriek tomu všetko pôjde rýchlejšie a rýchlejšie. Keď skutočne premýšľate o dvoch nových pamäťových technológiách, z ktorých obidve urobia celú základnú maličkosť, jednotlivé dosky s obvodmi idú rýchlejšie, ešte sme ich ani nevideli.

Technológia streamov, ktorá je v skutočnosti ďalšou správou, zostáva tu. Musí existovať nová architektúra. Myslím, že Dez sa o tom vo viacerých bodoch svojej prezentácie zmienil. Po celé desaťročia sme architektúru vnímali ako kombináciu dátových hromád a dátových potrubí. Mali sme tendenciu spracovávať haldy a mali sme tendenciu prenášať dáta medzi haldy. Teraz sa zásadne posúvame smerom k tomu, čo nazývame dátová architektúra Lambda, ktorá kombinuje spracovanie dátových tokov s dátovými haldy. Keď v skutočnosti spracovávate prúd udalostí prichádzajúcich proti historickým údajom ako tok dát alebo hromadu údajov, myslím tým Lambda architektúra. To je v plienkach. Je to len časť obrázka. Ak považujete niečo také komplexné ako internet všetkého, o ktorom sa zmienil aj Dez, v skutočnosti si uvedomíte, že existujú rôzne problémy s umiestnením údajov - rozhodnutia o tom, čo by ste mali v streame spracovať.

Skutočne tu hovorím, že keď sme spracovávali v dávkach, vlastne sme spracovávali toky. Jednoducho sme to nemohli urobiť naraz. Čakáme, kým nebude veľa hromady vecí, a potom to všetko spracujeme naraz. Prechádzame do situácie, keď môžeme skutočne spracovať obsah v streame. Ak dokážeme spracovať údaje v prúde, potom sú údajové hromady, ktoré uchovávame, statickými údajmi, ktoré musíme referencovať, aby sme mohli spracovávať údaje v prúde.

To nás privádza k tejto konkrétnej veci. Už som sa o tom zmienil v nejakej prezentácii s biologickou analógiou. Spôsob, akým by ste chceli, aby ste o tom premýšľali, je v súčasnosti človek. Máme tri odlišné siete na prediktívne spracovanie v reálnom čase. Nazývajú sa somatické, autonómne a enterické. Enterické je váš žalúdok. Autonómny nervový systém sa stará o boj a lety. V skutočnosti sa stará o rýchle reakcie na životné prostredie. Somatická látka, ktorá sa stará o pohyb tela. Sú to systémy v reálnom čase. Zaujímavou vecou - alebo si myslím, že je to niečo zaujímavé - je veľa, že sú prediktívnejšie, než si viete predstaviť. Je to, akoby ste sa skutočne pozerali na obrazovku asi 18 palcov od tváre. Všetko, čo jasne vidíte, všetko, čo vaše telo dokáže jasne vidieť, je v skutočnosti obdĺžnik s rozmermi 8 × 10. Všetko, čo je mimo toho, je skutočne rozmazané, pokiaľ ide o vaše telo, ale vaša myseľ skutočne vyplňuje medzery a nie je rozmazaná. Nevidíte rozmazanie vôbec. Vidíte to jasne. Vaša myseľ robí prediktívnu metódu toku údajov, aby ste túto jasnosť videli. Je to niečo zvláštne, ale v skutočnosti sa môžete pozrieť na to, ako nervový systém funguje a na spôsob, ktorým sa dokážeme obísť a správať sa primerane - aspoň niektorí z nás - primerane zdravo a nepretržite narážať na veci.

Všetko sa to deje pomocou škály neurálnych analytických stupníc. Čo sa stane, je to, že organizácie budú mať rovnaký druh vecí a budú stavať rovnaký druh vecí a bude to spracovanie tokov vrátane vnútorných tokov organizácie - veci, ktoré sa dejú vo vnútri to, čo sa deje mimo neho, okamžité reakcie, ktoré sa musia skutočne urobiť, sú, samozrejme, živia ľudskú bytosť, aby sa rozhodla, aby sa to všetko stalo. Tam ideme, pokiaľ to vidím.

Jednou z vecí, ktorá je dôsledkom toho je, že úroveň aplikácie na streamovanie sa darí dobre. Bude tu omnoho viac, ako vidíme teraz. Práve teraz vyberáme nízko visiace ovocie, ktoré robí veci, ktoré sú zrejmé.

Takže to je záver tu. Analytika streamovania je kedysi medzeru, ale stáva sa hlavným prúdom a čoskoro bude všeobecne prijatá.

S tým ju odovzdám späť Rebecca.

Rebecca Jozwiak: Ďakujem veľmi pekne, Robin. Skvelá prezentácia ako obvykle.

Anand, si na rade. Podlaha je na vás.

Anand Venugopal: Fantastický. Ďakujem.

Moje meno je Anand Venugopal a som vedúcim produktu pre StreamAnalytix. Je to produkt ponúkaný spoločnosťou Impetus Technologies z Los Gatos v Kalifornii.

Spoločnosť Impetus mala v skutočnosti veľkú históriu v tom, že bola veľkým poskytovateľom dátových riešení pre veľké podniky. Takže sme v skutočnosti urobili niekoľko implementácií analytických streamov ako spoločnosť poskytujúca služby a naučili sme sa veľa lekcií. V posledných rokoch sme sa tiež posunuli smerom k tomu, aby sme sa stali spoločnosťou zameranou na produkty a riešenia založené na riešeniach. Analýza tokov vedie k transformácii spoločnosti Impetus na spoločnosť zameranú prevažne na výrobky. Existuje niekoľko kritických, veľmi, veľmi kľúčových aktív, ktoré spoločnosť Impetus zúčtovala vďaka našej expozícii voči podnikom, a spoločnosť StreamAnalytix je jedným z nich.

Sme dvadsať rokov v podnikaní a existuje veľká zmes produktov a služieb, vďaka ktorým máme obrovskú výhodu. A StreamAnalytix sa zrodil zo všetkých skúseností získaných z našich prvých piatich alebo šiestich implementácií streamovania.

Dotknem sa niekoľkých vecí, ale analytici Dez a Robin odviedli fantastickú prácu pri pokrývaní celého priestoru, takže preskočím veľa obsahu, ktorý sa prekrýva. Asi pôjdem rýchlo. Vidíme okrem skutočných prípadov streamovania využívajúcich veľa spravodlivého dávkového zrýchlenia, kde v podnikoch existujú doslova veľmi veľmi dôležité dávkové procesy. Ako vidíte, celý tento cyklus snímania udalostí a ich analýzy a konania podľa nich môže v skutočnosti trvať týždne vo veľkých podnikoch a všetci sa ich snažia zmenšiť na minúty, niekedy aj sekundy a milisekundy. Čokoľvek rýchlejšie ako všetky tieto dávkové procesy sú teda kandidátmi na akvizíciu firmy, a je veľmi dobre povedané, že hodnota údajov dramaticky klesá s jej vekom, takže čím väčšia hodnota je v počiatočnej časti v sekundách, práve sa to stalo. V ideálnom prípade, ak by ste mohli predpovedať, čo sa bude diať, je to najvyššia hodnota. Závisí to však od presnosti. Ďalšia najvyššia hodnota je, keď je práve tam, keď sa to deje, môžete ju analyzovať a reagovať. Hodnota samozrejme potom dramaticky klesá, hlavné reštriktívne BI, v ktorom sa nachádzame.

Je to zaujímavé. Môžete očakávať nejakú dramaticky vedeckú odpoveď na otázku, prečo streamovať analytiku. V mnohých prípadoch vidíme, že je to preto, že je to teraz možné a pretože každý vie, že dávka je stará, dávka je nudná a dávka nie je v pohode. K dispozícii je dosť vzdelania, ktoré všetci teraz majú, o tom, že je možné streamovanie a každý má teraz Hadoop. Teraz má distribúcia Hadoop zabudovanú technológiu streamovania, či už ide o streamovanie Storm alebo Spark a samozrejme fronty správ, ako napríklad Kafka atď.

Podniky, ktoré vidíme, do toho skočia a začínajú experimentovať s týmito prípadmi a vidíme dve široké kategórie. Jeden má niečo spoločné so zákazníckou analýzou a skúsenosťami so zákazníkmi a druhou operačnou inteligenciou. K týmto detailom sa dostanem neskôr. Celý náš zákaznícky servis a skúsenosti zákazníkov a my v spoločnosti Impetus StreamAnalytix sme to dokázali mnohými rôznymi spôsobmi, je to naozaj o skutočnom zachytení viackanálového zapojenia spotrebiteľa v reálnom čase a poskytovaní veľmi, veľmi kontextovo citlivých skúseností ktoré dnes nie sú bežné. Ak prezeráte web, webovú stránku Bank of America a skúmali ste niektoré produkty a zavolali ste len na call centrum. Povedali by: „Hej, Joe, viem, že si skúmal niektoré bankové produkty, chcel by si, aby som ťa vyplnil?“ Neočakávate to dnes, ale je to druh zážitku, ktorý je skutočne možný so streamovaním analytických údajov. V mnohých prípadoch je to obrovský rozdiel, najmä ak zákazník začal s vami skúmať spôsoby, ako sa zbaviť svojej zmluvy, keď si na vašich webových stránkach pozrie doložky o predčasnom ukončení alebo podmienky predčasného ukončenia a potom zavolá a vy nebudete môcť priamo s nimi konfrontovať, ale len nepriamo podať ponuku na nejaký druh prvej propagácie, pretože systém vie, že táto osoba sa pozerá na predčasné ukončenie a ponúknete túto ponuku v tom okamihu, mohli by ste veľmi dobre chrániť tohto zákazníka a ochrániť tento majetok,

To by bol jeden príklad a veľa služieb zákazníkom je veľmi dobrým príkladom. Realizujeme dnes, znižujeme náklady v call centre a tiež poskytujeme dramatické zážitky pre zákazníkov. Dez odviedol skvelú prácu pri zhrnutí niektorých prípadov použitia. Na tento graf sa môžete pozerať pár minút. Klasifikoval som ho ako vertikály, horizontály a kombinované oblasti, internet vecí, mobilné aplikácie a call centrum. Sú to všetky vertikály a horizontály. Závisí to od toho, ako sa na to pozeráte. Zrátané a podčiarknuté, vidíme veľa horizontálnych použití, ktoré sú dosť bežné vo všetkých odvetvových odvetviach a existujú špecifické prípady vertikálneho použitia vrátane finančných služieb, zdravotnej starostlivosti, telekomunikácií, výroby atď. Ak sa skutočne pýtate sami seba na otázku alebo hovoríte sami sebe že „ach, neviem, aké sú prípady použitia. Nie som si istý, či existuje skutočne nejaká obchodná hodnota v streamingovej analýze pre moju spoločnosť alebo pre náš podnik, “premýšľajte tvrdo, zamyslite sa dvakrát. Porozprávajte sa s viacerými ľuďmi, pretože existujú prípady použitia, ktoré sú dnes vo vašej spoločnosti relevantné. Dostanem sa k obchodnej hodnote toho, ako presne sa odvodzuje obchodná hodnota.

V dolnej časti pyramídy máte prediktívnu údržbu, bezpečnosť, ochranu pred odtokom atď. Tieto prípady použitia predstavujú ochranu výnosov a majetku. Ak Target chránil ich narušenie bezpečnosti, ku ktorému došlo v priebehu hodín a týždňov, CIO mohol zachrániť jeho prácu. To by mohlo ušetriť desiatky alebo stovky miliónov dolárov atď. Analytika streamovania v reálnom čase skutočne pomáha pri ochrane týchto aktív a ochrane strát. To je priama pridaná hodnota pre podniky.

Ďalšia kategória sa stáva ziskovejšou, znižuje vaše náklady a zvyšuje príjmy zo súčasnej prevádzky. To je efektívnosť súčasného podniku. Toto sú všetky prípady použitia, ktoré nazývame operačnými informáciami v reálnom čase, kde získavate hlboké informácie o tom, ako sa správa sieť, ako sa správajú vaše zákaznícke operácie, ako sa správa váš obchodný proces a že sa môžete vyladiť. To všetko v reálnom čase, pretože získate spätnú väzbu, dostanete upozornenia. Získate odchýlky, odchýlky v reálnom čase a môžete rýchlo konať a oddeliť proces, ktorý ide mimo hranice.

Môžete tiež potenciálne ušetriť veľa peňazí na drahých aktualizáciách kapitálu a veciach, ktoré považujete za potrebné, ktoré nemusia byť potrebné, ak ste optimalizovali sieťové služby. Počuli sme o prípade, keď hlavné telekomunikačné spoločnosti odložili modernizáciu svojej sieťovej infraštruktúry o 40 miliónov dolárov, pretože zistili, že majú dostatok kapacity na riadenie svojej súčasnej prevádzky, čo je optimalizáciou a lepším vykonávaním inteligentného smerovania ich prenosu a podobne. To všetko je možné iba pomocou analytických a akčných mechanizmov v reálnom čase, ktoré na tieto poznatky v reálnom čase pôsobia.

Ďalšou úrovňou pridanej hodnoty je predaj na vyššej úrovni, krížový predaj, kde existujú príležitosti na zvýšenie výnosov a ziskov zo súčasných ponúk. Toto je klasický príklad, o ktorom mnohí z nás vedia o tom, čo zažili, o čom premýšľate vo svojom živote, kde ste ochotní dnes kúpiť produkt, ktorý vám nie je ponúkaný. V mnohých prípadoch sa to skutočne stáva. Máte na mysli veci, ktoré by ste si chceli kúpiť, že viete, že ich chcete kúpiť, že máte zoznam úloh alebo niečo, čo vám povedala vaša manželka, alebo ak nemáte manželku, ale naozaj ste chceli kúpiť a idete nakupovať na webe alebo komunikujete v maloobchode, výkladná skrinka jednoducho nemá kontext, nemá inteligenciu na výpočet toho, čo by ste mohli potrebovať. Z tohto dôvodu nezabezpečujú svoje podnikanie. Ak by bolo možné nasadiť analytiku streamovania, aby sa skutočne dali presne predpovedať a ktoré sú skutočne možné v tom, čo by sa najviac hodilo tomuto konkrétnemu kontextu, tento zákazník v tomto čase v tomto mieste existuje veľa up-sell a cross-sells a to opäť vychádza z streamingová analytika - schopnosť rozhodnúť sa o tom, čo tento zákazník pravdepodobne kúpi alebo v ktorom momente pravdy odpovie, keď má príležitosť. Preto sa mi páči ten obrázok, ktorý Dez ukázal s medveďom, ktorý sa práve chystá jesť tú rybu. To je do značnej miery.

Tiež si myslíme, že existuje veľká kategória dramatických transformačných zmien v podniku, ktorá ponúka úplne nové produkty a služby jednoducho založené na pozorovaní správania zákazníkov, všetko založené na pozorovaní správania iného podniku. Ak povedzme, že telco alebo káblová spoločnosť skutočne pozoruje zvyklosti zákazníkov v tom segmente trhu, ktorý pozerá, v akom programe v akom čase atď., Nakoniec skončí vytváraním produktov a služieb, ktoré sú takmer prosené nejakým spôsobom. Celý koncept správania na viacerých obrazovkách, kde teraz takmer považujeme za samozrejmé, že v našich mobilných aplikáciách vidíme televízny alebo káblový obsah. Niektoré z týchto príkladov pochádzajú z tých nových produktov a služieb, ktoré sa nám ponúkajú.

Dostanem sa k téme: „Aké sú aspekty architektúry streamovania analytických údajov?“ V konečnom dôsledku sa to snažíme. Toto je architektúra Lambda, v ktorej miešate historické údaje a náhľady v reálnom čase a zároveň ich vidíte. To umožňuje Sigma. Všetci máme dnes dávkovú architektúru a obraz podniku. Zhromažďujeme sa do nejakého druhu zásobníka BI a zásobníka využitia a pridala sa architektúra Lambda. Pretože rýchlostná vrstva alebo potreba a Lambda je o zlúčení týchto dvoch poznatkov a videní, že kombinovaným spôsobom, bohatým spôsobom, ktorý kombinuje oba postrehy.

Existuje ďalšia paradigma nazývaná architektúra Kappa, ktorá sa navrhuje tam, kde sa predpokladá, že rýchlostná vrstva je jediným vstupným mechanizmom, ktorý bude pretrvávať v dlhodobom horizonte. Všetko prechádza touto vrstvou rýchlosti. Neexistuje ani mechanizmus offline ETL. Stane sa všetko ETL. Čistenie, čistenie dát, kvalita ETL - to všetko sa stane na drôte, pretože nezabudnite, že všetky údaje sa narodili v reálnom čase. V určitom okamihu to bol real time. Zvykli sme si to nasadiť na jazerá, rieky a oceány, potom sme to urobili na základe statickej analýzy, že sme zabudli, že údaje sa narodili v určitom okamihu v reálnom čase. Všetky údaje sa skutočne rodia ako udalosť v reálnom čase, ktorá sa stala v čase, a väčšina údajov, ktoré sa dnes nachádzajú na jazere, sa práve vložila do databázy na neskoršiu analýzu a teraz máme výhodu v architektúre Lambda a Kappa vidieť to, analyzovať to, predspracovať ho a reagovať naň hneď ako dorazí. To umožňujú tieto technológie. Keď sa na to pozeráte ako na celkový obrázok, vyzerá to takto, ak je vo vnútri Hadoop, MPP a dátové sklady, ktoré už máte.

Uviedli sme to, pretože je dôležité nielen hovoriť o nových technológiách na ostrove. Musia sa integrovať. Musia mať zmysel v súčasnom podnikovom kontexte a ako poskytovatelia riešení, ktorí slúžia podnikom, sme na to veľmi citliví. Pomáhame podnikom tak trochu integrovať celú vec. Na ľavej strane sú zdroje údajov, ktoré sa napájajú do vrstiev Hadoop a skladu údajov, ako aj do vrstvy v reálnom čase na vrchu a každý z týchto subjektov je skladový počítač, ako vidíte, a vrstva na spotrebu údajov je napravo. side. Neustále sa usiluje presunúť väčšinu dodržiavania predpisov, riadenia, bezpečnosti, riadenia životného cyklu atď., Ktoré sú dnes k dispozícii, sa do tejto novej technológie nahromadili.

Jedna z vecí, ktorú sa analytika streamov snaží robiť, ak sa dnes pozriete na krajinu, sa v technologickom prostredí streamovania deje veľa vecí az pohľadu podnikových zákazníkov je toho veľa, čomu treba porozumieť. Je toho veľa, s čím by ste mali držať krok. Na ľavej strane sú mechanizmy zberu údajov - NiFi, Logstash, Flume, Sqoop. Je zrejmé, že som predložil vyhlásenie, že nie je vyčerpávajúce. Prichádza do frontov správ a potom prichádza do open-source streamingových motorov - Storm, Spark Streaming, Samza, Flink, Apex, Heron. Volavka pravdepodobne ešte nie je otvoreným zdrojom. Nie som si istý, či je, zo služby Twitter. Tieto streamingové motory potom vedú do alebo podporujú komponent analytickej aplikácie, ako je komplexné spracovanie udalostí, strojové učenie, prediktívna analýza, výstražný modul, streamingový ETL, filtre štatistických operácií obohatenia. Toto sú všetky subjekty, ktoré teraz nazývame operátormi. Množina týchto operátorov, keď sú navzájom naviazaní, by sa prípadne v prípade potreby tiež do značnej miery uzavrela, čo sa stane aplikáciou na streamovanie, ktorá beží na stroji na streamovanie.

V rámci tohto reťazca komponentov musíte tiež ukladať a indexovať údaje do svojej obľúbenej databázy, do svojho obľúbeného indexu. Možno budete musieť distribuovať vyrovnávaciu pamäť a znova, ktorá vedie do vrstvy vizualizácie údajov na pravej strane v hornej časti, do komerčných produktov alebo produktov s otvoreným zdrojovým kódom, ale nakoniec potrebujete nejaký produkt na vizualizáciu týchto údajov v reálnom čase. Tiež musíte niekedy prísť na iné aplikácie. Všetci sme videli, že hodnoty odvodené iba z akcie, ktorú vykonáte na základe prehľadu, táto akcia bude spúšťačom z analytického zásobníka do iného aplikačného zásobníka, ktorý sa možno zmení, čo je niečo na strane IVR alebo spúšťa call centrum odchádzajúci hovor alebo niečo také. Potrebujeme, aby tieto systémy boli integrované a nejaký mechanizmus pre váš klaster streamingu na spustenie ďalších aplikácií na odosielanie údajov po prúde.

Toto je celkový zásobník od zľava doprava. Potom máte servisné vrstvy, stredné monitorovanie, všeobecnú bezpečnostnú vrstvu atď. Pokiaľ ide o produkty, ktoré sú v podnikovom priestore, ktoré zákazníci vidia, ako sú distribúcie Hadoop, ktoré majú všetky streamingy, ako som povedal, sú komerčné alebo jednotlivé - riešenia pre dodávateľov, ktoré sú očividne našimi konkurentmi. V krajine je tiež omnoho viac, o ktorých sme sa možno ani zmienili.

To, čo vidíte, je všeobecne viditeľné pre podnikových používateľov. Ako vidíte, komplexné a rýchlo sa rozvíjajúce technologické prostredie na spracovanie prúdov. Musíme zjednodušiť výber a užívateľskú skúsenosť. Domnievame sa, že podniky skutočne potrebujú funkčnú abstrakciu všetkého toho v jednotnom kontaktnom mieste, ľahko použiteľnom rozhraní, ktoré spája všetky tie technológie, vďaka ktorým je použitie skutočne jednoduché a nevystavuje všetky pohyblivé časti. a problémy s degradáciou a problémy s výkonom a problémy s údržbou životného cyklu podniku.

Abstrakcia funkčnosti je jedna. Druhou časťou je abstrakcia streamingového motora. Streamovacie mechanizmy a domény s otvoreným zdrojovým kódom sa teraz objavujú raz za tri, štyri alebo šesť mesiacov. Bola to dlhá doba. Prišiel Samza a teraz je to Spark Streaming. Flink zdvihol hlavu a začal upútať pozornosť. Dokonca aj cestovná mapa programu Spark Streaming vytvára spôsob, ako potenciálne použiť iný motor na spracovanie čistých udalostí, pretože si tiež uvedomuje, že program Spark bol navrhnutý na dávkové spracovanie a vo svojej vízii architektúry a vo svojom pláne robia cestu na potenciálne odlišné použitie. motor na spracovanie toku okrem aktuálneho vzoru mikrobatov v Spark Streaming.

Je to realita, s ktorou musíte zápasiť, že bude veľa evolúcie. Naozaj sa musíte chrániť pred týmto technologickým tokom. Pretože v predvolenom nastavení budete musieť vybrať jednu a potom s ňou žiť, čo nie je optimálne. Ak sa na to pozeráte iným spôsobom, bojujete medzi: „Dobre, musím si kúpiť proprietárnu platformu, kde nie je blokovanie, neexistuje otvorený zdroj, môžu byť veľmi vysoké a obmedzené. flexibilita oproti všetkým týmto zásobníkom s otvoreným zdrojovým kódom, kde ste to urobili sami. “Opäť, ako som už povedal, je to veľa nákladov a oneskorení pri vstupe na trh. Hovoríme o tom, že StreamAnalytix je jedným z príkladov skvelej platformy, ktorá spája podnikovú triedu, spoľahlivého, jediného dodávateľa a profesionálnu podporu - to všetko, čo skutočne potrebujete ako podnik, a silu flexibility ekosystému s otvoreným zdrojom. kde ich spája jediná platforma - Ingest, CEP, analytika, vizualizácia a všetko ostatné.

Robí tiež veľmi, veľmi jedinečnú vec, ktorá spája mnoho rôznych technologických motorov pod jedným používateľským zážitkom. Skutočne si myslíme, že budúcnosť je o tom, že budeme môcť používať viacero streamovacích nástrojov, pretože rôzne prípady použitia si skutočne vyžadujú rôzne architektúry streamovania. Ako povedal Robin, existuje celá škála oneskorení. Ak naozaj hovoríte o úrovni milisekundovej latencie, desiatkach alebo dokonca stovkách milisekúnd, v tomto okamihu naozaj potrebujete Storm, kým nebude k dispozícii ďalší rovnako zrelý produkt pre menej zhovievavosť alebo zhovievavejší časový rámec a latencie možno za pár sekúnd, tri, štyri, päť sekúnd, tento rozsah, potom môžete použiť program Spark Streaming. Potenciálne existujú aj iné motory, ktoré dokážu urobiť obidva. Zrátané a podčiarknuté, vo veľkom podniku budú prípady použitia všetkých druhov. Naozaj chcete, aby prístup a všeobecnosť mali viac nástrojov s jedným používateľským dojmom, a to sa snažíme postaviť v StreamAnalytix.

Len rýchly pohľad na architektúru. Trochu to prepracujeme, ale v podstate na ľavej strane prichádza viac zdrojov údajov - Kafka, RabbitMQ, Kinesis, ActiveMQ, všetky tieto zdroje údajov a fronty správ prichádzajúce na platformu spracovania prúdov, kde môžete zostaviť aplikáciu, kde môžete ťahať a púšťať od operátorov, ako sú ETL, všetko, o čom sme hovorili. Pod nimi je viac motorov. Práve teraz máme Storm a Spark Streamovanie ako jedinú priemyselnú platformu a prvú platformu podnikového streamovania, ktorá má podporu viacerých motorov. To je veľmi jedinečná flexibilita, ktorú ponúkame, okrem všetkej inej flexibility, ktorú majú dashboardy v reálnom čase. Zabudovaný motor CET. Máme bezproblémovú integráciu s indexmi Hadoop a NoSQL, indexmi Solr a Apache. Do svojej obľúbenej databázy môžete pristáť bez ohľadu na to, čo to je, a vytvárať aplikácie naozaj rýchlo a dostať sa na trh naozaj rýchlo a zostať budúcimi dôkazmi. To je naša celá mantra v StreamAnalytix.

S tým si myslím, že uzavriem svoje poznámky. Neváhajte a príďte k nám na ďalšie otázky. Chcel by som nechať priestor otvorený pre otázky a odpovede a panelovú diskusiu.

Rebecca, nad tebou.

Rebecca Jozwiak: Skvelé, dobre. Ďakujem ti veľmi pekne. Dez a Robin, máte nejaké otázky skôr, ako ich odovzdáme divákom?

Robin Bloor: Mám otázku. Nasadím si slúchadlá, aby ste ma počuli. Jedna zo zaujímavých vecí, ak by ste mi to mohli láskavo povedať, veľa z toho, čo som videl v open source priestore, vyzerá to, čo by som im povedal nezrelé. V istom zmysle áno, môžete robiť rôzne veci. Ale vyzerá to, že sa pozeráme na softvér v jeho prvom alebo druhom vydaní v skutočnosti a ja som sa len pýtal na vaše skúsenosti ako organizácia, koľko vidíte nezrelosť prostredia Hadoop ako problematické alebo je to niečo, čo nevie. nevytvára príliš veľa problémov?

Anand Venugopal: Je to realita, Robine. Máš absolútnu pravdu. Nezrelosť nemusí byť nevyhnutne iba v oblasti funkčnej stability a vecí, ale možno aj v niektorých prípadoch. Nezrelosť je však skôr pripravená na použitie. Produkty s otvoreným zdrojovým kódom, keď vyjdú, a aj keď ich ponúka distribúcia Hadoop, sú to všetky rôzne schopné výrobky, komponenty sa len navzájom prepadli. Nefungujú spolu hladko a nie sú navrhnuté tak, aby poskytovali hladký a plynulý dojem používateľa, ktorý dostaneme ako Bank of America alebo Verizon alebo AT&T, aby sme do niekoľkých týždňov nasadili analytickú aplikáciu na streamovanie. Určite na to nie sú určené. To je dôvod, prečo prichádzame. Zhromažďujeme to a robíme to naozaj ľahko pochopiteľným, nasaditeľným atď.

Myslím si, že je to do značnej miery funkčná zrelosť. Mnoho veľkých podnikov dnes používa napríklad Storm. S Spark Streaming dnes hrá veľa veľkých podnikov. Každý z týchto motorov má svoje obmedzenia v tom, čo môžu robiť, a preto je dôležité vedieť, čo môžete a čo nemôžete robiť s každým motorom a nemá zmysel zlomiť hlavu o stenu a povedať: „Pozri sa si vybral Spark Streaming a v tomto konkrétnom odvetví to pre mňa nefunguje. “To nebude fungovať. Existujú prípady použitia, v ktorých bude Spark Streaming najlepšou voľbou, a budú prípady, keď Spark Streaming nemusí pre vás vôbec fungovať. Preto skutočne potrebujete viac možností.

Robin Bloor: Na väčšinu z toho musíte mať tímy odborníkov. Myslím tým, že ani neviem, kde začať s týmto. Rozumná súčinnosť skúsených jednotlivcov. Zaujíma ma, ako sa angažujete a ako sa to deje. Je to preto, že konkrétna spoločnosť je po konkrétnej aplikácii alebo vidíte niečo, čo by som nazval strategické prijatie, keď chcú, aby celá platforma robila veľa vecí.

Anand Venugopal: Vidíme príklady oboch, Robin. Niektoré z desiatich najvýznamnejších značiek, o ktorých všetci vedia, idú veľmi strategickým spôsobom. Vedia, že budú mať rôzne prípady použitia, takže vyhodnocujú platformy, ktoré budú vyhovovať tejto potrebe, čo je množstvo rôznych prípadov použitia viacnásobným nájomcom, ktoré sa majú nasadiť v podniku. Začínajú sa aj prípady jedného použitia. V hypotekárnej spoločnosti existuje konkrétny prípad použitia typu monitorujúci obchodnú činnosť, na ktorom pracujeme, na ktorom by ste si nepredstavovali prvý prípad použitia, ale ide o obchodné riešenie alebo prípad použitia, s ktorým prišli, a potom sme prepojili bodky so streamovaním, Povedali sme: „Vieš čo? Toto je skvelý príklad pre streamingovú analýzu a takto ju môžeme implementovať. “Takto to začalo. Potom sa v tomto procese dostanú vzdelanie a povedia: „Ach, wow, ak to dokážeme a ak je to generická platforma, potom môžeme aplikáciu rozdeliť, rozdeliť na platformu a na nej postaviť veľa rôznych aplikácií. plošina."

Robin Bloor: Dez, máš nejaké otázky?

Anand Venugopal: Dez je pravdepodobne nemý.

Dez Blanchfield: Ospravedlňujem sa, nemý. Sám som mal dobrý rozhovor. Len po pôvodnom pozorovaní Robina máte úplnú pravdu. Myslím si, že výzvou v súčasnosti je, že podniky majú ekosystém a kultúrne a behaviorálne prostredie, v ktorom je slobodný softvér s otvoreným zdrojovým kódom niečo, čo je im známe, a sú schopné používať nástroje ako Firefox ako prehliadač a mali slušný do doby, kým sa nestane stabilným a bezpečným. Niektoré z veľmi veľkých platforiem, ktoré však používajú, sú proprietárne platformy podnikového stupňa. Takže prijatie toho, čo považujem za open-source platformy, nie je vždy niečo, čo sa kultúrne alebo emocionálne ľahko stretne. Videl som to len pri prijímaní malých programov, ktoré boli miestnymi projektmi, ktoré sa len hrali s veľkými údajmi a analytikou ako základným konceptom. Myslím si, že jednou z kľúčových výziev, som si istý, že ste ich už teraz videli v organizáciách, je ich túžba dosiahnuť výsledok, ale zároveň mať jednu nohu zaseknutú v starej plechovke, kde si ju mohli kúpiť iba od „Vložte veľkú značku“ Oracle, IBM a Microsoft. Tieto nové a známe značky prichádzajú s platformami Hadoop a ešte viac. Prechádzajú viac zaujímavých značiek, ktoré majú špičkové technológie, ako je prúd.

Aké druhy konverzácií ste týmto spôsobom dosiahli alebo prerušili? Viem, že dnes ráno máme masívnu účasť a jedna vec, o ktorej som si istý, že je v mysli každého, je: „Ako môžem prerezať celú túto náročnú vrstvu z rady na riadiacu úroveň, oh, je príliš otvorený zdroj a príliš krvácajúci okraj? „Ako prebiehajú rozhovory s klientmi a ako prechádzate do tej miery, že tieto obavy obávate, aby ste zvážili prijatie rád StreamAnalytix?

Anand Venugopal: Skutočne považujeme za pomerne ľahké predať našu hodnotovú ponuku, pretože zákazníci sa prirodzene uprednostňujú smerom k otvorenému zdroju. Nie sú ľahko vzdaní sa a hovoria: „Dobre, teraz idem na open source.“ V skutočnosti prechádzajú veľmi odhodlaným hodnotením významného produktu, povedzme, že ide o IBM alebo typický produkt, pretože majú tieto predajné vzťahy. S týmto produktom by s nami alebo s otvoreným zdrojom nepovažovali. Absolvujú šesť až osem až dvanásť týždňov hodnotenia. Presvedčia sa sami o tom, že tu chcem dosiahnuť určitý stupeň výkonnosti a stability, a potom si vymyslí názor: „Páni, vieš čo, v skutočnosti to môžem urobiť.“

Napríklad dnes máme hlavné telekomunikačné pásmo prvého stupňa, ktoré má vo veľkom množstve stohov analytické toky vo výrobe a vyhodnocujú, že proti inému veľmi, veľmi veľkému známemu predajcovi boli presvedčení až potom, čo sme dokázali všetky výkon, stabilita a všetky tieto veci. Neberú to ako samozrejmosť. Zistili, že otvorený zdroj je na základe svojich hodnotení kompetentný a uvedomujú si, že najhorší prípad: „Možno existujú dva prípady použitia, ktoré možno nemôžem urobiť, ale väčšina prípadov použitia urýchľovačov v mojom podnikaní je dnes s otvoreným zdrojom neskutočne možná. zásobník. “A umožňujeme jeho použitie. Takže to je veľké sladké miesto. Chceli otvorený zdroj. Skutočne sa snažia dostať von zo stavu blokovania dodávateľa, na ktorý boli zvyknutí už mnoho rokov. Potom tu prídeme a povieme: „Vieš čo, urobíme open source omnoho ľahším a priateľskejším na použitie.“

Dez Blanchfield: Myslím si, že ďalšou výzvou, ktorú podniky nájdu, je, keď privedú tradičného etablovaného subjektu, že sú často generáciou za krvácajúcou hranou vzrušujúcich vecí, o ktorých tu hovoríme, a nemyslím to ako negatívne mierne. Je to tak, že realitou je, že majú generáciu a cestu, aby vydali to, čo považujú za stabilné platformy, cykly vývoja a starej školy a integračné cykly UATN a testy a dokumentáciu a marketing a predaj. Zatiaľ čo v type, ktorý robíte, si myslím, že by som rád premýšľal o tom, že pri pohľade na niektoré z vašich najnovších vydaní včera v noci vykonávajúcich nejakú výskumnú prácu, teraz máte túto kombináciu, kde ste dostali kompetencie z hľadiska včasného poradenstva a implementácie, ale tiež ste dostali stoh, do ktorého sa môžete zapojiť. Myslím si, že to je miesto, kde sa etablovaní činitelia budú nejaký čas usilovať. Videli sme veľa z nich, ako som to urobil na trhu. Často sú v tom, čo nazývam doháňacie uzly, zatiaľ čo z toho, čo nám hovoríte, keď ste tam vonku robili tieto rozhovory a ste tam implementujú.

Môžete nám uviesť niekoľko príkladov niektorých hraničných vertikál, ktoré ste videli v adopcii? Napríklad existuje skutočne špecifické prostredie, ako je raketová veda, umiestňovanie satelitov do vesmíru a zhromažďovanie údajov z Marsu. Na planéte to robí len hŕstka ľudí. Existujú však veľké vertikály, ako napríklad zdravie, napríklad v letectve, lodnej doprave a logistike, vo výrobe a strojárstve, čo je niekoľko príkladov z väčších a širších priemyselných odvetví, ktoré ste doteraz dosiahli, že ste videli naozaj dobre prijatie v?

Anand Venugopal: Telco je veľkým príkladom.

Práve tu rýchlo upravím svoje snímky. Vidíte snímku tu, prípadová štúdia 4?

Toto je prípad veľkých dát prijímajúcich set-top box telco a s tým robí niekoľko vecí. Pozerajú sa na to, čo zákazníci v reálnom čase skutočne robia. V set-top boxoch sledujú, kde sa v reálnom čase vyskytujú chyby. Pokúšajú sa informovať call centrum, ak tento zákazník práve zavolá, informácie o kódovom prepojení z set-top boxu tohto zákazníka, informácie o údržbových lístkoch rýchlo korelujú, či tento set-top box tohto konkrétneho zákazníka má problém, alebo dokonca ešte skôr zákazník vysloví slovo. Každá káblová spoločnosť, každé hlavné telco sa to snaží robiť. Prijímajú údaje set-top boxu, robia analýzy v reálnom čase, robia analýzy kampaní, aby mohli umiestňovať svoje reklamy. Existuje obrovský prípad použitia.

Ako som už povedal, je tu hypotekárna spoločnosť, ktorá je opäť všeobecným vzorom, v ktorom sú do spracovania údajov zapojené veľké systémy. Dáta, ktoré pretekajú systémom A až systémom B do systému C, a tieto sú regulovanými podnikmi, všetko musí byť konzistentné. Často sa systémy navzájom zosynchronizujú, jeden systém hovorí: „Spracovávam sto pôžičiek v celkovej hodnote 10 miliónov dolárov.“ Systém hovorí: „Nie, spracovávam 110 pôžičiek iných iné číslo. “Musia to vyriešiť naozaj rýchlo, pretože v skutočnosti spracovávajú rovnaké údaje a robia rôzne interpretácie.

Či už ide o kreditnú kartu, spracovanie úveru, obchodný proces alebo či ide o hypotekárny obchodný proces alebo niečo iné, pomáhame im robiť korelácie a zmierenia v reálnom čase, aby sme zaistili, že tieto obchodné procesy zostanú synchronizované. To je ďalší zaujímavý prípad použitia. Existuje významný americký vládny dodávateľ, ktorý sa pozerá na prevádzku DNS a zisťuje anomálie. Existuje model offline tréningu, ktorý zostavili a robia bodovanie na základe tohto modelu v premávke v reálnom čase. Niektoré z týchto zaujímavých prípadov použitia. Existuje veľká letecká spoločnosť, ktorá sa pozerá na bezpečnostné fronty a snaží sa vám poskytnúť tieto informácie, že „Hej, je to vaša brána pre vaše lietadlo pre váš let. Fronta TSA je dnes asi 45 minút oproti dvom hodinám oproti niečomu inému. “Túto aktualizáciu dostanete vopred. Stále na tom pracujú. Zaujímavý prípad použitia internetu vecí, ale veľký prípad streamovacej analýzy smerujúcej k zákazníckej skúsenosti.

Rebecca Jozwiak: Toto je Rebecca. Aj keď ste predmetom prípadu použitia, existuje veľká otázka od publika, ktorá sa pýta: „Sú tieto prípadové štúdie, sú tieto iniciatívy poháňané informačnými systémami analytickej strany domu alebo sú viac vyháňané z podnik, ktorý má konkrétne otázky alebo potreby? “

Anand Venugopal: Myslím si, že vidíme asi 60 percent, približne 50 až 55 percent, z veľkej časti veľmi proaktívne, nadšené technologické iniciatívy, o ktorých sa vie, že sú dosť dôvtipné a rozumejú určitým obchodným požiadavkám a pravdepodobne majú jedného sponzora, že identifikované, ale ide o technologické tímy, ktoré sa pripravujú na nápor prípadov obchodného použitia, ktoré prechádzajú a potom, ako vybudujú schopnosti, vedia, že to dokážu a potom idú do podnikania a agresívne ich predávajú. V 30 až 40 percentách prípadov vidíme, že podnikanie už má konkrétny prípad použitia, ktorý prosí o analytickú funkciu streamovania.

Rebecca Jozwiak: To dáva zmysel. Mám ďalšiu trochu viac technickú otázku od člena publika. Zaujíma sa, či tieto systémy podporujú štruktúrované aj neštruktúrované dátové toky, ako sú sedimenty z Twitterov alebo Facebook príspevky v reálnom čase, alebo je potrebné ich najprv filtrovať?

Anand Venugopal: Produkty a technológie, o ktorých hovoríme, veľmi bezprostredne podporujú štruktúrované aj neštruktúrované údaje. Môžu byť nakonfigurované. Všetky údaje majú nejakú štruktúru, či už ide o text alebo XML alebo čokoľvek. Existuje určitá štruktúra, pokiaľ ide o časovú známku. Možno existuje ďalší blok, ktorý je potrebné analyzovať, aby ste do toku mohli vložiť analýzy, aby sa analyzovali dátové štruktúry. Ak je štruktúrovaná, potom povieme systému: „Dobre, ak existujú hodnoty oddelené čiarkami a prvý je reťazec, druhý je dátum.“ Takže môžeme vložiť túto analytickú inteligenciu do vrstiev na obrazovke a ľahko spracovávať štruktúrované aj neštruktúrované údaje.

Rebecca Jozwiak: Od publika mám ďalšiu otázku. Viem, že sme trochu bežali za hornú časť hodiny. Tento účastník chce vedieť, zdá sa, že aplikácie na vysielanie v reálnom čase môžu vyvíjať tak potrebu, ako aj príležitosť na integráciu späť do transakčných systémov, napríklad systémov na predchádzanie podvodom. V takom prípade musia byť transakčné systémy vyladené tak, aby sa s tým hodili?

Anand Venugopal: Je to zlúčenie, však? Je to zlúčenie transakčných systémov. Niekedy sa stanú zdrojom údajov, kde analyzujeme transakcie v reálnom čase a v mnohých prípadoch, keď povedzme, že existuje aplikačný tok a tu sa snažím ukázať stránku na vyhľadávanie statických údajov a potom v našom prípade, keď sa nejaký druh streamovania a hľadáte statickú databázu, ako je HBase alebo RDBMS, aby ste spoločne obohatili streamované údaje a statické údaje, aby ste sa mohli rozhodnúť alebo získať analytický prehľad.

Vidíme tiež ďalší veľký priemyselný trend - konvergenciu OLAP a OLTP - a preto máte databázy ako Kudu a databázy v pamäti, ktoré podporujú transakcie aj analytické spracovanie v rovnakom čase. Vrstva spracovania toku by bola úplne v pamäti a my sa pozrieme na niektoré z týchto transakčných databáz alebo ich prepojíme.

Rebecca Jozwiak: Zmiešané pracovné zaťaženie je podľa mňa jednou z posledných prekážok, ktoré treba skočiť. Dez, Robin, máš ešte nejaké otázky?

Dez Blanchfield: Prejdem na poslednú otázku a zabalím si to, ak vám to nebude vadiť. Prvou výzvou, ktorú organizácie, s ktorými som sa stretol za posledných desať rokov, viedli k tejto vzrušujúcej výzve analytiky prúdov, je prvá vec, ktorú majú tendenciu dať späť na stôl, keď sme začali konverzáciu okolo celej tejto výzvy. dostaneme sadu zručností? Ako preškolíme súbor zručností a ako získame túto schopnosť interne? S príchodom impetusu a držaním nás nás držte počas cesty a potom ju implementujte ako veľký prvý krok, a to dáva zmysel robiť to.

Ale pre strednú až veľkú organizáciu, aké sú veci, ktoré v súčasnosti vidíte, aby ste sa na to pripravili, aby si túto schopnosť vybudovali interne, aby okolo nej dostali čokoľvek, iba zo základnej slovnej zásoby a s akou formou môžu robiť správy. organizácia okolo prechodu na tento druh rámca a prehodnotenie ich súčasného technického personálu z oblasti IT od výkonného riaditeľa, aby ho mohli sami spustiť po jeho vytvorení a implementácii? Len veľmi stručne, aké výzvy a ako ich riešia, zákazníkov, s ktorými sa stretnete, typy výziev, ktoré našli, a ako prechádzajú riešením tohto preškolenia a opätovného získania skúseností a znalostí, aby sa na to pripravili a boli schopný operatívne obísť?

Anand Venugopal: Malá skupina ľudí, ktorí sa snažia ísť von a kúpiť si streamingovú analytickú platformu, je už dosť rozumná v tom, že si uvedomuje Hadoop, už získala svoje schopnosti Hadoop MapReduce a pretože úzko spolupracujú s Hadoop distribútorom, sú oboznámení. Napríklad všetko dostane Kafku. S tým niečo robia a streamovanie pomocou Storm alebo Spark je v ich doméne s otvoreným zdrojom. Určite to ľudia poznajú alebo si okolo nich budujú zručnosti. Začína to však malou skupinou ľudí, ktorí sú dostatočne kvalifikovaní a dostatočne inteligentní. Zúčastňujú sa konferencií. Učí sa, že kladú inteligentné otázky predajcom av niektorých prípadoch sa učia s predajcami. Keď predajcovia prichádzajú a prezentujú sa na prvom stretnutí, možno o nich nevedia, ale spolu prečítajú a potom si s tým začnú hrať.

Táto malá skupina ľudí je jadrom a potom sa začína rozrastať a všetci si teraz uvedomujú, že prvý prípad použitia v podnikaní sa zrealizuje. Začína vlna a my sme videli minulý týždeň na samite v Sparke, kde bol veľký podnik ako Capital One a bol v plnej sile. Rozhodli sa pre Spark. Hovorili o tom. Vychovávajú veľa svojich ľudí v programe Spark, pretože k nemu prispievajú aj v mnohých prípadoch ako používatelia. To isté vidíme v mnohých veľkých podnikoch. Začína sa niekoľkými malými súbormi veľmi inteligentných ľudí a potom sa začína vlna všeobecného vzdelávania a ľudia vedia, že akonáhle je senior viceprezident alebo akonáhle je senior režisér v zhode a chcú na túto vec vsadiť a slovo sa obíde a všetci začnú tieto schopnosti vyzdvihovať.

Dez Blanchfield: Určite máte fantastický čas aj na budovanie tých šampiónov.

Anand Venugopal: Áno. Robíme veľa vzdelávania, keď pracujeme s pôvodnými šampiónmi a organizujeme školiace kurzy a mnoho, mnohí, pre našich veľkých zákazníkov sme sa vrátili a mali vlny a tréningové vlny, aby priviedli veľa používateľov do fázy hlavného používania, najmä v lokalite Hadoop MapReduce. Zistili sme, že vo veľkej spoločnosti vydávajúcej kreditné karty, ktorá je našim zákazníkom, sme dodali najmenej päť až osem rôznych vzdelávacích programov. Máme tiež bezplatné komunitné vydania všetkých týchto produktov vrátane našich, pieskovísk, ktoré si ľudia môžu stiahnuť, zvyknúť si a vzdelávať sa týmto spôsobom.

Dez Blanchfield: To je všetko, čo mám pre vás dnes ráno. Ďakujem mnohokrát. Zdá sa mi neuveriteľne zaujímavé vidieť typy modelov a prípady použitia, ktoré pre nás dnes máte. Ďakujem.

Anand Venugopal: Skvelé. Ďakujem veľmi pekne.

Rebecca Jozwiak: Ďakujeme všetkým za to, že ste sa k nám pripojili v tomto webcaste Hot Technologies. Bolo fascinujúce počuť od Deza Blanchfielda, Dr. Robina Bloora a od Impetus Technologies, Ananda Venugopala. Ďakujem prednášajúcim. Ďakujem rečníkom a ďakujem publiku. Budúci mesiac máme ďalšiu technológiu Hot Technologies, takže ju hľadajte. Náš obsah nájdete vždy archivovaný na adrese Insideanalysis.com. We also put lots of content up on SlideShare and some interesting bits on YouTube as well.

That's all folks. Thanks again and have a good day. Bye, bye.

Využitie ohniska: získanie obchodnej hodnoty pomocou streamovacej analýzy: prepis webinára