Sila návrhu: ako katalóg údajov oprávňuje analytikov

2026

Od zamestnancov Techopedia, 22. júna 2016

Jedlo s sebou: Hostiteľka Rebecca Jozwiak diskutuje o výhodách katalógov údajov s Dezom Blanchfieldom, Robinom Bloorom a Davidom Crawfordom.

Na prezeranie videa sa musíte zaregistrovať pre túto udalosť. Zaregistrujte sa a pozrite si video.

Rebecca Jozwiak: Dámy a páni, ahoj a vitajte v službe Hot Technologies roku 2016. Dnes máme „Sila návrhu: Ako katalóg údajov umožňuje analytikom.“ Som vaša hostiteľka Rebecca Jozwiak, ktorá vyplní nášho obvyklého hostiteľa Eric. Kavanagh dnes, keď cestuje po svete, ďakujem vám, že ste sa k nám pripojili. Tento rok je horúci, nie je to len horúco v Texase, kde som, ale je horúce všade. Vyskytuje sa výbuch všetkých druhov nových technológií. Máme internet vecí, streamovanie údajov, cloudové zavádzanie, Hadoop naďalej dozrie a je adoptovaný. Máme automatizáciu, strojové učenie a všetky tieto veci sú samozrejme podčiarknuté údajmi. A podniky sa stávajú čoraz viac údajmi zo dňa na deň. A samozrejme to má viesť k poznávaniu a objavovaniu a, ako viete, k lepším rozhodnutiam. Aby sa však z údajov dalo čo najviac získať, musí byť ľahké sa k nim dostať. Ak ho budete držať uzamknutý alebo pochovaný alebo v mozgu niekoľkých ľudí v podniku, nebude to pre spoločnosť ako celok prínosom.

A tak som premýšľal o katalogizácii údajov a o chode knižníc, kde som už dávno šiel tam, kam si potreboval niečo nájsť, potreboval si preskúmať tému, alebo si našiel nejaké informácie, chodil si do knižnice, a samozrejme ste išli do katalógu kariet alebo do krabej dámy, ktorá tam pracovala. Ale bolo tiež zábavné sa túlať po okolí, ak ste sa len chceli pozrieť a určite by ste mohli objaviť niečo úhľadné, mohli by ste zistiť nejaké zaujímavé skutočnosti, ktoré ste nevedeli, ale ak ste skutočne potrebovali niečo zistiť, , a vy ste vedeli, čo hľadáte, potrebujete katalóg kariet a podnikovým ekvivalentom je samozrejme katalóg údajov, ktorý môže pomôcť objasniť všetky údaje, ktoré naši používatelia môžu obohatiť, objaviť, zdieľať, konzumovať a skutočne pomôcť. ľudia získavajú údaje rýchlejšie a ľahšie.

Dnes máme Dez Blanchfielda, nášho vlastného vedca údajov, a máme doktora Robina Bloora, nášho vlastného hlavného analytika, máme Davida Crawforda z Alation, ktorý bude hovoriť o príbehu katalogizácie údajov svojej spoločnosti, ale najprv pôjdeme s Dezom. Dez, odovzdávam ti loptu a podlaha je tvoja.

Dez Blanchfield: Ďakujem vám, ďakujem, že ste ma dnes dostali. Toto je záležitosť, o ktorú ma veľmi zaujíma, pretože takmer v každej organizácii, s ktorou sa stretávam vo svojej každodennej práci, nachádzam presne ten istý problém, o ktorom sme sa veľmi krátko zmienili v predbežnej prehliadke, a to je to, že väčšina organizácií, ktoré podnikajú viac ako niekoľko rokov, má v organizácii nespočetné množstvo údajov, rôzne formáty a v skutočnosti mám klientov, ktorí majú súbory údajov, ktoré siahajú späť do Lotus Notes, databáz, ktoré sú stále v niektorých prípady ako ich pseudointernety a oni všetci čelia tejto výzve, keď skutočne zisťujú, kde sú ich údaje a ako k nim získať prístup, kto im poskytne prístup, kedy im poskytne prístup a ako spravodlivo katalóg a ako sa dostať na miesto, kde môže každý: A) vedieť, čo je tam a čo je v ňom, a B), ako k nemu získať prístup a používať ho. Jednou z najväčších výziev je, samozrejme, jej nájdenie, ďalšou veľkou výzvou je vedieť, čo je tam a ako k nej získať prístup.

Možno dobre viem, že mám desiatky databáz, ale ja vlastne neviem, čo je tam alebo ako zistiť, čo tam je, a tak vždy, keď objavujeme údaje v predbežnom zobrazení, máte tendenciu chodiť po kancelárii a klásť otázky a kričať cez kubické steny a snažiť sa prísť na to, často moje skúsenosti sú, že dokonca zistíte, že ste putovali pred recepciu, recepciu a pýtali sa, či niekto vie, kto ideš sa porozprávať. Pomerne často to nie je vždy ľud IT, pretože nepozná súbor údajov, pretože ho niekto práve vytvoril a mohlo by to byť niečo jednoduché ako - dosť často nájdeme projekt nejakého druhu, ktorý stojí v prostredí IT a projektový manažér použil tabuľku všetkých vecí a dostal obrovské množstvo cenných informácií o aktívach, súvislostiach a názvoch, a pokiaľ tento projekt nepoznáte a nepoznáte tohto človeka, tieto informácie jednoducho nemôžete nájsť. Je to jednoducho nie je k dispozícii, a musíte sa chytiť, že pôvodný súbor.

Existuje fráza, ktorá bola zakázaná v súvislosti s údajmi, a nemusím s ňou nevyhnutne súhlasiť, ale myslím si, že je to roztomilý malý únik a to je to, že určité množstvo ľudí si myslí, že údaje sú nový olej, a ja som Určite to pokryjeme aj v niektorých aspektoch, neskôr dnes. Čo som si však všimol, určite je súčasťou tejto transformácie, je to, že organizácie podnikov, ktoré sa naučili vážiť si svoje údaje, získali oproti svojim konkurentom značnú výhodu.

Asi pred piatimi alebo šiestimi rokmi mala spoločnosť IBM zaujímavý dokument, ktorý prieskumoval okolo 4 000 spoločností tu v Austrálii a vzali všetky informácie, všetky údaje o výkonnosti, všetky finančné údaje a dali ich dohromady do vriaceho hrnca a potom poslali ju na austrálsku ekonomickú školu a v skutočnosti tu začali spoločný trend, a to je to, že spoločnosti, ktoré využívajú technológiu, vždy získali takú konkurenčnú výhodu nad svojimi rovesníkmi a konkurentmi, že ich konkurenti takmer nikdy dobehli, a myslím si, to je v súčasnosti veľmi veľa údajov, ktoré sme videli, čo ľudia nazývajú digitálna transformácia, kde organizácie, ktoré jednoznačne prišli na to, ako nájsť údaje, ktoré majú, sprístupňujú tieto údaje a sprístupňujú ich v niektorých veľmi ľahko dostupných spôsobom, bez toho, aby vždy vedeli, prečo to organizácia môže potrebovať, a získať významnú výhodu oproti konkurentom.

Na tejto snímke mám niekoľko príkladov, ktoré môžete vidieť. Moja jediná zostava je, že podľa môjho názoru sú rozsiahle narušenia takmer vo všetkých odvetviach priemyslu poháňané údajmi, a ak súčasné trendy majú čo doháňať, môj názor je, že sme sa skutočne dostali začalo, pretože keď sa dlhodobé značky konečne prebudia, čo to znamená a vstúpia do hry, vstúpia do hry vo veľkoobchode. Keď niektorí hlavní maloobchodníci, ktorí majú údaje o horách, začnú na údaje uplatňovať nejakú historickú analýzu, ak dokonca vedia, že existujú, niektorí z online hráčov dostanú trochu prebudenia.

Ale s mnohými z väčšiny týchto značiek mám na mysli, že máme Ubera, ktorý je najväčšou taxislužbou na svete. Nevlastnia žiadne taxíky, takže čo ich robí kúzelnými, aké sú ich údaje? Airbnb, najväčší poskytovateľ ubytovania, máme WeChat, najväčšiu telefónnu spoločnosť na svete, ale nemajú skutočnú infraštruktúru a žiadne telefóny, žiadne telefónne linky. Alibaba, najväčší maloobchodník na tejto planéte, ale nevlastní žiadny zo zásob. Facebook, najväčšia mediálna spoločnosť v slove. Myslím si, že v poslednej dobe mali teraz 1, 4 miliardy aktívnych používateľov údajov, čo je ohromujúce číslo. Nie je to blízko - myslím, že niekto tvrdil, že štvrtina planéty je tam každý deň, a napriek tomu tu je poskytovateľ obsahu, ktorý vlastne nevytvára obsah, všetky údaje, ktoré slúžia, nie sú nimi vytvorené, sú vytvorené ich predplatiteľmi a všetci vieme tento model.

SocietyOne, o ktorej ste možno alebo možno nepočuli, je to miestna značka. Myslím si, že v niekoľkých krajinách je to banka, ktorá skutočne poskytuje pôžičky typu „peer-to-peer“, inými slovami, nemá peniaze. Všetko, čo robí, je to, že riadi transakcie a údaje sú umiestnené pod nimi. Netflix, všetci sme s tým veľmi dobre oboznámení. Je tu zaujímavá jednodielna vložka. Keď sa Netflix legálne mohol používať v Austrálii, keď to bolo oficiálne oznámené, nemuseli ste na to používať VPN, veľa ľudí po celom svete má sklon - ak sa k nemu nemôžete dostať vo vašej miestnej oblasti - keď bola v Austrálii spustená sieť Netfix, zvýšila sa medzinárodná šírka pásma na našich internetových odkazoch o 40 percent, takže sa takmer zdvojnásobilo používanie internetu v Austrálii cez noc, a to iba jednou aplikáciou, jednou aplikáciou hostovanou v cloude, ktorá nerobí nič iné ako hrať s údajmi. Je to iba ohromujúca štatistika.

A samozrejme, všetci sme oboznámení s Apple a Google, ale toto sú najväčšie softvérové firmy na tejto planéte, ale v skutočnosti tieto aplikácie nepíšu. Čo je konzistentné so všetkými týmito organizáciami? Sú to údaje a oni sa tam nedostali, pretože nevedeli, kde sú ich údaje, a nevedeli, ako ich katalogizovať.

Teraz zisťujeme, že existuje celá táto nová trieda aktív označovaná ako údaje a spoločnosti sa prebúdzajú. Nie vždy však majú k dispozícii nástroje a know-how a na to, aby zmapovali všetky tieto údaje, katalogizovali všetky tieto údaje a sprístupnili ich. Zistili sme však, že spoločnosti s takmer žiadnym fyzickým majetkom získali vysokú trhovú hodnotu v zaznamenajte čas prostredníctvom tejto novej triedy dátových prostriedkov. Ako som už povedal, niektorí zo starých hráčov sa teraz preberajú a určite to vyvedú.

Som veľkým fanúšikom toho, že si vezmem ľud na malú cestu, takže v osemnástich stovkách, neskoro osemnástych stovkách, a budete sa toho viac než oboznámiť na americkom trhu, ukázalo sa, že vedie sčítanie každý rok asi tak, myslím, že ich v tom čase spravovali každých desať rokov, ale ak sa chystáte vykonať sčítanie ľudu každý rok, mohlo by to trvať až osem alebo deväť rokov, kým sa analýza údajov skutočne uskutoční. Ukázalo sa, že tento súbor údajov sa potom ponechal v škatuliach na miestach v papieri a takmer ho nikto nemohol nájsť. Tieto správy stále čerpali, ale skutočné údaje sa k nim veľmi ťažko dostali, máme podobnú situáciu s iným svetovým významným okamihom, okolo štyridsiatych rokov 20. storočia, s druhou svetovou vojnou, a to je Bletchley Park, ktorý Bombe hlási BOMBE., a bol to obrovský analytický nástroj na rozbíjanie čísel, ktorý by prešiel malými množinami údajov a našiel v ňom signály, a použil by sa na pomoc pri rozbíjaní kódov cez Enigmu.

Táto vec bola opäť v podstate zariadením navrhnutým, nie príliš na katalogizáciu, ale na označovanie a mapovanie údajov a umožnenie odoberania vzorov a ich nájdenia v súboroch údajov, v tomto prípade, zlomových kódov, nájdenie kľúčov a fráz a nájdenie pravidelne v súboroch údajov, a tak sme prešli touto cestou hľadania vecí v údajoch a viedli sme k katalogizácii údajov.

A potom prišli tieto veci, tieto masívne nízkonákladové regály strojov, len stroje, ktoré sa nenachádzajú v regáloch. A urobili sme niekoľko veľmi zaujímavých vecí a jednou z vecí, ktoré sme s nimi urobili, je vybudovanie klastrov s veľmi nízkymi nákladmi, ktoré by mohli začať indexovať planétu, a veľmi dobre tieto veľké značky prichádzali a odchádzali, ale pravdepodobne je Google najbežnejším domovom. značka, o ktorej sme všetci počuli - stalo sa skutočným slovesom a viete, že ste úspešní, keď sa z vašej značky stane sloveso. Čo nás však Google naučil bez toho, aby si to uvedomil, možno v obchodnom svete, je to, že dokázali indexovať celú planétu na určitú úroveň a katalogizovať údaje, ktoré boli na celom svete, a sprístupniť ich veľmi ľahko, pohodlný formulár v malej malej jednoriadkovej receptúre, webová stránka, na ktorej je takmer nič, a napíšete svoj dopyt, ide a nájde ho, pretože už planétu už indexovo prehľadali, indexovali a ľahko sprístupnili.

A čo sme si všimli, bolo: „Dobre, pokračujte, nerobíme to v organizáciách - prečo je to tak? Prečo je to, že máme organizáciu, ktorá dokáže mapovať celú planétu a indexovať ju, indexovo prehľadávať a indexovať a sprístupňovať ju, môžeme ju vyhľadať a potom kliknúť na vec a nájsť ju, ako to, že neurobili ste to interne? “Takže v súčasnosti existuje veľa týchto malých stojanov strojov na celom svete, ktoré to robia pre intranety a hľadajú veci, ale stále sa naozaj len vyrovnávajú s myšlienkou prekročiť tradičný web. stránku alebo súborový server.

Namiesto toho, aby sa teraz vstupovalo do tejto ďalšej generácie dátového katalógu mnohými spôsobmi, objavovanie prístupu k údajom prostredníctvom poznámok post-it a konverzácií s vodným chladičom už nie je v skutočnosti vhodnou metódou na vyhľadávanie a katalogizáciu údajov a v skutočnosti si nemyslím, že by to niekedy bolo. naozaj bol. Nemôžeme už viesť túto celú výzvu ľuďom, ktorí len posielajú poznámky, posielajú poznámky a rozprávajú sa o tom. Teraz sme dobre a skutočne za hranicami, kde prišiel a odišiel tento prístup novej generácie k katalogizácii údajov. Musíme to objať. Keby to bol ľahký problém, už by sme ho vyriešili už mnohými spôsobmi, ale myslím si, že to nie je ľahký problém, iba indexovanie a volanie údajov je iba jednou jeho časťou, pretože vieme, čo je v údajoch a vytváranie metaúdajov okolo toho, čo objavíme, a potom ich sprístupnenie v ľahkej konzumnej forme, najmä pre samoobslužné a analytické účely. Je to stále problém, ktorý sa má vyriešiť, ale mnohé časti skladačky za päť rokov sú dobre a skutočne vyriešené a dostupné.

Ako vieme, údaje o katalogizácii ľudí sú receptom na zlyhanie, pretože ľudská chyba je jednou z najväčších nočných morí, s ktorými sa zaoberáme pri spracovaní údajov, a pravidelne o tejto téme hovorím, kde podľa môjho názoru sú ľudia, ktorí vyplňujú papierové formuláre, pravdepodobne najväčšou nočnou morou. zaoberáme sa veľkými dátami a analytikou, neustálym opravovaním vecí, ktoré robia, a to aj po jednoduchých veciach, ako sú dátumy a polia, ľudia ich uvádzajú v nesprávnom formáte.

Ako som však už povedal, každý deň sme videli internetové vyhľadávacie nástroje indexovať svet, takže teraz robíme myšlienku, že to možno urobiť v súboroch obchodných údajov v procese zisťovania, a nástroje a systémy sú teraz ľahko dostupné, ako sa chystáte dnes naučiť. Trik je teda podľa môjho názoru výberom správnych nástrojov, najlepších nástrojov pre danú prácu. A ešte vhodnejšie je nájsť tú správnu časť, ktorá vám pomôže začať touto cestou. A verím, že o tom budeme počuť dnes, ale skôr, ako to urobíme, pôjdem na svoju školu Robin Bloor a vypočujem si jeho tému. Robin, môžem ťa preniesť?

Robin Bloor: Áno, určite môžete. Uvidíme, či to funguje, ach áno. Dobre, prichádzam z iného smeru, ako je Dez, ale nakoniec skončím na rovnakom mieste. Ide o pripojenie k údajom, tak som si myslel, že prejdem realitou pripojenia k údajom, skutočne bod po bode.

Faktom je, že údaje sú fragmentovanejšie ako kedykoľvek predtým. Objem údajov síce fenomenálne rastie, ale v skutočnosti rôzne zdroje údajov tiež rastú neuveriteľnou rýchlosťou, a preto sa údaje stále viac fragmentujú. Ale najmä kvôli analytickým aplikáciám - ale nie sú to jediné aplikácie - máme naozaj dobrý dôvod na pripojenie ku všetkým týmto údajom, takže sme uviaznutí v náročnom mieste, uviaznutí vo svete fragmentovaných údajov, a v údajoch je príležitosť, ako to nazýval Dez, nový olej.

Čo sa týka údajov, žilo to na rotujúcich diskoch, buď v súborových systémoch alebo v databázach. Teraz žije v oveľa rozmanitejšom prostredí, žije v súborových systémoch, ale v súčasnosti tiež žije v inštanciách Hadoop alebo dokonca v prípadoch Spark. Žije vo viacerých druhoch databázy. Nie je to tak dávno, čo sme štandardizovali nejakú relačnú databázu, viete, že za posledných päť rokov vyšlo okno, pretože existuje potreba databáz dokumentov a databáz grafov, takže viete, hra má zmenilo. Žilo to na rotujúcom disku, ale teraz žije na SSD. Najnovšie množstvo SSD - určite najnovšia jednotka SSD vychádza od spoločnosti Samsung - dvadsať gigabajtov, čo je obrovské. Teraz to žije v pamäti v tom zmysle, že prvotná kópia údajov môže byť v pamäti, a nie na disku, na vytvorenie takýchto systémov sme nepoužili; my teraz. A žije v oblaku. Čo znamená, že môže žiť v ktorejkoľvek z týchto vecí, v cloude nemusíte nevyhnutne vedieť, kde sa nachádza v cloude, budete mať iba jeho adresu.

Len aby sme sa dostali domov, Hadoop zatiaľ zlyhal ako rozšíriteľný dátový sklad. Dúfali sme, že sa to stane rozšíriteľným dátovým úložiskom s rozšíriteľným rozsahom a že sa stane len jedným súborovým systémom pre všetko, čo by sa dalo - na oblohe sa objavia dúhy, v podstate a jednorožce sa budú tancovať okolo, a nič z toho sa nestalo. Čo znamená, že sme skončili s problémom prenosu údajov a niekedy nie je potrebné prenášať údaje, ale je to tiež problém. Dáta dnes v skutočnosti majú gravitáciu, keď sa dostanete do multiterabytov údajov, zdvihnete ich a rozhadzujete, spôsobujú latencie, ktoré sa objavia vo vašej sieti alebo sa objavia na rôznych miestach. Ak chcete prenášať údaje v okolí, načasovanie je faktor. V súčasnosti existujú takmer vždy obmedzenia, koľko času musíte na to, aby ste dostali jednu vec, jedno údaje z jedného miesta na druhé miesto. Bývaly to, čo sme si mysleli ako dávkové okná, keď bol stroj trochu nečinný, a bez ohľadu na to, koľko údajov ste mali, mohli ste ich jednoducho vyhodiť a všetko by fungovalo. Je to preč, žijeme v oveľa väčšom svete v reálnom čase. Preto je načasovanie faktorom. Akonáhle chcete dáta presunúť, takže ak majú dáta gravitáciu, pravdepodobne ich nemôžete presunúť.

Správa údajov je faktorom v tom zmysle, že ste skutočne museli spravovať všetky tieto údaje, ktoré nedostanete bezplatne, a preto môže byť potrebné vykonať replikáciu, aby ste skutočne získali údaje na vykonanie úlohy, ktorú potrebuje, pretože nemusí to byť kdekoľvek. Nemusí mať dostatočné zdroje na to, aby mohla vykonávať bežné spracovanie údajov. Dáta sa teda replikujú a údaje sa replikujú viac, ako by ste si predstavovali. Myslím, že mi niekto dávno povedal, že priemerná časť údajov sa replikuje najmenej dva a polkrát. ESB alebo Kafka predstavujú možnosť pre tok dát, ale v súčasnosti to vyžaduje architektúru. V dnešnej dobe skutočne musíte tak či onak premýšľať o tom, čo to vlastne znamená hádzať údaje. Preto je zvyčajne vhodnejšie pristupovať k údajom tam, kde sú, pokiaľ samozrejme získate výkon, ktorý potrebujete, keď v skutočnosti idete na údaje a to závisí od kontextu. Takže je to aj tak ťažká situácia. Pokiaľ ide o dátové dotazy, zvykli sme si myslieť z hľadiska SQL, prišli sme naozaj teraz, viete, rôzne formy dotazov, SQL áno, ale susediace, tiež grafové otázky, Spark je iba jedným z príkladov robíme graf, pretože tiež musíme viac ako kedykoľvek predtým robiť textové vyhľadávanie, tiež regulárny typ vyhľadávaní, čo je skutočne zložité vyhľadávanie vzorov a skutočné párovanie vzorov, všetky tieto veci v skutočnosti prebublávajú. A všetky z nich sú užitočné, pretože vás dostanú tým, čo hľadáte, alebo vás môžu dostať to, čo hľadáte.

Dopyty teraz pokrývajú viacero údajov, takže sa tak nestalo vždy a výkon je často nepríjemný, ak tak urobíte. Závisí to od okolností, ale ľudia očakávajú, že budú môcť vyhľadávať údaje z viacerých zdrojov údajov, takže federácia údajov jedného druhu sa stáva čoraz aktuálnejšou. Virtualizácia údajov, ktorá je v závislosti od výkonu odlišným spôsobom, je tiež veľmi bežná. Dotazy na údaje sú vlastne súčasťou procesu, nie celého procesu. Je len potrebné zdôrazniť, že ak sa skutočne pozeráte na analytický výkon, skutočná analytika môže trvať omnoho dlhšie ako zhromažďovanie údajov, pretože to závisí od okolností, ale ak chcete robiť akékoľvek otázky, sú absolútne nevyhnutné údaje o nich. analytika na viacerých zdrojoch údajov a len musíte skutočne mať možnosti, ktoré pokrývajú.

Takže o katalógoch. Katalógy existujú z nejakého dôvodu, aspoň hovoríme, že, viete, máme adresáre a máme schémy v databázach, a každý katalóg máme a kamkoľvek idete, nájdete jedno miesto a potom skutočne zistíte, že existuje nejaký katalóg a zjednotený globálny katalóg je očividne dobrý nápad. Ale len veľmi málo spoločností má takú vec. Pamätám si, už v roku dvetisíc - panike dvetisíc rokov - pamätám si, že komunisti nedokázali presne určiť, koľko spustiteľných súborov mali, nezáleží na tom, koľko rôznych dátových skladov mali, a pravdepodobne je to tak teraz, viete, že väčšina spoločností v globálnom zmysle aktívne nevie, aké údaje majú. Je zrejmé, že je čoraz nevyhnutnejšie mať globálny katalóg alebo aspoň mať globálny obraz o tom, čo sa deje v dôsledku rastu zdrojov údajov a pokračujúceho rastu aplikácií, a to je obzvlášť potrebné pre analytiku, pretože tiež jedným spôsobom, a sú tu aj ďalšie problémy, ako je počet riadkov a problémy s údajmi, a je potrebné pre bezpečnosť, veľa aspektov správy údajov, ak naozaj neviete, aké údaje máte, nápad že sa chystáte riadiť, je jednoducho absurdné. Takže v tomto prípade sú všetky údaje katalogizované nejakým spôsobom, je to len fakt. Otázka znie, či je katalóg koherentný a čo s tým vlastne môžete urobiť. Takže pôjdem späť do Rebeccy.

Rebecca Jozwiak: Dobre, vďaka Robin. Až nasledujúceho sme dostali Davida Crawforda z Alation, Davida idem ďalej a odovzdať loptu vám, a môžete si ho vziať preč.

David Crawford: Ďakujem veľmi pekne. Naozaj si cením, že ma máte na tejto show. Myslím, že to začnem, takže si myslím, že mojou úlohou tu je zobrať časť tejto teórie a zistiť, ako sa v skutočnosti uplatňuje, a výsledky, ktoré sme schopní riadiť u skutočných zákazníkov, a tak môžete vidieť pár na snímke, chcem hovoriť o tom, aké výsledky uvidíme pri analytických možných vylepšeniach. Aby sme motivovali diskusiu, budeme hovoriť o tom, ako sa tam dostali. Mám teda šťastie, že môžem veľmi úzko spolupracovať s mnohými skutočne inteligentnými ľuďmi, týmito zákazníkmi, a chcem len poukázať na pár ľudí, ktorí boli schopní skutočne zmerať, a hovoriť o tom, ako ovplyvnil dátový katalóg ich analytikov. pracovný tok. A aby som zostal v popredí, myslím si, že jednou z vecí, ktoré vidíme zmeniť, s dátovými katalógmi verziami predchádzajúce sprostredkované riešenia a jedným zo spôsobov, ako vzťahy skutočne premýšľajú o riešeniach, ktoré sme dali dokopy, je začať od analytikov. a pracovať späť. Povedzme, že ide o umožnenie produktivity analytikov. Na rozdiel od jednoduchého dodržiavania predpisov alebo iba inventarizácie robíme nástroj, ktorý zvyšuje produktivitu analytikov.

Takže, keď hovorím s údajovým vedcom v spoločnosti Financial Services Company Square, je tu chlapík, Nick, ktorý nám hovoril o tom, ako jeho, zabral niekoľko hodín, aby našiel ten správny súbor údajov, aby mohol začať správu, teraz môže urobte to behom niekoľkých sekúnd pomocou vyhľadávania podľa trhového podielu, rozprávali sme sa s ich CTO, ktorý pritiahol svojich analytikov, ktorí používali Square, ospravedlňte ma, používali Alation, aby zistili, aké sú ich výhody, aké výhody videli, a oznámili 50 percentuálna podpora produktivity a že jeden z popredných svetových maloobchodníkov, eBay, má viac ako tisíc ľudí, ktorí pravidelne vykonávajú analýzu SQL, a ja tam veľmi úzko spolupracujem s Deb Says, ktorý je projektom. manažérka v ich tíme dátových nástrojov a zistila, že keď si pýtatelia osvojia Alation, prijmú katalóg, vidia dvojnásobnú rýchlosť zápisu nových dopytov do databázy.

Takže to sú skutočné výsledky, sú to ľudia, ktorí skutočne používajú katalóg vo svojej organizácii, a ja vás chcem sprevádzať tým, čo je potrebné na zostavenie. Ako sa v spoločnosti vytvorí katalóg a možno najdôležitejšou vecou je, že sa to deje automaticky, takže Dez hovoril o systémoch, učení sa o systémoch a presne to robí moderný katalóg údajov. Nainštalujú Alation do svojho dátového centra a potom ho pripoja k rôznym zdrojom metaúdajov v ich dátovom prostredí. Trochu sa sústredím na databázy a nástroje BI - z týchto dvoch budeme extrahovať technické metaúdaje, v podstate o tom, čo existuje. Správne, aké tabuľky? Aké správy? Čo sú definície správy? Takto extrahujú tieto technické metaúdaje a automaticky sa vytvorí stránka katalógu pre každý objekt vo vnútri týchto systémov, a potom tiež extrahujú a navrstvia navrch týchto technických metaúdajov, navrstvia navrch údaje o použití. To sa deje predovšetkým čítaním protokolov dotazov z databázy, čo je skutočne zaujímavý zdroj informácií. Takže kedykoľvek analytik píše dotaz, kedykoľvek nástroj na vytváranie prehľadov, či už ide o domáce pestovanie alebo mimo regálu, či nástroj na tvorbu prehľadov spustí dotaz s cieľom aktualizovať informačný panel, keď aplikácia spustí dotaz na vloženie údajov, na ktorých bude pracovať množina údajov - všetky tieto veci sú zachytené v protokoloch databázových dopytov. Či už máte katalóg alebo nie, sú zachytené v protokole dotazov s databázou. Čo môže katalóg údajov urobiť, a najmä to, čo môže katalóg Alation urobiť, je prečítať si tieto denníky, spýtať sa na ne vo vnútri nich a na základe týchto protokolov vytvoriť skutočne zaujímavý graf použitia a my ich uvádzame do hry, aby sme informovali budúcich používateľov. údajov o tom, ako ich používali používatelia v minulosti.

Takže všetky tieto vedomosti spájame do katalógu a len preto, aby sa to stalo skutočnosťou, jedná sa o integrácie, ktoré sú už nasadené u zákazníkov, takže sme videli Oracle, Teradata, Redshift, Vertica a veľa ďalších relačné databázy. Vo svete Hadoop existuje škála SQL na Hadoop, druh relačných obchodov, meta obchody na vrchole systému súborov Hadoop, Impala, Tez, Presto a Hive, sme tiež videli úspech so súkromnými poskytovateľmi cloudu Hadoop ako Altiscale a my boli tiež schopní pripojiť sa k serverom Tableau, serverom MicroStrategy a indexovať dashboardy tam, ako aj integráciu s nástrojmi mapovania údajov, ako je Plotly.

Preto sa pripájame ku všetkým týmto systémom, pripájame tieto systémy k zákazníkom, vtiahli sme technické metaúdaje, vtiahli sme údaje o používaní a automaticky sme automaticky pripravili katalóg údajov, ale takto sme centralizácia znalostí, ale iba centralizácia vecí do dátového katalógu, sama osebe neposkytuje tie skutočne úžasné zvyšovania produktivity, o ktorých sme hovorili s eBay, Square a podielom na trhu. Aby sme to mohli urobiť, musíme skutočne zmeniť spôsob, akým uvažujeme o poskytovaní poznatkov analytikom. Jednou z otázok, na ktorú sa chcú pripraviť, bolo: „Aký vplyv má katalóg na analytický postup?“

To je to, čo trávime celý deň premýšľaním, a aby sme mohli hovoriť o tejto zmene myslenia, modelu push verses pull, chcel som urobiť rýchlu analógiu s tým, aký bol svet pred a po prečítaní na Kindle. Takže je to len skúsenosť, ktorú niektorí z vás môžu mať, keď čítate fyzickú knihu, narazíte na slovo, nie ste si istí, či dobre viete definíciu toho slova, môžete ju uhádnuť z kontextu, nie tak pravdepodobné, že idú vstať z gauča, prejsť do knižnice, nájsť si slovník, poprášiť ho a otočiť na správne miesto v abecednom zozname slov, aby si sa ubezpečil, že áno, mali ste túto definíciu v poriadku a viete, jej nuansy. Takže sa to naozaj nestane. Takže si kúpite aplikáciu Kindle a začnete tam čítať knihy a uvidíte slovo, o ktorom si nie ste úplne istí, a dotknete sa ho. Zrazu, práve na tej istej obrazovke, je definícia slovníka v slovníku, so všetkými jeho nuansami, rôznymi príkladmi použitia a trochu prejdením prstom, a získate článok z Wikipedia o tejto téme, prejdením prstom znova, získate prekladateľský nástroj, ktorý ho dokáže preložiť do iných jazykov alebo z iných jazykov, a zrazu je vaša znalosť jazyka oveľa bohatšia a iba niekoľkokrát sa stáva ohromujúcou v porovnaní s tým, kedy ste museli ísť a vytiahnite tento zdroj pre seba.

A tak budem tvrdiť, že pracovný postup pre analytika a spôsob, akým sa analytik bude zaoberať dokumentáciou o údajoch, je v skutočnosti veľmi podobný tomu, ako čitateľ bude interagovať so slovníkom, či už fyzickým, alebo hoci Kindle, a tak to, čo sme skutočne videli, ako sa zvýšila táto produktivita, nie je šírenie katalógu, ale jeho prepojenie s pracovným tokom analytika, a tak ma požiadali, aby som tu urobil demo, a chcem aby bola táto prezentácia zameraná. Chcem však len nastaviť kontext pre ukážku. Keď premýšľame o presúvaní poznatkov o údajoch k používateľom, keď ich potrebujú, myslíme si, že je to správne miesto, kde trávia svoj čas a kde robia analýzu, je dotazovací nástroj SQL. Miesto, kde môžete písať a spúšťať dotazy SQL. A tak sme jednu zostavili, a postavili sme ju a vec, ktorá sa v nej skutočne líši od ostatných nástrojov na dotazovanie, je jej hlboká integrácia s katalógom údajov.

Náš vyhľadávací nástroj sa preto nazýva Alation Compose. Je to webový dopytovací nástroj a za pár sekúnd vám ho ukážem. Nástroj na vyhľadávanie na webe, ktorý funguje vo všetkých tých databázových logách, ktoré ste videli na predchádzajúcej snímke. Konkrétne sa pokúsim ukázať spôsob, akým katalógové informácie prichádzajú k používateľom. A to prostredníctvom týchto troch rôznych spôsobov. Uskutočňuje to prostredníctvom zásahov a tam môže niekto, kto je správcom údajov alebo správcom údajov alebo nejakým správcom alebo správcom, povedať: „Chcem nejaký zásah do poznámky alebo varovania v a uistite sa, že je doručený používateľom v správnom čase. “Takže to je zásah a ukážeme to.

Inteligentné návrhy je spôsob, ktorým nástroj využíva všetky svoje súhrnné znalosti katalógu na navrhovanie objektov a častí dotazu počas jeho písania. Najdôležitejšou vecou, ktorú je potrebné vedieť, je to, že na to skutočne využíva protokol dotazov, navrhuje veci založené na použití a tiež na nájdenie dokonca aj tých častí otázok, ktoré boli predtým napísané. A ukážeme to.

A potom ukážky. Ukážky sú, keď píšete názov objektu, ukážeme vám všetko, čo katalóg vie, alebo aspoň najdôležitejšie veci, ktoré katalóg o danom objekte vie. Takže vzorky údajov, ktoré ich predtým používali, logický názov a popis tohto objektu, prídu k vám, keď ich píšete, bez toho, aby ste ich museli pýtať.

Takže bez ďalšieho rozprávania sa dostanem k demonštrácii a budem čakať, až sa objaví. Tu vám ukážem dotazovací nástroj. Je to vyhradené rozhranie na písanie SQL. V istom zmysle je to oddelené rozhranie od katalógu. Dez a Robin hovorili o katalógu a ja trochu preskočím cez rozhranie katalógu priamo k tomu, ako sa to prinesie priamo do servisu pracovného toku.

Práve tu ukazujem miesto, kde môžem písať SQL, a na spodku uvidíte, že sa objavujú nejaké informácie o objektoch, na ktoré odkazujeme. Takže začnem zadávať dopyt a zastavím sa, keď sa dostanem k jednému z týchto zásahov. Takže napíšem „select“ a chcem rok. Chcem meno. A ja sa pozriem na nejaké údaje o mzdách. Toto je súbor údajov o vzdelávaní. Má informácie o vysokých školách a pozerám sa na priemerný plat fakulty, ktorý je v jednej z týchto tabuliek.

Takže som napísal slovo „plat“. Takto to tak nie je presne v názve stĺpca. Na vytváranie návrhov používame logické aj fyzické metadáta. A na tomto mieste chcem zdôrazniť toto žlté pole, ktoré sa tu objavuje. V tomto stĺpci sa zobrazuje upozornenie. Nehľadal som to, nebral som triedu o tom, ako správne používať tieto údaje. Prišlo mi to a je to varovanie pred dohodou o mlčanlivosti, ktorá sa týka týchto údajov. Takže existujú nejaké pravidlá zverejňovania. Ak sa chystám tieto údaje spýtať, údaje z tejto tabuľky vyberiem, mal by som byť opatrný pri ich zverejňovaní. Takže tu máte politiku riadenia. Ak viem o tom v čase, keď sa pozerám na údaje, je tu niekoľko problémov s dodržiavaním, ktoré uľahčujú dodržiavanie týchto pravidiel.

Tak to mám prísť a potom sa tiež pozriem na školné. A tu vidíme ukážky vstupujúce do hry. V tomto stĺpci školenia vidím - v tabuľke inštitúcií je stĺpec školenia a vidím jeho profil. Alácia ide a vytiahne vzorové údaje z tabuliek av tomto prípade mi ukazuje niečo, čo je celkom zaujímavé. Ukazuje mi rozloženie hodnôt a ukazuje mi, že nulová hodnota sa vo vzorke prejavila 45-krát a viac ako ktorákoľvek iná hodnota. Mám teda nejaký zmysel, že by nám mohli chýbať nejaké údaje.

Ak som pokročilý analytik, môže to byť už súčasťou môjho pracovného postupu. Najmä ak som obzvlášť dôkladný, kde by som vopred urobil veľa profilovacích otázok. Vždy, keď sa blížim k novému údaju, vždy premýšľam o tom, čo je naše pokrytie údajov. Ale ak som nová v analýze údajov, ak som nová v tejto množine údajov, možno predpokladám, že ak existuje stĺpec, vyplní sa stále. Alebo by som mohol predpokladať, že ak nie je vyplnený, nie je to nula, je null alebo niečo také. Ale v tomto prípade máme veľa núl, a ak by som urobil priemer, pravdepodobne by sa mýlili, keby som len predpokladal, že tieto nula boli v skutočnosti nula namiesto chýbajúcich údajov.

Ale Alation tým, že uvediete túto ukážku do svojho pracovného toku, vás druh požiada, aby ste sa na tieto informácie pozreli, a dáva tak istým druhom začínajúcich analytikov šancu vidieť, že je tu niečo, čo by ste si mali o týchto údajoch všimnúť. Máme teda tento náhľad.

Ďalšia vec, ktorú budem robiť, je, že sa pokúsim zistiť, z ktorých tabuliek získam tieto informácie. Takže tu vidíme inteligentné návrhy. Už to bolo stále, ale najmä tu som nič nenapísal, ale navrhne mi, ktoré tabuľky by som chcela pre tento dotaz použiť. Najdôležitejšou vecou o tom je, že využíva štatistiky používania. Takže v prostredí, ako je napríklad eBay, kde máte stovky tisíc tabuliek v jednej databáze, je k dispozícii nástroj, ktorý dokáže zasiahnuť pšenicu z plev, a pomocou týchto štatistík využitia je skutočne dôležité návrhy za niečo stojí.

Takže to navrhne túto tabuľku. Keď sa pozriem na ukážku, v skutočnosti zvýrazníme tri stĺpce, ktoré som už uviedol vo svojom dotaze. Takže viem, že majú tri, ale nemá meno. Musím získať meno, takže sa chystám pripojiť. Keď sa pripojím, teraz mám opäť tieto ukážky, ktoré mi pomôžu nájsť, kde je tabuľka s menom. Takže vidím, že tento má pekne formátované a správne písané veľké písmeno. Zdá sa, že pre každú inštitúciu je jeden riadok s názvom, takže to chcem chytiť a teraz potrebujem stav pripojenia.

A to, čo Alation robí, sa opäť obracia na protokoly dotazov, keď videl predchádzajúce časy, keď sa tieto dve tabuľky spojili, a navrhuje rôzne spôsoby, ako sa k nim pripojiť. Opäť je tu nejaký zásah. Ak sa pozriem na jednu z nich, dostane upozornenie, ktoré mi ukazuje, že by sa to malo použiť iba na súhrnnú analýzu. Pravdepodobne spôsobí nesprávnu vec, ak sa pokúšate niečo urobiť prostredníctvom inštitúcie podľa inštitúcie. Zatiaľ čo táto s OPE ID je schválená ako správny spôsob spojenia týchto dvoch tabuliek, ak chcete údaje na univerzitnej úrovni. Robím to a je to krátky dotaz, ale napísal som ho bez toho, aby som musel mať nevyhnutne prehľad o tom, aké údaje sú. Nikdy som sa nepozrel na ER diagram tohto súboru údajov, ale o týchto údajoch viem už dosť, pretože mi prichádzajú príslušné informácie.

Toto sú tri druhy spôsobov, ako môže katalóg pomocou integrovaného nástroja na dotazovanie priamo ovplyvniť pracovný tok pri písaní dopytov. Jednou z ďalších výhod integrovania dotazovacieho nástroja do katalógu je však to, že po dokončení dotazu a jeho uložení môžem zadať názov „Inštitúcia - školné a mzda na fakulte“ a potom tu mám tlačidlo, ktoré umožňuje mi to iba zverejniť v katalógu. Je pre mňa veľmi ľahké nakŕmiť to. Aj keď to nezverejníme, zachytáva sa ako súčasť protokolu dotazov, ale keď ho zverejníme, v skutočnosti sa stane súčasťou spôsobu, akým centralizované miesto, kde žijú všetky vedomosti o údajoch.

Takže ak kliknem na položku Vyhľadať všetky dopyty v službe Alation, dostanem sa - a tu uvidíte ďalšie rozhranie katalógu - prejdem na vyhľadávanie vyhradených dopytov, ktoré mi ukáže spôsob, ako hľadať otázky naprieč celá organizácia. A vidíte, že môj novo zverejnený dotaz je na vrchu. A niektorí si tu môžu všimnúť, keď zachytávame otázky, tiež zachytávame autorov a tento vzťah medzi mnou ako autorom a týmito dátovými objektmi, o ktorých viem niečo teraz viem, nadviazal. A ja som ustanovený ako expert na tento dotaz a na tieto dátové objekty. Je to naozaj užitočné, keď ľudia potrebujú ísť dozvedieť sa o údajoch, potom môžu ísť nájsť tú pravú osobu, o ktorej by sa mali dozvedieť viac. A ak som v skutočnosti novým údajom, či už som pokročilý analytik - ako pokročilý analytik by som sa na to mohol pozrieť a vidieť veľa príkladov, ktoré by mi pomohli začať s novým súborom údajov. Ako niekto, kto sa nemusí cítiť veľmi dôvtipný s SQL, môžem nájsť vopred pripravené otázky, ktoré sú hláseniami, ktoré môžem využiť.

Tu je jeden z Phil Mazanett o priemerných skóre SAT. Kliknite na toto a dostanem nejakú stránku katalógu pre samotný dotaz. Hovorí o článku, ktorý bol napísaný a ktorý odkazuje na tento dotaz, takže je tu nejaká dokumentácia, ktorú si môžem prečítať, ak sa chcem naučiť, ako ho používať. A môžem ho otvoriť v dotazovacom nástroji kliknutím na tlačidlo Napísať a môžem ho spustiť aj tu bez toho, aby som ho upravoval. A v skutočnosti uvidíte trochu našich ľahkých funkcií prehľadov, kde keď píšete dopyt, môžete spadnúť do premennej šablóny, ako je táto, a vytvára jednoduchý spôsob vytvorenia formulára na vykonávanie dotazu na pár parametrov.

To je to, čo mám pre ukážku. Prejdem späť na snímky. Aby sme to rekapitulovali, ukázali sme, ako môže správca, správca údajov, zasiahnuť prostredníctvom upozornení na objekty, ktoré sa zobrazujú v dotazovacom nástroji, ako Alation využíva svoje znalosti o používaní dátových objektov na vytváranie inteligentných návrhov, ako prináša v profilovaní a ďalších tipoch na zlepšenie pracovných postupov analytikov, keď sa dotýkajú konkrétnych objektov, a spôsobu, akým sa všetky takéto druhy kanálov vracajú späť do katalógu pri písaní nových dopytov.

Zrejme som hovorcom v mene spoločnosti. Budem hovoriť pekné veci o katalógoch údajov. Ak chcete počuť priamo od jedného z našich zákazníkov, Kristie Allen v spoločnosti Safeway vedie tím analytikov a má skutočne skvelý príbeh o čase, keď musela skutočne poraziť hodiny, aby mohla uskutočniť marketingový experiment, a ako celá jej Tím použil Alation na spoluprácu a obrat v tomto projekte. Ak chcete skontrolovať tento príbeh, môžete sledovať tento bit.ly odkaz, alebo ak sa chcete dozvedieť niečo o tom, ako Alation môže priniesť katalóg údajov do vašej organizácie, radi vám zostavíme prispôsobené demo. Mnohokrat dakujem.

Rebecca Jozwiak: Ďakujem veľmi pekne, Davide. Som si istý, že Dez a Robin majú pár otázok, než sa obrátim na otázky a odpovede pre divákov. Dez, chceš ísť prvý?

Dez Blanchfield: Určite. Páči sa mi myšlienka tohto konceptu publikovaných dopytov a jeho spätné prepojenie so zdrojom autora. Bol som dlhoročným majstrom tejto myšlienky interného obchodu s aplikáciami a myslím si, že je to skutočne skvelý základ, na ktorom sa dá stavať.

Prišiel som za účelom nejakého nahliadnutia do niektorých organizácií, ktoré vidíte, ako to robia, a do niektorých úspešných príbehov, ktoré mohli mať s celou touto cestou, nielen že využívajú váš nástroj a platformu na objavovanie údajov, ale potom tiež transformujú svoje vnútorné kultúrne a behaviorálne vlastnosti. Teraz majú tento druh interného obchodu s aplikáciami, kde si len sťahujete, koncept, v ktorom ho nielen nájdu, ale v skutočnosti môžu začať rozvíjať malé komunity s držiteľmi týchto znalostí.

David Crawford: Áno, myslím, že sme boli prekvapení. Veríme v hodnotu zdieľania otázok, a to tak z mojej minulosti ako produktového manažéra v spoločnosti Adtech, ako aj od všetkých zákazníkov, s ktorými sme sa rozprávali, ale stále ma prekvapilo, ako často je to jedna z prvých vecí, ktoré zákazníci hovoriť o hodnote, ktorú dostanú z Alácie.

Uskutočňoval som nejaké užívateľské testovanie dotazovacieho nástroja u jedného z našich zákazníkov s názvom Invoice2go a mali produktového manažéra, ktorý bol relatívne nový, a povedali - v skutočnosti mi počas užívateľského testu povedal: „Vlastne by som písať SQL, s výnimkou toho, že to je ľahké od Alácie. “A samozrejme, ako premiér, tak trochu idem, „ Čo tým myslíte, ako sme to urobili? “A povedal:„ No, naozaj je to jednoducho pretože sa môžem prihlásiť a vidím všetky tieto existujúce otázky. “Začať s prázdnou tabuľkou s SQL je neuveriteľne ťažké, ale upraviť existujúci dotaz, kde môžete vidieť výsledok, ktorý je vydaný a môžete povedať, „Oh, potrebujem iba tento stĺpec navyše“ alebo „Musím ho filtrovať do určitého rozsahu dátumov“, je to oveľa jednoduchšie.

Videli sme také druhy týchto pomocných rolí, ako sú produktoví manažéri, možno ľudia v obchodných operáciách, ktorí sa začínajú zdvíhať a ktorí sa vždy chceli naučiť SQL a začať si ho zbierať pomocou tohto katalógu. Videli sme tiež, že veľa spoločností sa pokúsilo urobiť akýsi otvorený zdroj. Snažil som sa tieto veci budovať interne, kde sledujú otázky a sprístupňujú ich, a je tu naozaj veľa komplikovaných výziev, aby boli užitočné. Facebook má interný nástroj, ktorý nazývajú HiPal a ktorý zachytil všetky otázky napísané na úli, ale zistíte, že ak nenarazíte používateľov správnym spôsobom, jednoducho skončíte s veľmi dlhý zoznam vybraných príkazov. A ako používateľ, ktorý sa snaží zistiť, či je dotaz pre mňa užitočný, alebo či je dobrý, ak sa len pozriem na dlhý zoznam vybratých výrokov, bude mi trvať oveľa dlhšie, kým tam niečo získam z hodnoty, než ako začínajúc od nuly. Veľmi starostlivo sme premýšľali o tom, ako vytvoriť katalóg dopytov, ktorý prinesie správne veci na front a poskytne ho užitočným spôsobom.

Dez Blanchfield: Myslím, že všetci ideme touto cestou od veľmi mladého veku až po dospelosť mnohými spôsobmi. Veľa technológií. Ja osobne som prešiel tou istou pravou vecou, podobne, naučil som sa rezať kód. Prešiel som časopismi a potom knihami a študoval som na určitú úroveň, potom som musel ísť a skutočne sa do toho naučiť.

Ale neúmyselne som zistil, že aj keď som išiel od výučby seba a čítania časopisov, čítania kníh a sekania programov iných ľudí a odchodu na kurzy, stále som sa učil z kurzov rovnako, ako som hovoril len s ostatnými. ľudia, ktorí mali nejaké skúsenosti. A myslím si, že je to zaujímavý objav, ktorý teraz, keď to prinesiete do analýzy údajov, v podstate vidíme tú istú paralelu, že ľudské bytosti sú vždy celkom inteligentné.

Ďalšou vecou, ktorej sa naozaj snažím porozumieť, je, že na veľmi vysokej úrovni sa veľa organizácií pýta: „Ako dlho trvá, kým sa dostaneme k tomuto bodu?“ Aký je časový bod zvratu, keď sa ľudia dostanú nainštalovaná vaša platforma a začali objavovať typy nástrojov? Ako rýchlo sú ľudia tak trochu videní, že sa táto vec zmení na skutočne okamžitý „a-ha“ okamih, keď si uvedomia, že sa už vôbec netrápia NI, pretože je to tam, ale teraz vlastne menia spôsob podnikania ? A objavili stratené umenie a očakávajú, že s tým dokážu urobiť niečo naozaj zábavné.

David Crawford: Áno, trochu sa toho dotknem. Myslím si, že keď sa inštalujeme, jedna z pekných vecí, jedna z vecí, ktoré sa ľuďom páčia o katalógu, ktorý je priamo napojený na dátové systémy, je to, že nezačínate prázdne tam, kde ich musíte vyplniť. stránka za stránkou. A to platí pre predchádzajúce dátové riešenia, kde by ste začínali prázdnym nástrojom a musíte začať vytvárať stránku pre všetko, čo chcete dokumentovať.

Pretože dokážeme automaticky dokumentovať toľko vecí extrahovaním metadát, v zásade do niekoľkých dní od nainštalovania softvéru, môžete si v nástroji vytvoriť obrázok dátového prostredia, ktoré je v ňom najmenej 80 percent. A potom si myslím, že hneď ako ľudia začnú písať otázky pomocou tohto nástroja, automaticky sa uložia späť do katalógu, a tak sa začnú tiež zobrazovať.

Nechcem byť príliš horlivý pri jeho uvádzaní. Myslím si, že dva týždne sú celkom dobrým konzervatívnym odhadom na mesiac. Dva týždne až mesiac, konzervatívny odhad skutočného obratu a pocitu, že z toho vyťažujete, ako keby ste začínali zdieľať nejaké vedomosti a mohli by ste tam ísť a zistiť veci o svojich údajoch.

Dez Blanchfield: Keď sa nad tým zamyslíte, je to skutočne úžasné. Skutočnosť, že niektoré z veľkých dátových platforiem, ktoré efektívne indexujete a katalogizujete, bude niekedy trvať, kým sa implementácia a nasadenie a správne postavenie postavia.

Posledná otázka, ktorú som dostal pre vás, než som ju odovzdal Robinovi Bloorovi, sú konektory. Jedna z vecí, ktorá na mňa okamžite vyskočí, je, že ste zjavne dostali celú výzvu. Takže je tu pár otázok len veľmi rýchlo. Po prvé, ako rýchlo sa implementujú konektory? Je zrejmé, že začnete s najväčšou platformou, ako sú Oracles a Teradatas atď. A DB2. Ale ako pravidelne vidíte nové konektory a aký čas to zaberie? Predstavujem si, že pre nich máte štandardný rámec. A ako hlboko do nich chodíš? Napríklad Oracles a IBM na svete a dokonca aj Tereadata, a potom niektoré z najpopulárnejších neskorých open-source platforiem. Pracujú priamo s vami? Objavujete to sami? Musíš mať na týchto platformách dôverné vedomosti?

Ako to vyzerá, ako by ste vyvinuli konektor a ako hlboko sa zapojíte do týchto partnerstiev, aby ste zaistili, že tieto konektory objavia všetko, čo je možné?

David Crawford: Áno, je to skvelá otázka. Myslím si, že z väčšej časti môžeme vyvinúť konektory. Určite sme to urobili, keď sme boli mladší startup a nemali sme zákazníkov. Môžeme určite rozvíjať spojenia bez potreby akéhokoľvek vnútorného prístupu. Nikdy nedostaneme žiadny špeciálny prístup k dátovým systémom, ktoré nie sú verejne dostupné, a často bez potreby akýchkoľvek dôverných informácií. Využívame výhody metaúdajových služieb dostupných samotnými dátovými systémami. Často s nimi môže byť dosť zložité a ťažko s nimi pracovať. Znám najmä SQL Server, spôsob, akým spravujú denník dotazov, existuje niekoľko rôznych konfigurácií a je to niečo, na čom skutočne musíte pracovať. Aby ste to správne nastavili, musíte pochopiť nuansy a gombíky a otočné gombíky a to je niečo, na čom pracujeme so zákazníkmi, keďže sme to už niekoľkokrát urobili.

Ale do určitej miery je to druh verejných API, ktoré sú k dispozícii alebo verejné rozhrania, ktoré sú k dispozícii a ktoré využívame. Máme partnerstvá s niekoľkými z týchto spoločností, ktoré sú väčšinou dôvodom na certifikáciu, aby sa cítili pohodlne, keď tvrdia, že pracujeme, a tiež nám môžu poskytnúť zdroje na testovanie, niekedy aj skorý prístup k platforme, ktorá vyjde, aby sa ubezpečila, že pracujeme na nových verziách.

Aby som zmenil nové spojenie, povedal by som, že sa znova snažím byť konzervatívny, povedzme šesť týždňov až dva mesiace. Závisí to od toho, ako je to podobné. Takže niektoré z Postgreho diel vyzerajú veľmi podobne ako Redshift. Redshift a Vertica zdieľajú veľa detailov. Takže môžeme tieto veci využiť. Ale áno, šesť týždňov až dva mesiace by bolo fér.

Máme tiež API, takže - myslíme aj na Aláciu ako na metaúdajovú platformu, takže ak nie je pre nás k dispozícii nič, čo by sme mohli osloviť a automaticky ju chytiť, existujú spôsoby, ako môžete sami napísať konektor a zatlačiť ho do nášho systému tak, že všetko sa centralizuje do jedného vyhľadávacieho nástroja.

Dez Blanchfield: Fantastický. Oceňujem, že. Takže to odovzdáme Robinovi, pretože som si istý, že má aj množstvo otázok. Robin?

Rebecca Jozwiak: Robin môže byť na mute.

Dez Blanchfield: Ste na mute.

Robin Bloor: Áno, správne. Prepáč, stlmil som sa. Keď to implementujete, aký je postup? Som trochu zvedavý, pretože na mnohých miestach môže byť veľa údajov. Ako to teda funguje?

David Crawford: Áno, samozrejme. Ideme dovnútra, najprv je to proces IT, ktorý zaisťuje zabezpečenie nášho servera, zaistenie dostupnosti sieťových pripojení, otvorenie portov, aby sme mohli skutočne pristupovať k systémom. Všetci často vedia, s ktorými systémami chcú začať. Znalosť vnútra dátového systému, ktorý - a niekedy im vlastne pomôžeme. Pomôžeme im urobiť úvodný pohľad do denníka dopytov, aby pochopili, kto používa to, čo a koľko používateľov má v systéme. Pomôžeme vám teda zistiť, kde - často, ak majú stovky alebo tisíce ľudí, ktorí by sa mohli prihlasovať do databáz, v skutočnosti nevedia, kde sa prihlasujú, takže môžeme ísť zistiť z dotaz zaznamenáva, koľko jedinečných používateľských účtov ste sa skutočne prihlásili a vykonávali dotazy tu za mesiac alebo tak.

Môžeme to využiť, ale často len na tie najdôležitejšie. Nastavíme ich a potom je tu postup, ktorý hovorí: „Uprednostňujme.“ Paralelne sa môže vyskytnúť celý rad aktivít. Zamerala by som sa na školenie týkajúce sa používania dotazovacieho nástroja. Keď ľudia začnú používať dotazovací nástroj, v prvom rade veľa ľudí zbožňuje skutočnosť, že ide iba o jediné rozhranie so všetkými ich rôznymi systémami. Tiež sa im páči skutočnosť, že je webová, nezahŕňa žiadne inštalácie, ak to nechce. Z hľadiska zabezpečenia majú radi určitý druh vstupného bodu, zo sieťového hľadiska, medzi akýmkoľvek druhom podnikovej siete IT a dátovým centrom, v ktorom žijú zdroje produkčných údajov. A tak nastavia Alation ako dotazovací nástroj a začnú používať Compose ako prístupový bod pre všetky tieto systémy.

Akonáhle sa to stane, v čom sa sústredíme na školenie, je porozumieť tomu, aké sú niektoré z rozdielov medzi webovým alebo serverovým dotazovacím nástrojom v porovnaní s tými, ktoré by ste mali na pracovnej ploche, a niektoré nuansy používania že. Zároveň sa budeme snažiť identifikovať najcennejšie údaje, opäť využiť informácie z denníka dopytov a povedať: „Hej, možno by ste mali ísť dovnútra a pomôcť ľuďom pochopiť ich. Začnime zverejňovať reprezentatívne otázky o týchto tabuľkách. “To je niekedy najúčinnejší spôsob, ako veľmi rýchlo prinútiť ľudí, aby sa točili. Pozrime sa na svoju vlastnú históriu dopytov, zverejnite tieto veci tak, aby sa zobrazovali ako prvé dopyty. Keď ľudia pozerajú na stránku tabuľky, môžu vidieť všetky otázky, ktoré sa tejto tabuľky dotkli, a môžu začať odtiaľ. A potom začneme pridávať tituly a popisy k týmto objektom, aby sa dali ľahšie nájsť a vyhľadať, aby ste vedeli niektoré nuansy, ako ich používať.

Dbáme na to, aby sme sa dôkladne pozreli do denníka dotazov, aby sme mohli vygenerovať rodokmeň. Jednou z vecí, ktorú robíme, je, že sa pozrieme do denníka dotazov v čase, keď sa údaje presúvajú z jednej tabuľky do druhej, a to nám umožňuje klásť jednu z najčastejšie kladených otázok o tabuľke údajov, odkiaľ to prišlo? Ako tomu môžem veriť? To, čo môžeme ukázať, je nielen to, z ktorých ďalších tabuliek pochádza, ale ako sa transformoval. Opäť je to tak trochu poháňané protokolom dotazov.

Zaisťujeme teda, že tieto veci sú nastavené a že do systému dostávame počet línií a zameriavame sa na najhodnotnejšie a najviac využívané kusy metadát, ktoré môžeme zistiť na stránkach tabuľky, takže keď hľadáte, nájdete niečo užitočné.

Robin Bloor: Dobre. Ďalšia otázka - je tu veľa otázok od publika, takže sa tu nechcem venovať príliš veľa času - ďalšou otázkou, na ktorú si tento druh príde, je iba bodka bolesti. Veľa softvéru sa kúpilo, pretože ľudia majú tak či onak problémy. Čo je to bod spoločnej bolesti, ktorý vedie ľudí k Alácii?

David Crawford: Áno. Myslím, že ich je niekoľko, ale myslím si, že jedným z tých, ktoré veľmi často počujeme, je analytik na palube. "V najbližšom období budem musieť najať 10, 20, 30 ľudí, ktorí budú musieť z týchto údajov získať nové informácie, ako sa dostanú na rýchlosť?" náčinie. Uľahčuje analytikom tiež to, že trávia všetok svoj čas odpovedaním na otázky iných ľudí o údajoch. To je tiež veľmi časté. A obaja sú v podstate problémy so vzdelávaním.

A potom by som povedal ďalšie miesto, ktoré vidíme, ako ľudia prijímajú Alation, keď chcú vytvoriť úplne nové dátové prostredie, v ktorom by niekto pracoval. Chcú ho interne propagovať a predávať, aby ho ľudia mohli využívať. Potom sa Alation stáva front-endom tohto nového analytického prostredia, je veľmi príťažlivé. Má dokumentáciu, má jediný úvod do - jedného miesta prístupu k systémom, a preto je to ďalšie miesto, kam k nám ľudia prídu.

Robin Bloor: Dobre, dám ťa ďalej na Rebeccu, pretože publikum sa k tebe snaží dostať.

Rebecca Jozwiak: Áno, máme tu veľa skutočne dobrých otázok pre divákov. A David, tento bol pre vás špeciálne určený. Je to od niekoho, kto má zrejme nejaké skúsenosti s druhmi zneužívania otázok, a on hovorí, že čím viac oprávňujeme používateľov, tým ťažšie je riadiť zodpovedné využívanie výpočtových zdrojov. Môžete sa teda brániť proti šíreniu zavádzajúcich, ale obvyklých dopytových fráz?

David Crawford: Áno, vidím túto otázku. Je to skvelá otázka - jednu, ktorú dostávame dosť často. Bolest som videl sám v predchádzajúcich spoločnostiach, kde musíte školiť používateľov. Napríklad: „Toto je tabuľka denníkov, záznamy sa vracajú už roky. Ak chcete do tejto tabuľky napísať dotaz, musíte sa skutočne obmedziť podľa dátumu. “Napríklad, toto je školenie, ktoré som absolvoval v predchádzajúcej spoločnosti predtým, ako mi bol poskytnutý prístup k databáze.

Máme niekoľko spôsobov, ako sa to snažiť vyriešiť. Povedal by som, že si myslím, že údaje denníka dopytov sú skutočne jedinečne cenné na ich riešenie. Poskytuje ďalšie informácie v porovnaní s tým, čo databáza robí interne pomocou svojho plánovača dotazov. A čo robíme, je jeden z tých zásahov - máme manuálne zásahy, ktoré som ukázal, a to je užitočné, že? Napríklad pri konkrétnom pripojení môžete povedať: „Zmiernime to.“ Keď sa zobrazí inteligentný návrh, bude mať veľkú červenú vlajku. To je jeden zo spôsobov, ako sa dostať k ľuďom.

Ďalšou vecou, ktorú robíme, je automatizácia zásahov v čase vykonávania. To bude vlastne používať strom analýzy dotazu predtým, ako ho spustíme, aby sme videli, obsahuje to určitý filter alebo pár ďalších vecí, ktoré tam tiež robíme. Ale jeden z najcennejších a najjednoduchší na vysvetlenie je, obsahuje filter? Podobne ako v tomto príklade, ktorý som práve uviedol, aj táto denníková tabuľka, ak ju chcete zadať, musí mať rozsah dátumov, na stránke tabuľky môžete určiť, že chcete tento filter rozsahu dátumov poveriť. Ak sa niekto pokúsi spustiť dotaz, ktorý neobsahuje tento filter, skutočne ho zastaví s veľkým upozornením a na jeho dotaz sa uvedie: „Pravdepodobne by ste mali do dotazu pridať nejaké SQL, ktoré vyzerá takto.“ Môže pokračovať, ak oni chcú. Nechceme ich v skutočnosti úplne zakázať - je to tiež dotaz, musí sa na konci dňa spúšťať dotazy. Pred nimi sme však položili dosť veľkú prekážku a dáme im návrh, konkrétny použiteľný návrh na úpravu dotazu, aby sa zlepšil ich výkon.

V niektorých prípadoch to tiež robíme automaticky, opäť sledovaním protokolu dotazov. Ak zistíme, že niektoré skutočne veľké percento dopytov v tejto tabuľke využíva konkrétny filter alebo konkrétnu klauzulu o pripojení, potom to skutočne otvoríme. Budeme to propagovať na zásah. V skutočnosti sa mi to stalo na internom súbore údajov. Máme údaje o zákazníkoch a máme užívateľské ID, ale užívateľské ID je nastavené, pretože je to druh - máme užívateľské ID u každého zákazníka. Nie je to jedinečné, preto ho musíte spárovať s ID klienta, aby ste získali jedinečný kľúč na pripojenie. A písal som dotaz a pokúsil som sa niečo analyzovať a objavil sa a povedal: „Hej, zdá sa, že všetci ostatní spájajú tieto tabuľky s ID klienta aj ID používateľa. Ste si istý, že to nechcete robiť? “A v skutočnosti ma to zastavilo v robení nesprávnej analýzy. Pracuje tak pre presnosť analýzy, ako aj pre výkon. To je spôsob, akým sa zaoberáme týmto problémom.

Rebecca Jozwiak: Zdá sa mi, že to bude efektívne. Povedali ste, že nebudete nevyhnutne blokovať ľudí v zabíjaní zdrojov, ale druh ich učíte, že to, čo robia, nemusí byť najlepšie, že?

David Crawford: Vždy predpokladáme, že používatelia nie sú škodliví - dajte im najlepšie úmysly - a týmto spôsobom sa snažíme byť celkom otvorení.

Rebecca Jozwiak: Dobre. Tu je ďalšia otázka: „Aký je rozdiel medzi manažérom katalógu, napríklad s riešením a nástrojom MDM? Alebo sa v skutočnosti spolieha na inú istinu rozšírením výberu dopytových tabuliek, zatiaľ čo MDM by to urobil automaticky, ale s rovnakým základným princípom zhromažďovania metadát. ““

David Crawford: Áno, myslím si, že keď sa pozriem na tradičné riešenia MDM, hlavným rozdielom je filozofické riešenie. Je to všetko o tom, kto je používateľ. Rovnako ako som povedal na začiatku mojej prezentácie, Alation, myslím, že keď sme boli založení, boli sme založení s cieľom umožniť analytikom vytvárať viac štatistík, rýchlejšie ich produkovať, presnejšie vyjadrovať, že produkovať. Nemyslím si, že to bolo niekedy cieľom tradičného riešenia MDM. Tieto riešenia sú zvyčajne zamerané na ľudí, ktorí potrebujú predkladať správy o tom, aké údaje boli zaznamenané do SCC alebo interne na iný účel auditu. Niekedy to môže analytikom umožniť, ale častejšie, ak to umožní praktizujúcemu vo svojej práci, je pravdepodobnejšie, že povolí dátového architekta ako je DBA.

Keď premýšľate o veciach z pohľadu analytika, vtedy začnete vytvárať nástroj na vyhľadávanie, ktorý by nástroj MDM nikdy neurobil. To je, keď začnete premýšľať o výkone a presnosti, ako aj o tom, aké údaje sa týkajú mojej firmy. Všetky tieto veci sú veci, ktoré sa pri navrhovaní nástroja v našich mysliach javia ako pop. Prechádza do našich vyhľadávacích algoritmov, rozloženia stránok katalógu a schopnosti prispievať poznatkami z celej organizácie. Ide o to, že sme zostavili dotazovací nástroj a že sme do neho zabudovali katalóg priamo, takže si myslím, že z toho skutočne vychádza. Na ktorého používateľa máte ako prvý na mysli?

Rebecca Jozwiak: Dobre, dobre. To mi to naozaj pomohlo vysvetliť. ktorý chcel zomrieť, aby získal archívy, pretože musel odísť, ale naozaj chcel, aby jeho otázka bola zodpovedaná. Povedal, že na začiatku sa uvádza, že existuje viac jazykov, ale je SQL jediným jazykom využívaným v rámci komponentu Compose?

David Crawford: Áno, to je pravda. Jednou z vecí, ktoré som si všimol, ako som bol svedkom explózie rôznych typov databáz, databáz dokumentov, grafov, skladov kľúčovej hodnoty, je to, že sú skutočne výkonné pre vývoj aplikácií. Tam môžu slúžiť konkrétnym potrebám naozaj dobre, lepšie ako relačné databázy.

Keď sa však vrátite späť k analýze údajov, keď sa vrátite späť k - keď chcete poskytnúť tieto informácie ľuďom, ktorí sa chystajú robiť ad hoc správy alebo ad hoc kopanie do údajov, že sa vždy vrátia k relačným minimálne rozhranie pre ľudí. Časť toho je len preto, že SQL je lingua franca analýzy údajov, takže to znamená, pre ľudí, aj pre nástroje, ktoré sa integrujú. Myslím si, že toto je dôvod, prečo je SQL na Hadoope tak populárne a existuje veľa pokusov o jeho vyriešenie, pretože na konci dňa to ľudia vedia. Pravdepodobne existujú milióny ľudí, ktorí vedia, ako písať SQL, a ja by som sa odvážil nie milióny, ktorí vedia, ako napísať rámcový dotazník agregácie plynovodu Mongo. A že ide o štandardný jazyk, ktorý sa používa na integráciu do skutočne širokej škály platforiem. Takže všetko, čo hovorí, sme veľmi zriedka žiadaní, aby sme sa z toho dostali, pretože toto je rozhranie, ktoré väčšina analytikov používa, a je to miesto, na ktoré sme sa zamerali, najmä v Compose, aby sme sa zamerali na písanie SQL.

Povedal by som, že veda o údajoch je miestom, kde sa púšťajú najviac, a preto dostávame príležitostné otázky týkajúce sa používania Pig alebo SAS. Toto sú veci, s ktorými v Compose určite nezvládame a ktoré by sme chceli zachytiť v katalógu. A vidím tiež R a Pythona. Máme niekoľko spôsobov, ako sme vytvorili rozhrania, ktoré môžete použiť na otázky napísané v Alation vo vnútri skriptov R a Python, takže od chvíle, keď ste vedec údajov a pracujete v skriptovacom jazyku, zdrojové údaje sú v relačnej databáze. Začnete s dotazom SQL a potom ho ďalej spracujete a vytvoríte grafy vo vnútri R a Pythonu. Vytvorili sme balíčky, ktoré môžete importovať do skriptov, ktoré vyvolávajú dotazy alebo výsledky dotazov z Alation, takže tam môžete mať nejaký zmiešaný pracovný tok.

Rebecca Jozwiak: Dobre, skvelé. Viem, že sme behom hodiny prešli trochu, len si položím jednu alebo dve ďalšie otázky. Viem, že ste hovorili o všetkých rôznych systémoch, ku ktorým sa môžete pripojiť, ale pokiaľ ide o externe hostené údaje a interne hostené údaje, možno ich spoločne vyhľadať do jedného pohľadu, do svojej jedinej platformy?

David Crawford: Jasne. Existuje niekoľko spôsobov, ako to urobiť. Myslím tým, navonok hostený, predstavoval by som si, snažím sa premýšľať o tom, čo by to mohlo znamenať. Môže to znamenať databázu, ktorú pre vás niekto hosťuje v AWS. Mohlo by to znamenať verejný zdroj údajov z data.gov. Pripájame sa priamo k databázam tým, že sa prihlasujeme rovnako ako iná aplikácia pomocou účtu databázy, a takto extrahujeme metadáta. Takže ak máme účet a máme otvorený sieťový port, môžeme sa k nemu dostať. A potom, keď tieto veci nemáme, máme niečo, čo sa nazýva virtuálny zdroj údajov, ktorý vám umožňuje v zásade tlačiť dokumentáciu, či už automaticky, napísaním vlastného konektora alebo jeho vyplnením tak, že urobíte dokonca ako nahranie vo formáte CSV, na dokumentáciu údajov spolu s vašimi internými údajmi. To všetko umiestni do vyhľadávacieho nástroja. Stane sa referenčným vo vnútri článkov a inej dokumentácie a konverzácií vo vnútri systému. Takto pracujeme, keď sa nemôžeme priamo pripojiť k systému.

Rebecca Jozwiak: Dobre, to dáva zmysel. Zastriem vám ešte jednu otázku. Jeden účastník je pýtajú sa: „Ako by sa mal validovať, overovať alebo udržiavať obsah katalógu údajov, pretože zdrojové údaje sa aktualizujú, ako sa upravujú zdrojové údaje atď.“

David Crawford: Áno, je to otázka, ktorú máme veľa, a myslím si, že jedna z vecí, ktorú my - jedna z našich filozofií, ako som povedal, neveríme, že používatelia sú škodliví. Predpokladáme, že sa snažia prispieť tým najlepším poznatkom. Nepôjdu a úmyselne neuvádzajú ľudí o údajoch. Ak je to vo vašej organizácii problém, možno pre vás Alation nie je ten pravý nástroj. Ak však používatelia predpokladajú dobré úmysly, myslíme na to ako na niečo, kam prídu aktualizácie, a potom zvyčajne robíme správcu zodpovedný za každý dátový objekt alebo každú časť údajov. Môžeme informovať tých správcov, keď sa vykonajú zmeny v metaúdajoch a môžu to zvládnuť týmto spôsobom. Vidia prichádzať aktualizácie, potvrdzujú ich. Ak nemajú pravdu, môžu sa vrátiť, upraviť ich a informovať, a dúfajme, že dokonca oslovia používateľa, ktorý informácie poskytol, a pomôžu im učiť sa.

To je primárny spôsob, ako o tom premýšľame. Takýto návrh davu a riadenie zo strany správcov, takže máme okolo toho určité schopnosti.

Rebecca Jozwiak: Dobre, dobre. A ak by ste len mohli dať ľuďom vedieť, ako môžu čo najlepšie začať s Alation, a kam môžu ísť konkrétne, aby získali viac informácií. Viem, že ste sa o niečo podelili. Je to najlepšie miesto?

David Crawford: Alation.com/learnmore Myslím, že je skvelý spôsob, ako ísť. Ak sa chcete zaregistrovať na ukážku, na webe Alation.com nájdete veľa skvelých zdrojov, dokumenty o zákazníkoch a správy o našom riešení. Takže si myslím, že je to skvelé miesto, kde začať. Môžete tiež poslať e-mailom.

Rebecca Jozwiak: Dobre, skvelé. A viem, účastníci, prepáčte, ak som sa dnes nedostal na všetky otázky, ale ak nie, odošlú sa Davidovi alebo jeho predajnému tímu alebo niekomu v spoločnosti Alation, aby určite pomohli odpovedať na vaše otázky a porozumieť im. čo Alation robí alebo čo robia najlepšie.

A s tým, ľudia, pôjdem do toho a podpíšeme nás. Archívy nájdete vždy na stránke InsideAnalysis.com. Nájdete ho aj na stránke Techopedia.com. Majú tendenciu sa aktualizovať o niečo rýchlejšie, takže si to určite overte. A ďakujem dnes Davidovi Crawfordovi, Dez Blanchfieldovi a Robinovi Boorovi. Bolo to skvelé webové vysielanie. A s tým sa rozlúčim. Vďaka, ľudia. Zbohom.

David Crawford: Ďakujem.

Sila návrhu: ako katalóg údajov oprávňuje analytikov

Ako súvisí správa údajov a analytika údajov?

Ako sa stalo zoškrabovanie údajov pre strojové učenie najnáročnejšou pracovnou náročnosťou od manuálneho zadávania údajov v pôvodnej migrácii?

Čo sú to služby správy siete a ako tu prispieva použitie analytikov k lepšiemu spravovaniu?

Voľba editora

Čo je konšt? - definícia z technológie

Čo je hlavná trieda? - definícia z technológie

Čo je to vyhlásenie? - definícia z technológie

Čo je distribuovaná aplikácia? - definícia z technológie

Voľba editora

Čo je ohýbanie obvodu? - definícia z technológie

Čo je to katastrofické zlyhanie? - definícia z technológie

Čo je rušička mobilných telefónov? - definícia z technológie

Čo je stlačený vzduch? - definícia z technológie

Voľba editora

Čo je to tuková aplikácia? - definícia z technológie

Čo je multiplexovanie s frekvenčným delením (fdm)? - definícia z technológie

Čo je to fat server? - definícia z technológie

Čo je plný duplex (fdx)? - definícia z technológie

Voľba editora

Čo je to mobilné prepínacie centrum (msc)? - definícia z technológie

Čo je to viacvrstvový spínač? - definícia z technológie

Čo je to viacdomov? - definícia z technológie

Čo je to multiprocesor? - definícia z technológie

Voľba editora

Čo je spätné počítanie? - definícia z technológie

Čo je to reverzná poľská notácia (rpn)? - definícia z technológie

Čo je to plochý kábel? - definícia z technológie

Čo je to vertikálna synchronizácia (vsync)? - definícia z technológie

Populárne kategórie