Obsah:
Skutočná hodnota veľkých údajov sa vyjasní iba prostredníctvom analýzy veľkých údajov. Tieto analýzy však vyžadujú na implementáciu akéhokoľvek riešenia veľkých dát štatistické a technické znalosti. Predpokladalo sa teda, že musíte byť vedcom údajov, aby ste mohli získať zmysluplný prehľad o veľkých údajoch. Tu prichádza program Apache Drill. Poskytuje flexibilitu na vykonávanie veľkých analytických údajov na serveri Hadoop bez potreby znalosti vedcov údajov.
Apache Drill - Čo je to?
Apache Drill je softvérový rámec, ktorý dokáže prenášať veľké dáta a poskytovať potrebné informácie, ktoré sa skrývajú pod petabajtmi dátových súborov. Technicky je Apache Drill otvorený zdrojový štandard ANSI SQL, ktorý sa dá použiť ako vyhľadávací modul s nízkou latenciou v populárnom programovacom rámci Hadoop založenom na Java.
Môže tiež pracovať so stádom začínajúcich databáz NoSQL ako MongoDB, HBase a tiež s cloudovými dátovými servermi, ako sú Amazon S3 a Google Cloud Storage. K nim sa pridáva aj úroveň ďalších API štandardných odvetví (aplikačné programovacie rozhrania), ako sú ODBC / JDBC a RESTful API.