Obsah:
Definícia - Čo znamená Apache Kafka?
Apache Kafka je systém správ s otvoreným zdrojom, ktorý umožňuje rýchle, škálovateľné a odolné voči chybám pri spracovávaní údajov v reálnom čase. Na rozdiel od tradičného softvéru pre podnikové zasielanie správ je spoločnosť Kafka schopná spracovať všetky údaje, ktoré tečú cez spoločnosť, a to v takmer reálnom čase.
Kafka je napísaný v Scale a bol pôvodne vyvinutý spoločnosťou LinkedIn. Od tej doby ho mnoho spoločností používalo na vytváranie platforiem v reálnom čase.
Techopedia vysvetľuje Apache Kafku
Kafka má veľa podobnosti s protokolmi transakcií a udržuje kanály správ v témach. Výrobcovia zapisujú údaje do tém a zákazníci si ich prečítajú, ktoré sú rozdelené a replikované na viacerých uzloch v distribuovanom systémovom formáte. Kafka je jedinečná v tom, že zaobchádza s každou tematickou oblasťou ako s protokolom a každej správe v oddiele sa priradí jedinečný ofset. Zachováva všetky správy na určitý čas a spotrebitelia sú zodpovední za sledovanie ich polohy v každom denníku. To sa líši od predchádzajúcich systémov, v ktorých boli za sledovanie sledovaní zodpovední makléri, čo vážne zhoršilo schopnosť systému zväčšovať počet zákazníkov. Táto štruktúra umožňuje spoločnosti Kafka podporovať veľa spotrebiteľov a uchovávať veľké množstvo údajov s veľmi nízkou réžiou.
Kafka možno použiť:
- Ako tradičný sprostredkovateľ správ
- Na sledovanie aktivity webových stránok
- Na agregáciu protokolov
- Na spracovanie veľkých dátových tokov
Kafka sa môže používať spolu s Apache Storm, Apache HBase a Apache Spark na analýzu v reálnom čase a vykreslenie streamovaných údajov.