Obsah:
Definícia - Čo znamená Apache Lucene?
Apache Lucene je open source projekt pre vysoko výkonnú a plnohodnotnú knižnicu textového vyhľadávača, ktorá je napísaná výhradne pomocou Java.
Je schopný fulltextového vyhľadávania v dokumentoch, takže ide o technológiu, ktorá je vhodná pre každú aplikáciu, ktorá vyžaduje túto funkciu, najmä ak ide o platformu naprieč platformami.
Prvýkrát bol vyvinutý spoločnosťou Doug Cutting v roku 1999 a oficiálne sa stal súčasťou rodiny Jakartovcov nadácie Open Source v Java projektoch nadácie Apache v septembri 2001. Vo februári 2005 bol aktualizovaný na projekt Apache najvyššej úrovne.
Techopedia vysvetľuje Apache Lucene
Apache Lucene je vysoko výkonný vyhľadávací nástroj s koncepciou „dokumentu obsahujúceho polia textu“ vo svojej základnej logickej architektúre. To ponúka veľkú flexibilitu a umožňuje, aby sa rozhranie Lucene API stalo nezávislým na akomkoľvek formáte súboru.
Akýkoľvek text z formátov, ako sú MS Word, HTML, XML, PDF a OpenDocument, sa dá indexovať, pokiaľ sa dajú extrahovať textové informácie, čo znamená, že s obrázkami nemôže robiť nič.
Lucene je vhodný pre každú aplikáciu, ktorá potrebuje indexáciu a vyhľadávanie v plnom texte, ale všeobecne sa považuje za vynikajúci nástroj na implementáciu internetových vyhľadávacích nástrojov a na miestne vyhľadávanie na jednom mieste.
Medzi vlastnosti patrí:
- Škálovateľné a vysoko výkonné indexovanie - na modernom hardvéri dokáže spracovať viac ako 150 Gb za hodinu a vyžaduje iba 1 Mb na hromadu pamäte.
- Výkonné, presné a efektívne algoritmy vyhľadávania - ponúka mnoho typov výkonných dopytov, ako sú frázové, zástupné znaky, blízke a rozsahové dotazy. Má tiež prehľadané vyhľadávanie a triedenie podľa ľubovoľného poľa.
- Cross platform - čisto implementácia Java a dostupná aj v iných programovacích jazykoch.