Domov databázy Čo je to apache lucene? - definícia z technológie

Čo je to apache lucene? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená Apache Lucene?

Apache Lucene je open source projekt pre vysoko výkonnú a plnohodnotnú knižnicu textového vyhľadávača, ktorá je napísaná výhradne pomocou Java.

Je schopný fulltextového vyhľadávania v dokumentoch, takže ide o technológiu, ktorá je vhodná pre každú aplikáciu, ktorá vyžaduje túto funkciu, najmä ak ide o platformu naprieč platformami.

Prvýkrát bol vyvinutý spoločnosťou Doug Cutting v roku 1999 a oficiálne sa stal súčasťou rodiny Jakartovcov nadácie Open Source v Java projektoch nadácie Apache v septembri 2001. Vo februári 2005 bol aktualizovaný na projekt Apache najvyššej úrovne.

Techopedia vysvetľuje Apache Lucene

Apache Lucene je vysoko výkonný vyhľadávací nástroj s koncepciou „dokumentu obsahujúceho polia textu“ vo svojej základnej logickej architektúre. To ponúka veľkú flexibilitu a umožňuje, aby sa rozhranie Lucene API stalo nezávislým na akomkoľvek formáte súboru.


Akýkoľvek text z formátov, ako sú MS Word, HTML, XML, PDF a OpenDocument, sa dá indexovať, pokiaľ sa dajú extrahovať textové informácie, čo znamená, že s obrázkami nemôže robiť nič.


Lucene je vhodný pre každú aplikáciu, ktorá potrebuje indexáciu a vyhľadávanie v plnom texte, ale všeobecne sa považuje za vynikajúci nástroj na implementáciu internetových vyhľadávacích nástrojov a na miestne vyhľadávanie na jednom mieste.


Medzi vlastnosti patrí:

  • Škálovateľné a vysoko výkonné indexovanie - na modernom hardvéri dokáže spracovať viac ako 150 Gb za hodinu a vyžaduje iba 1 Mb na hromadu pamäte.
  • Výkonné, presné a efektívne algoritmy vyhľadávania - ponúka mnoho typov výkonných dopytov, ako sú frázové, zástupné znaky, blízke a rozsahové dotazy. Má tiež prehľadané vyhľadávanie a triedenie podľa ľubovoľného poľa.
  • Cross platform - čisto implementácia Java a dostupná aj v iných programovacích jazykoch.
Čo je to apache lucene? - definícia z technológie