Lucene

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 15. huhtikuuta 2019 tarkistetusta versiosta . tarkastukset vaativat 10 muokkausta .
Apache Lucene
Tyyppi haku ja ohjelmointi
Kehittäjä Apache Software Foundation
Sisään kirjoitettu Java
Käyttöjärjestelmä cross-platform
Ensimmäinen painos 30. maaliskuuta 2000
Laitteistoalusta Java-virtuaalikone
uusin versio 9.2.0 [1] (23. toukokuuta 2022 ) ( 23.5.2022 )
Lisenssi Apache-ohjelmiston lisenssi
Verkkosivusto lucene.apache.org
 Mediatiedostot Wikimedia Commonsissa

Lucene  on ilmainen Apache Foundationin tehokkaan kokotekstihaun kirjasto , jota käytettiin perustana kahdessa 2010-luvun puolivälin suosituimmassa monistetussa hakukoneessa  - Elasticsearch ja Solr . kirjoitettu Javalla .

Doug Cuttingin vuonna 1999 kehittämä , kirjoittaja julkaisi alun perin SourceForge.netissä .  Vuonna 2001 se siirrettiin Apache-säätiölle, jossa sitä alun perin kehitettiin osana Jakarta -projektia ja vuonna 2005 se siirrettiin säätiön huipputason hankkeeksi. Osana huipputason projektia Lucene on synnyttänyt useita itsenäisiä aliprojekteja, muun muassa Hadoop (aloitteen Cutting ja laajan tuoteekosysteemin muodostaminen), Nutch ja Solr (jota pidetään osana Hadoop-ekosysteemiä ). Lisäksi kirjastoa käytetään sisäisenä mekanismina useissa projekteissa, mukaan lukien YaCy (hajautettu hakukone), CrateDB ( dokumenttisuuntautunut DBMS SQL - tuella ), Swiftype (replikoitu hakukone organisaatioille) , DocFetcher ( paikallinen hakukone ).

Kirjaston tärkein toiminnallinen ominaisuus on tarjota skaalautuva ja melko nopea indeksointi (noin 100 Gt tunnissa massaluokan palvelimella). Luotu hakemisto vie noin 20-30 % alkuperäisen tekstin koosta.

Hakualgoritmi tukee rankattua hakua (parhaat tulokset näkyvät ensin), sumeaa hakua , monia erilaisia ​​kyselyitä (lausekysely, kyselyt jokerimerkeillä , välien haku ja muut), hakua metatietoarvojen (kuten otsikko) perusteella. , kirjoittaja, teksti) ). Hakua tukevat useat indeksit, joissa on mahdollisuus yhdistellä tuloksia, toteutetaan hakutulosten lajittelu eri kenttien mukaan. Haku on mahdollista samanaikaisesti indeksin päivitysprosessin kanssa. Kirjaston looginen arkkitehtuuri edustaa mitä tahansa dokumenttia tekstikenttien joukkona, mikä mahdollistaa sen toiminnan muodoista riippumatta heti, kun niistä saadaan tekstitietoa .

Siirretty moniin muihin ohjelmointikieliin: C (Lucene4c), C ++ (CLucene), Node.js , Go , Delphi (MUTIS), Perl (PLucene), Ruby (Ferret ja RubyLucene), PHP ( Zend - kehyksen sisällä ), Lisp ( Montezuma), C# (Lucene.Net), Python (PyLucene).

Kirjallisuus

Muistiinpanot

  1. Lucene Change Log .

Linkit