Apache Lucene | |
---|---|
Tyyppi | haku ja ohjelmointi |
Kehittäjä | Apache Software Foundation |
Sisään kirjoitettu | Java |
Käyttöjärjestelmä | cross-platform |
Ensimmäinen painos | 30. maaliskuuta 2000 |
Laitteistoalusta | Java-virtuaalikone |
uusin versio | 9.2.0 [1] (23. toukokuuta 2022 ) |
Lisenssi | Apache-ohjelmiston lisenssi |
Verkkosivusto | lucene.apache.org |
Mediatiedostot Wikimedia Commonsissa |
Lucene on ilmainen Apache Foundationin tehokkaan kokotekstihaun kirjasto , jota käytettiin perustana kahdessa 2010-luvun puolivälin suosituimmassa monistetussa hakukoneessa - Elasticsearch ja Solr . kirjoitettu Javalla .
Doug Cuttingin vuonna 1999 kehittämä , kirjoittaja julkaisi alun perin SourceForge.netissä . Vuonna 2001 se siirrettiin Apache-säätiölle, jossa sitä alun perin kehitettiin osana Jakarta -projektia ja vuonna 2005 se siirrettiin säätiön huipputason hankkeeksi. Osana huipputason projektia Lucene on synnyttänyt useita itsenäisiä aliprojekteja, muun muassa Hadoop (aloitteen Cutting ja laajan tuoteekosysteemin muodostaminen), Nutch ja Solr (jota pidetään osana Hadoop-ekosysteemiä ). Lisäksi kirjastoa käytetään sisäisenä mekanismina useissa projekteissa, mukaan lukien YaCy (hajautettu hakukone), CrateDB ( dokumenttisuuntautunut DBMS SQL - tuella ), Swiftype (replikoitu hakukone organisaatioille) , DocFetcher ( paikallinen hakukone ).
Kirjaston tärkein toiminnallinen ominaisuus on tarjota skaalautuva ja melko nopea indeksointi (noin 100 Gt tunnissa massaluokan palvelimella). Luotu hakemisto vie noin 20-30 % alkuperäisen tekstin koosta.
Hakualgoritmi tukee rankattua hakua (parhaat tulokset näkyvät ensin), sumeaa hakua , monia erilaisia kyselyitä (lausekysely, kyselyt jokerimerkeillä , välien haku ja muut), hakua metatietoarvojen (kuten otsikko) perusteella. , kirjoittaja, teksti) ). Hakua tukevat useat indeksit, joissa on mahdollisuus yhdistellä tuloksia, toteutetaan hakutulosten lajittelu eri kenttien mukaan. Haku on mahdollista samanaikaisesti indeksin päivitysprosessin kanssa. Kirjaston looginen arkkitehtuuri edustaa mitä tahansa dokumenttia tekstikenttien joukkona, mikä mahdollistaa sen toiminnan muodoista riippumatta heti, kun niistä saadaan tekstitietoa .
Siirretty moniin muihin ohjelmointikieliin: C (Lucene4c), C ++ (CLucene), Node.js , Go , Delphi (MUTIS), Perl (PLucene), Ruby (Ferret ja RubyLucene), PHP ( Zend - kehyksen sisällä ), Lisp ( Montezuma), C# (Lucene.Net), Python (PyLucene).
Apache Software Foundation | |||||||
---|---|---|---|---|---|---|---|
Huipputason projektit |
| ||||||
Osaprojektit |
| ||||||
Apache Web |
| ||||||
Muut projektit | |||||||
Kehitysprojektit ( hautomo ) |
| ||||||
Käytöstä poistetut projektit ( ullakko ) | |||||||
|
koneet _ | Hakukoneet ja|
---|---|
Kenraali |
|
Alueellinen |
|
johtajia |
|
Temaattinen |
|
Metahaku | |
avoin / ilmainen |
|
Vauva |
|