Lucene

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2019. április 15-én felülvizsgált verziótól ; az ellenőrzésekhez 10 szerkesztés szükséges .
Apache Lucene
Típusú keresés és programozás
Fejlesztő Apache Software Foundation
Beírva Jáva
Operációs rendszer platformközi
Első kiadás 2000. március 30
Hardver platform Java virtuális gép
legújabb verzió 9.2.0 [1] (2022. május 23. ) ( 2022-05-23 )
Engedély Apache szoftverlicenc
Weboldal lucene.apache.org
 Médiafájlok a Wikimedia Commons oldalon

A Lucene  az Apache Foundation nagy teljesítményű teljes szöveges keresésének ingyenes könyvtára , amelyet a 2010-es évek közepétől a két legnépszerűbb replikált keresőmotor  – az Elasticsearch és a Solr – alapjául használtak . Java nyelven írva .

Doug Cutting fejlesztette ki 1999-ben, eredetileg a szerző tette közzé a SourceForge.net oldalon .  2001-ben átkerült az Apache Alapítványhoz, ahol eredetileg a jakartai projekt részeként fejlesztették ki , majd 2005-ben az alapítvány legfelső szintű projektjévé vált. A legfelső szintű projekt részeként a Lucene számos alprojektet szült, amelyek függetlenné váltak, köztük a Hadoop - ot (amit a Cutting kezdeményezett és alkotott hatalmas ökoszisztémát), a Nutch -ot és a Solr-t (amelyet a Hadoop ökoszisztéma részének tekintenek ). ). Ezenkívül a könyvtárat belső mechanizmusként használják számos projektben, beleértve a YaCy -t (decentralizált keresőmotor), a CrateDB ( dokumentumorientált DBMS SQL - támogatással ), a Swiftype (replikált keresőmotor szervezetek számára) , DocFetcher ( helyi keresőmotor ).

A könyvtár fő funkcionális jellemzője, hogy méretezhető és meglehetősen nagy sebességű indexelést biztosít (körülbelül 100 GB óránként tömegkiszolgálón). A létrehozott index az eredeti szöveg méretének körülbelül 20-30%-át foglalja el.

A keresési algoritmus támogatja a rangsorolt ​​keresést (a legjobb eredmények jelennek meg először), a fuzzy keresést , számos különböző típusú lekérdezést (kifejezéslekérdezés, helyettesítő karakteres lekérdezések , intervallumok keresése és egyebek), a metaadatértékek (például cím) szerinti keresést , szerző, szöveg) ). A keresést számos index támogatja, az eredmények kombinálásának lehetőségével, a keresési eredmények különböző mezők szerinti rendezése valósul meg. A keresés az indexfrissítési folyamattal egy időben lehetséges. A könyvtár logikai architektúrája bármely dokumentumot szövegmezők halmazaként jelenít meg, amely lehetővé teszi, hogy formátumoktól függetlenül működjön , amint szöveges információ nyerhető belőlük.

Számos más programozási nyelvre is átportálva: C ( Lucene4c), C++ (CLucene), Node.js , Go , Delphi (MUTIS), Perl (PLucene), Ruby (Ferret és RubyLucene), PHP (a Zend keretein belül ), Lisp ( Montezuma), C# (Lucene.Net), Python (PyLucene).

Irodalom

Jegyzetek

  1. Lucene változásnapló .

Linkek