Lucene

Apache Lucene estas libera/malfermfonta informserĉada softvarobiblioteko, origine kreita en Java fare de Doug Cutting. Ĝi estas apogita fare de la Apache Softvaro-Fonduso kaj estas distribuata sub la Apache-Softvarlicenco.

Lucene estis adaptita al aliaj programlingvoj inkluzive de Delfo, Perl, C++, Python, Ruby, kaj PHP.[1]

Historio

Lucene estis origine verkita fare de Doug Cutting en 1999.[2] Ĝi estis komence havebla por elŝuto de sia hejmo ĉe la SourceForge retejo. Ĝi aliĝis al la Jakarta familio de la Apache Softvaro-Fonduso de malfermfontaj Java produktoj en septembro 2001 kaj iĝis propra pintnivela Apache projekto en februaro 2005. Ĝis antaŭ nelonge, ĝi inkludis kelkajn sub-projektojn, kiel ekzemple Lucene.NET, Mahout, Solr kaj Nutch. Solr estis kunfandita en la Lucene-projekton mem kaj Mahout, Nutch, kaj Tika estis proponitaj kiel sendependaj pintnivelaj projektoj.

Ecoj kaj ĝenerala uzo

Taŭga por ajna aplikiĝo kiu postulas plenan tekstoindicigon kaj serĉadokapablecon, Lucene estis aparte rekonita[3][4] pro sia utileco en la realigo kaj efikigo de Interretaj serĉiloj , kaj ankaŭ por loka, unu-reteja serĉado.

En la kerno de la logika arkitekturo de Lucene estas la ideo de dokumento enhavanta kampojn de teksto. Tiu fleksebleco permesas la API de Lucene esti sendependa de la dosierformato. Dokumentoj en formatoj kiel PDF, HTML, Microsoft Word, kaj OpenDocument , same kiel multaj aliaj (krom bildoj), povas esti indeksitaj tiel longe kiel iliaj tekstaj informoj povas esti eltiritaj.[necesas citaĵo]

Lucene-bazitaj projektoj

Lucene mem estas nur biblioteko por indicigo kaj serĉado, kaj ne enhavas funkciecon de trolado kaj HTML analizado. Tamen, pluraj projektoj etendas la kapablecon de Lucene:

  • Apache Nutch - disponigas interretokrabladon kaj HTML-analizadon
  • Apache Solr - entreprena serĉoservilo
  • ElasticSearch - entreprena serĉoservilo
  • Compass (Kompaso)- Java Search Engine Framework
  • DocFetcher - multplatforma solkomputila serĉaplikaĵo

Lucene. NET

Lucene. NET estas faco de Lucene skribita en C no. kaj celas .NET uzantojn.[necesas citaĵo]

Uzantoj

Por listo de firmaoj kiuj uzas Lucene (prefere ol etendi), vidu la "Powered By" paĝon[5] de Lucene .[5] Ekzemple, Twitter uzas Lucene por sia realtempa serĉo.[6]

Vidu ankaŭ

Referencoj

  1. Lucene implementations
  2. Better Search with Apache Lucene and Solr (19 November 2007). Arkivita el la originalo je 2012-01-31. Alirita 2013-02-05 . Arkivita kopio. Arkivita el la originalo je 2012-01-31. Alirita 2013-02-05 .
  3. Perner, Petra. (2007) Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer, p. 387. ISBN 978-3-540-73498-7.
  4. GNU/Linux Semantic Storage System
  5. 5,0 5,1 PoweredBy
  6. Twitter uses Lucene

Bibliografio

  • Gospodnetic, Otis; Erik Hatcher, Michael McCandless. (2009-06-28) Lucene in Action, 2‑a eldono, Manning Publications, p. 475. ISBN 1-9339-8817-7.
  • Gospodnetic, Otis; Erik Hatcher. (2004-12-01) Lucene in Action, 1‑a eldono, Manning Publications, p. 456. ISBN 978-1-9323-9428-3.

Eksteraj ligiloj

Tradukfonto

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.