Búsqueda de información con Lucene

Esta es la continuación de un post empezado hace mucho tiempo

La búsqueda de documentos constituye la funcionalidad principal proporcionada por Lucene. Para ello aporta múltiples clases y métodos para la representación de consultas y buscar en el índice aquellos documentos que son relevantes y cumplen con los criterios de la búsqueda. El programa que se muestra a continuación Buscador.java, es un ejemplo de cómo buscar en un índice utilizando Lucene.

Seguir leyendo “Búsqueda de información con Lucene”

Anuncios

Introducción a Lucene

En este tutorial, vamos a realizar una breve presentación del API de búsqueda Lucene y realizaremos un sencillo y completo ejemplo.

Lucene es una librería de código abierto con licencia de Apache. Que permite a los desarrolladores integrar funciones de indexación y búsquedas de información textual dentro de sus proyectos.

Antes de empezar, creo que es necesario una pequeña aclaración de conceptos.

Para poder utilizar Lucene, es necesario seguir una serie de pasos o fases para conseguir realizar búsquedas efectivas: indexación y búsqueda.

Indexación:

El proceso de indexación consiste en analizar y extraer de entre toda la información disponible, la verdaderamente relevante. Posteriormente, con esa información se crea el índice a partir del cual se realizarán las búsquedas.

El índice es una estructura de datos que permite acceso rápido a la información, algo similar a lo que podría ser el índice de un libro.

Búsqueda:

El proceso de búsqueda consiste en consultar el índice para obtener los documentos donde aparecen unas determinadas palabras o bien concuerdan con una determinada expresión de consulta.