Modelo de recuperación Booleano


La recuperación se basa en obtener aquellos documentos que cumplan la función lógica expresada en la consulta realizada por el usuario. Para ello utiliza los operadores propios del álgebra de Boole (AND, OR y NOT) y ficheros de índices invertidos que contienen en sus entradas los documentos que contienen dicho término.

Un documento es relevante sí y solo sí la búsqueda contiene:

  • Una palabra: contiene la palabra.
  • A and B: contiene las palabras A y B.
  • A or B: Contiene A ó B.
  • A AND NOT B: Contiene A y no B.

A continuación se muestran algunas consultas y los conjuntos resultado que se obtendrían si se aplicaran sobre el siguiente conjunto de datos:


Conjuntos

ConsultaResultado
AA + (A^B) + (A^C) + (A^B^C)
A AND B(A^B) + (A^B^C)
A AND NOT BA + (A^C)

Un sistema de recuperación booleano puro permite realizar valoraciones de similitud de los términos de la consulta. Por definición del modelo, un documento satisface o no los términos de la consulta. Esto hace imposible que los resultados que se muestran al usuario se encuentren ordenados por ningún índice de similitud.


De este modelo inicial han surgido variaciones como el “booleano extendido”, que asigna pesos a los términos de búsqueda, o el “fuzzy”, que ha incluido la lógica difusa entre sus postulados.