Modelo de recuperación Relevance Feedback


Se trata de un método de mejora de las consultas. Consiste en reformular la consulta inicial introducida por el usuario en base a documentos que él mismo considere relevantes. De esta forma la consulta ofrece cada vez resultados más precisos y además se recalculan los pesos de los términos relevantes. Para ello deberán llevarse a cabo varios ciclos interactivos de preguntas al usuario.


El siguiente diagrama describe el algoritmo empleado con esta técnica:


Algoritmo Relevance Feedback

En base a los pesos comentados anteriormente, el modelo probabilístico es capaz de calcular el grado de relevancia entre cada documento para una consulta dada. De esta manera permite ordenar los documentos de la colección en orden descendente de probabilidad de relevancia en relación a la consulta, superando así la gran deficiencia del modelo booleano, a pesar de seguir siendo un modelo binario.


El efecto perseguido con esta técnica es desplazar la consulta en dirección a los documentos relevantes alejándola de los que no lo son. En general se suele utilizar el algoritmo de Rocchio [rocchio1971relevance], ec. (1), los resultados de la aplicación de esta técnica son extraordinarios: la mejora de la recuperación de los documentos no relevantes se cifra en un 300,1% y la de los no relevantes en un 301,2%. El mayor inconveniente de esta técnica es que requiere la intervención del usuario.