Modelos de recuperación basados en redes de inferencia
El modelo de red de inferencia extiende los modelos probabilísticos basados en redes bayesianas. Se basa en una red en la que se distinguen dos subredes:
- Red de documentos: red fija de documentos para cada colección formada por dos tipos de nodos que representan los términos de los documentos y los documentos respectivamente. De un nodo de documento salen arcos hacia los nodos de los términos que han sido indexados.
- Red de consulta: red que se crea cuando el usuario consulta al sistema y contiene nodos de consulta y nodos de términos, de manera que de un nodo de término salen arcos hacia los nodos de consulta correspondientes.
Una vez que se han estimado las probabilidades, la inferencia se hace instanciando cada documento sucesivamente y calculando la probabilidad de que la consulta quede satisfecha dado el documento que ha sido observado, es decir, p(q¦d). Una vez que todas las propagaciones se han realizado, se genera la ordenación de documentos correspondiente.
La variable aleatoria de la consulta representa que la información requerida por la consulta ha sido satisfecha.
Todas las variables aleatorias son binarias. Sea {k1,k2,...,kt} con ki siendo las variables aleatorias con valores 0 o 1. Estas variables definen los 2t posibles estados de . Además, dj y q son también variables binarias aleatorias asociadas con el documento y consulta. Que un documento sea relevante es determinado por la cantidad de apoyo evidencial que la observación dj da a la consulta q. Esto esta dado en redes de inferencia por P(q^ dj).