Introducción.
El crecimiento del uso de Internet ha puesto a disposición de los usuarios grandes cantidades de información, sin embargo, encontrar información relevante resulta en algunos casos una labor complicada.
Una tarea compleja en Recuperación de Información es aquella que busca, no información acerca de un determinado tema o los documentos relacionados, sino respuestas concretas a preguntas realizadas en lenguaje natural. Dicha técnica se denomina búsqueda de respuestas o Question-Answering en inglés. Los sistemas de Question-Answering deben localizar de entre todos los documentos, una zona que pueda estar relacionada con la afirmación. El objetivo es buscar un trozo de texto mínimo que responda a la pregunta.
Es por ello que, a diferencia de los motores de búsqueda, los sistemas de Question-Answering han de proporcionar respuestas concisas, por lo que no es tan importante mostrar un gran número de resultados como mostrar el resultado correcto.
Los principales procesos que se realizan en la búsqueda de respuestas son: Comprensión de la pregunta realizada y búsqueda de la respuesta en grandes bases de datos documentales.
Para la comprensión de las preguntas se realiza una categorización gramatical, se utilizan analizadores semánticos, analizadores sintácticos, clasificadores de entidades y clasificadores de preguntas. Para la búsqueda de respuestas se usan técnicas de recuperación de información basándose en la coincidencia de preguntas y respuestas. Utiliza clasificadores de entidades para encontrar las partes de los documentos donde es más probable encontrar la respuesta.
Una arquitectura típica de los sitemas de Question-Answering es la siguiente: