¿ Que es una herramienta de Procesamiento del Lenguaje Natural ?


Al principio, en los anos 50, el objetivo de los PLN estaba solamente la traducción automática de textos de un idioma a una otra. Pero, ahora su campo de utilización es mucho mas largo.


Debida a sus estructuras, a su caligrafía o al sentido de sus palabras, las idiomas tienen muchas ambigüedades. Cada frase o oración de un idioma tiene muchas informaciones implícitas que un motor de búsqueda debe descodar para cumplir su tarea. Las dificultades de comprensión son distintas en cada una de las idiomas. Las herramientas de Procesamiento del Lenguaje Natural abreviado PLN, en ingles Natural Language Processing (NPL) se cargan de quitar las ambigüedades y ayudar al motor de búsqueda comprender lo que quiere encontrar un usuario. Por eso, las técnicas utilizadas por las herramientas PLN, son varias.


Una herramienta de PLN, que utilizamos cada día seria un corrector ortográfico, como los de tratamiento de textos. Si una palabra no se encuentra en el diccionario, se miran las combinaciones de letras mas cerca de la palabra entrada anteriormente, y aparece una lista de elección que podrían convenir. A veces, tal correctores toman en cuenta la pronunciación fonética de la combinación de letras entrada para encontrar una palabra que se pronunciarían como la combinación de letras.


Quitar una ambigüedad sobre el sentido de una palabra se puede hacer mediante el uso de léxicos, o según el estudio del contexto de la palabra. Pero a veces no es suficiente, se requieren herramientas mas sofisticadas, que pueden exhibir la estructura de una frase. Tal herramientas estudian cada palabra de la frase para encontrar su función en la frase. Así, según la función de una palabra relativamente a una otra, pueden encontrar el sentido de la frase, y Así de la palabra. Aquellas herramientas son analizadores sintácticos y lematizadores (“taggers” en ingles).


Hay otras herramientas que esos, especialmente para idiomas con alfabetos distintos el chino, el ruso o el arabio, que tienen distintos problemas. Veremos un poco mas en detalle los analizadores sintácticos y lematizadores, que son las herramientas mas importantes de PLN para las idiomas del occidente utilizadas por los motores de búsqueda.