Profesor Rogelio Nazar es premiado en congreso internacional sobre procesamiento del lenguaje natural

El reconocimiento fue por el mejor paper presentado durante la versión 34 del Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural realizado en Sevilla.

27.09.2018

Durante los días 19 al 21 de septiembre se llevó a cabo en Sevilla, España, la versión 34 del Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), evento que busca generar un foro de debate en torno a las actuales líneas de investigación del área, así como presentar nuevas posibilidades de aplicaciones reales y proyectos I+D en el campo del Procesamiento del Lenguaje Natural (PLN).

En este marco, el académico Rogelio Nazar del Instituto de Literatura y Ciencias del Lenguaje, en conjunto con Hernán Robledo, profesor de castellano y estudiante del Doctorado en Lingüística del ILCL, ganaron el reconocimiento al mejor paper presentado durante el congreso. El trabajo se denominó “Una clasificación automatizada de marcadores discursivos”, entendiendo los marcadores discursivos como palabras de índole gramatical y no léxica, puesto que se utilizan para formar las construcciones gramaticales y no para representar de manera inmediata la realidad.

En concreto los investigadores presentaron los resultados de la segunda etapa de una investigación en curso, donde se está tratando de generar una multi-clasificación de estos marcadores, donde por ejemplo la palabra “entonces” pueda ser categorizado como conector temporal y también como conector consecutivo. Acorde a las palabras de Nazar, “lo innovador del trabajo es que nuestro método está basado solo en datos de grandes corpus textuales, desde donde extrajimos los elementos que los usuarios de la lengua utilizan para marcar el discurso, conectar ideas o comentarlas y los agrupamos según su similitud estadística”.

El académico indica que el carácter innovador de la propuesta los llevó a conseguir esta distinción, debido a que si bien en el español existen varias clasificaciones y diccionarios de marcadores del discurso disponibles, todo ellos están basados en lo que el investigador conoce sobre la lengua y sobre el mundo, no en datos que provengan de la lengua en uso. “Nuestro trabajo, en cambio, procede desde los datos de corpus y no utiliza ningún conocimiento sobre la lengua, sino que utiliza procedimientos estadísticos y computacionales para inducir taxonomías de marcadores del discurso de manera natural”, enfatiza Rogelio Nazar.

APLICACIONES Y PROYECCIONES DEL ÁREA

Respecto a las aplicaciones de esta investigación, una de ellas está relacionada con la redacción asistida por computador, siendo estos avances incorporados a la herramienta Estilector, software que ahora podrá ayudar también al usuario a redactar mejor por medio del uso correcto de marcadores discursivos, ya sea controlando su función, su puntuación o la riqueza léxica en su uso. Este software fue diseñado hace algunos años por el equipo del proyecto Tecling, el cual es dirigido por el profesor Nazar.

Otras posibles aplicaciones están conectadas al aprendizaje de lenguas o la extracción de información. La primera de ellas se usaría para contrastar el uso de marcadores discursivos en dos lenguas, sirviendo por ejemplo para contrastar cuáles marcadores se usan más en el español comparativamente con el inglés en contextos similares.  Para la extracción de información, se podría usar estos avances para la categorización automática de estos elementos lingüísticos, que cumplen una función importante en la coherencia de los textos, siendo útil para útil para señalar las distintas relaciones discursivas al interior de un texto.

Respecto a las proyecciones actuales del Procesamiento de Lenguaje Natural (PLN), el Dr. Rogelio Nazar, destaca que el último congreso SEPLN se llevó a cabo en el Hospital Universitario Virgen del Rocío, debido a que las aplicaciones del PLN al área de la salud es una tendencia importante en Europa actualmente. “Los investigadores se basan en grandes bases de datos de fichas médicas de pacientes, por ejemplo, para ayudar a los médicos en sus diagnósticos y prevenir situaciones de salud complejas a partir de tendencias que muestren los datos con que se cuenta”, finaliza el académico.

Por Gabriel Cerda

ILCL