¿Los políticos mienten?

Un bot analiza sus discursos para ver si dicen la verdad

Chequeado es un sitio web argentino donde, gracias a un staff de periodistas, desarrolladores y voluntarios, se publica la verificación de la veracidad del discurso público de personalidades reconocidas del mundo social (principalmente políticos) así como la de los información dada a conocer por los medios de prensa locales. Para lograr su cometido, utilizan fuentes oficiales y las elaboradas por organismos no gubernamentales y entidades privadas. El portal nació en 2010, y en mantenido por La Voz Pública, una fundación sin fines de lucro. Y hoy es dirigido por la periodista y abogada Laura Zommer.

Con recursos acotados, decidir dónde poner las energías al momento de elegir los discursos e informaciones que deben ser chequeados no es sencillo. Por esta razón es que decidieron desarrollar “Chequeadobot”, una herramienta que automáticamente detecta declaraciones que aparecen en 25 medios periodísticos argentinos y los compara con los chequeos existentes.

El “bot”, que utiliza técnicas de procesamiento de lenguaje natural y Machine Learning, con una funcionalidad que llamaron sencillamente “¿Qué se chequea hoy?”, se usa ya desde los primeros meses del año pasado en las reuniones de sumario de todos los lunes (cuando los periodistas presentan sus propuestas de notas). “Creemos que usar Chequeabot en las reuniones es muy útil porque nos ayuda, con un importante grado de exactitud, encontrando frases para chequear que no habíamos visto. Además, nos sirve que encuentre declaraciones de todo el país. Eso nos ayuda a evitar ese sesgo que nos hace enfocarnos solo en el área metropolitana de Buenos Aires”, declara Pablo M. Fernández, director de Innovación Editorial de la organización.

Desafíos

El problema para desarrollar el “bot” es que no existen herramientas que permitan programarlos en español lo suficientemente desarrolladas. Esto lo descubrieron cuando trabajaron con Full Fact, una plataforma inglesa de chequeo que también desarrolla herramientas automatizadas.

Detrás del “Chequeabot” está el desarrollador Mariano Falcón, un ingeniero de Sistemas de la Universidad Tecnológica Nacional (UTN). Las herramientas de procesamiento de lenguaje natural avanzadas están desarrolladas en inglés, como la de la Universidad de Stanford o la Apache OpenNLP. Incluyen funcionalidades en español, pero menos desarrolladas. Por eso, para el “bot” de Chequeado, se decidió por Freeling, una herramienta de la Universidad Politécnica de Cataluña, Nltk y Gensim para extraer texto, analizar las oraciones y desarrollar el proceso de Machine Learning predictivo que hace funcionar al “Chequeabot”. “Te permite suplantar librerías en inglés, que son superiores, con estas con las que se pueden llegar a niveles similares para obtener características de las frases como tiempo verbal, diferenciar una afirmación de una pregunta, todas características del lenguaje que nos permite establecer si una frase es chequeable o no”, señala el programador.

Una vez que el sistema toma las frases y extrae las características lingüísticas, se hace un entrenamiento de Machine Learning para que el sistema aprenda a distinguir las frases que se pueden chequear de las que no. “Tomamos discursos chequeados anteriormente y marcamos que frases eran chequeables y cuáles no.” Con este aprendizaje a cuestas, el modelo de Machine Learning asigna probabilidades. “Nunca algo es 100 por ciento chequeable o 100 por ciento no chequeable”, aclara Falcón. “Lo entrenamos una vez por mes para mejorarlo. Hoy, la exactitud promedio es del 90 por ciento.”

Fuente: infotechnology

Comentarios