En un tiempo en el que la verificación de noticias y del discurso público se hace cada vez más necesaria para contrarrestar la desinformación surge el reto de difundir información de calidad. Esto es posible gracias a herramientas que permiten chequear la veracidad o falsedad de los contenidos para responder a las expectativas de la audiencia.
Por otro lado, muchos medios no toman en cuenta la actualización de sus hemerotecas o la optimización de sus buscadores internos para el monitoreo o recuperación de contenido que resulta clave en investigaciones, chequeo de declaraciones y demás.
El proyecto Check Lab perteneciente al Bolivia Tech Hub, desarrolló un repositorio con datos recopilados en Facebook, YouTube y sitios web relacionados al acontecer político, económico y social del país, desde octubre de 2019 hasta la fecha (actualización diaria).
Para este fin fueron seleccionadas 14 cuentas de Youtube de periodistas, líderes de opinión y medios, considerando la regularidad y el volumen del contenido que publican logrando el procesamiento de más de 10.200 vídeos en este lapso de tiempo. En Facebook se tomaron en cuenta 33 páginas. Finalmente, los datos de los sitios web fueron extraídos de 24 fuentes con un scrapeo de 69.951 publicaciones.
La recolección de los datos, en Youtube, se hizo a través de su API oficial y en el caso de los sitios web, se desarrolló scrips de acuerdo a las características de cada medio digital.
Con esta plataforma, pensada especialmente para periodistas, investigadores, analistas de datos, cientistas sociales, gestores digitales y otros, se podrá acceder a búsquedas específicas, utilizando palabras claves o palabras en asociación para determinar cuándo y en qué contexto fue difundido determinado contenido de manera rápida con un solo filtro en varias fuentes.
En la búsqueda de una frase o declaración concreta, se recomienda usar palabras precisas o claves.
Este repositorio está pensado no solo para la investigación académica sino también de los usuarios en general que quieran realizar consultas en una gran base de datos preservada para obtener resultados de manera ágil y sistemática.
La herramienta está actualmente en una prueba piloto con una selecta lista de periodistas y analistas. Posteriormente se considerará un acceso público para que más personas interesadas puedan utilizar la data.