Conocimiento y tecnología al servicio de México

Análisis de comentarios en redes sociales para la generación automática de noticias

Dr. Noé Alejandro Castro Sánchez

Línea de Investigación: Lingüística computacional

Las redes sociales se han convertido en una fuente de información invaluable en ámbitos de domino público y privado. Entre los diferentes usos que se les da se encuentran el mantener contacto con personas, acceder a contenido multimedia (fotos y videos) y distribución de contenido informativo (noticias, ideas, opiniones).

En México, durante el año 2016, había 64.5 millones de internautas suscritos a alguna red social. Esto arroja un 94.8% de penetración sobre la base de usuarios de Internet. La distribución de las actividades que realizan en las redes sociales se da de la siguiente manera: hablar con amigos (79%), ver fotos (67%), ver videos (48%), consultar noticias (45%), comunicar ideas 26%), etc.

En nuestra línea de investigación de Lingüística Computacional (también conocida como Procesamiento de lenguaje natural), es de especial interés el análisis del contenido textual que se comparte en las redes sociales. Uno de nuestros trabajos aprovecha la facilidad que ofrecen las redes sociales para difundir y re-transmitir contenido que puede ser de interés público, como accidentes de tránsito, eventos delictivos, desastres naturales, etc. Lo ideal es contar con una herramienta que nos permita agrupar comentarios generados en redes sociales que están describiendo un mismo suceso, para poder generar de manera automática un texto a manera de noticia que refleje lo que los usuarios están compartiendo. En particular nos estamos enfocando a identificar comentarios que traten sucesos de tipo policial, como asaltos, homicidios y accidentes viales, y aquellos relacionados con desastres naturales, como incendios, ciclones y sismos.

Para lograr esto se requiere solucionar varios problemas, por ejemplo, primero tenemos que identificar en todo el mundo de comentarios que se generan, aquellos que están describiendo un suceso de interés, y posteriormente debemos de identificar y agrupar los comentarios que están relatando el mismo evento. Lo importante es poder responder a las siguientes preguntas: qué sucedió, dónde sucedió, cuándo sucedió y a quién le sucedió o quiénes son los involucrados. Recabada esta información, se debe abordar la tarea más complicada: ordenar la lista de eventos que describen un suceso en una secuencia lógica, independientemente del orden en que fueron transmitidos los comentarios. Por ejemplo, en el suceso de una carretera dañada por el desgajamiento de un cerro, podría darse porque sucedió el evento lluvia, que provocó el ablandamiento de tierra y finalmente la obstrucción o daño en la carretera. Todos estos eventos podrían haberse transmitido en la red social de manera desordenada: el primer comentario relacionado con la obstrucción de la carretera, después alguien comenta sobre la lluvia y el último comentario sobre el desgajamiento.

Resueltas todas y cada una de estas tareas, podremos contar ya con un medio que nos mantenga informados a través de lo que los usuarios que están viviendo el suceso comparten en redes sociales.