Suicidio 2.0

Por Ana Freire, investigadora postdoctoral en el Web Science and Social Computing Research Group de la Universitat Pompeu Fabra, Barcelona (@ana__freire)


40 segundos. Es el espacio de tiempo que transcurre entre dos suicidios consecutivos en el mundo. Esto suma alrededor de 800 mil personas muertas al año por suicidio. Son cifras escalofriantes anunciadas por la Organización Mundial de la Salud, pero no entendemos la magnitud del problema hasta que comparamos esas cifras con otras a las que estamos más acostumbrados. En 2014, en España, hubo 1873 víctimas de accidentes de tráfico, duplicadas por las 3910 muertes por suicidio. Asimismo, los suicidios en España son 13 veces más frecuentes que los homicidios y 67 veces más que las muertes por violencia de género.

Desde una perspectiva más fría, algunos estudios estimaron el coste que el suicidio implicaba para un país. Así, en 2014, el suicidio en jóvenes australianos supuso un coste total de 17 billones de dólares americanos. Desde una perspectiva más amplia, otro estudio situó en más de 58 billones de dólares americanos el coste del suicidio e intentos de suicidio en Estados Unidos.

Viviendo en pleno siglo XXI, nos planteamos la siguiente pregunta: ¿hay algo que la tecnología pueda hacer para reducir las cifras anteriores? Se ha estimado que detrás del 90% de estos actos se oculta una enfermedad mental, siendo depresión la más habitual. En esta línea, algunos trabajos han confirmado la correlación entre un usuario depresivo y el texto que escribe en sus tweets. De hecho, si dedicamos unos minutos a realizar algunas búsquedas en las redes sociales más populares (Facebook, Twitter, Instagram, Reddit…), encontraremos multitud de contenidos que denotan un comportamiento depresivo e incluso suicida. Han sido numerosas las personas que han escrito sus últimas palabras en las redes para hacer pública su decisión letal, que comparten imágenes de autolesiones o que simplemente, y de modo no intencionado, expresan una clara situación de desasosiego que puede interpretarse tanto por el texto como por el contenido multimedia que utilizan (fotos, vídeos, música…).

La inspección manual de este contenido es inviable, pues estamos hablando claramente de big data (Twitter, con más de 300 millones de usuarios activos al mes, genera una ratio de publicación de 7000 tweets por segundo). Por ello, nace la necesidad de explotar la tecnología existente para intentar detectar comportamiento suicida de modo automático, y tener la posibilidad de intervenir a tiempo.

Un primer paso puede ser identificar las zonas geográficas con mayor interés online en suicidio y Google ofrece algunas herramientas para ello. Por ejemplo, Google Trends permite conocer el interés suscitado a lo largo del tiempo de algunos términos introducidos como consultas en el motor de búsqueda. La propia herramienta nos permite seleccionar el período de tiempo deseado e incluso comparar varios términos de búsqueda. La Figura 1 muestra un ejemplo, en el que vemos las comunidades autónomas donde se han realizado más búsquedas sobre el término “suicidarme”. Podemos ver como Google Trends nos indica, además, consultas relacionadas con la introducida, y temas similares, que nos pueden dar una idea de otros términos que la gente busca dentro del mismo contexto. Para el caso de la Figura 1, vemos el interés por medicamentos con los que quizá se pueda cometer suicidio.

Figura 1: Ejemplo de uso de Google Trends

Un ejemplo de uso de Google Trends para este propósito, es un estudio reciente que reveló el interés que había despertado el suicidio tras el estreno de la famosa serie de adolescentes 13 Reasons Why. El número de consultas relacionadas con suicidio e introducidas en el buscador de Google, sufrió un pico tras el primer episodio de esta serie que gira entorno al suicidio de una adolescente.

Gran parte de las investigaciones relacionadas con la prevención del suicidio online se dedican a analizar las publicaciones de usuarios en redes sociales. Plataformas como Twitter o Facebook ofrecen herramientas que facilitan el acceso a sus contenidos, aunque hay que tener especial cuidado y respetar los términos de privacidad de datos. Son las llamadas APIs (Application Programming Interface), de fácil uso para usuarios con conocimientos de programación. La API de Twitter, permite descargar tweets en tiempo real, estableciendo un filtrado por determinadas palabras clave, geolocalización, idioma y otros aspectos que permiten la recolección de publicaciones que puedan ser de interés para un estudio particular.

Una vez se hayan recopilado los datos que se consideren necesarios, se procederá a su análisis para, por ejemplo, intentar predecir tendencias suicidas en usuarios de Twitter con publicaciones en el área metropolitana de Barcelona durante un mes. En todo este proceso entran en juego tanto el conocimiento experto de psicólogos como tecnologías avanzadas de computación.

Hacer que una máquina entienda el lenguaje natural (el que hablamos y escribimos los humanos) es una tarea compleja. Para un humano puede resultar trivial reconocer el sentimiento negativo o positivo de un tweet (aunque no siempre es así, especialmente si consideramos el límite de 280 caracteres en Twitter). A una máquina le cuesta incluso más, debido a la ambigüedad que puede presentar el texto, especialmente si contiene ironía. Para ello, se utilizan técnicas avanzadas de análisis de sentimiento, detección de ironía, estudio de emoticonos, etc. Al mismo tiempo, estas técnicas se pueden combinar con análisis de imagen, pues en redes sociales como Instagram, las imágenes son las que contienen la mayor parte de la información.

Bien sea del texto, de la imagen o de cualquier otro contenido de la publicación que queramos considerar, se extraerá un conjunto de características posiblemente representativas para detectar comportamiento suicida, como pueden ser el sentimiento del tweet, la frecuencia de uso de ciertas palabras que se asocian a estos perfiles psicológicos, la hora de publicación o el uso de emoticonos. Este conjunto, que puede contener incluso miles de características, será la entrada a un algoritmo de clasificación automática (machine learning), que permitirá asignar a los usuarios un determinado nivel de riesgo de suicidio, con un determinado margen de error. La elección de este algoritmo tampoco es trivial, pues depende de las características anteriormente extraídas y de la correlación que tienen con la variable de riesgo que se quiere estimar. Posteriormente se pueden seleccionar algoritmos que identifican relaciones más sencillas, “lineales” (ej.: Logistic Regression, Naive Bayes) u otros que identifican relaciones más complejas, no lineales, como Support Vector Machine, Decision Trees o Neural Networks. Como introducción a estas técnicas y para ver algunos casos de uso básicos, recomiendo el curso de la Universidad de Stanford, impartido por Andrew Ng, a través de la plataforma online Coursera.

Estamos hablando de inteligencia artificial utilizada para predecir comportamientos que incluso a veces pueden resultar difíciles de detectar por personal especializado en salud mental. De ahí que la precisión de estos algoritmos probablemente se sitúe en valores inferiores al 90%. Sin embargo, estas investigaciones pueden dar lugar al desarrollo de sistemas de gran utilidad para ayudar a identificar posibles sujetos en riesgo y planificar algún tipo de intervención no intrusiva.

Esta entrada fue publicada en General y etiquetada , , , , , , , , , . Guarda el enlace permanente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *