Suïcidi 2.0

Per l’Ana Freire, investigadora postdoctoral al Web Science and Social Computing Research Group de la Universitat Pompeu Fabra, Barcelona (@ana__freire)


40 segons. És l’espai de temps que transcorre entre dos suïcidis consecutius al món. Això suma al voltant de 800 mil persones mortes a l’any per suïcidi. Són xifres esgarrifants anunciades per l’Organització Mundial de la Salut, però no entenem la magnitud del problema fins que comparem aquestes xifres amb altres a les que estem més acostumats. Al 2014 a Espanya van haver-hi 1873 víctimes de l’accident de trànsit, duplicades per les 3910 morts per suïcidi. Així mateix, els suïcidis són 13 vegades més freqüents que els homicidis i 67 cops més que les morts per violència de gènere.

Des d’una perspectiva més freda, alguns estudis vam estimar el cost que els suïcidis implicaven per a un país. Així, al 2014 el suïcidi en joves australians va suposar un cost total de 17 bilions de dòlars americans. Des d’una perspectiva més àmplia, un altre estudi va situar en més de 58 bilions de dòlars americans el cost del suïcidi i de les temptatives de suïcidi als Estats Units.

Vivint en ple segle XXI, ens plantegem la següent pregunta: hi ha alguna cosa que la tecnologia pugui fer reduir les xifres anterior? S’ha estimat que darrera del 90% d’aquest actes s’amaga una malaltia mental, sent la depressió la més habitual. En aquesta línia, alguns treballs han confirmat la relació entre un usuari depressiu i el text que escriu en els seus tweets. De fet, si dediquem uns minuts a realitzar algunes cerques en les xarxes socials més populars (Facebook, Twitter, Instagram, Reddit…), trobarem multitud de continguts que denoten un comportament depressiu i inclús suïcida. Han estat nombroses les persones que han escrit les seves últimes paraules en les xarxes per fer pública la seva decisió letal, que comparteixen imatges d’autolesions o que simplement, i de forma no intencionada, expressen una clara sensació de desassossec que poden interpretar-se tant pel text com pel contingut multimèdia que utilitzen (fotos, vídeos, música,…).

La inspecció manual d’aquest contingut és inviable, doncs estem parlant clarament de big data (Twitter, amb més de 300 milions d’usuaris actius al mes, genera una ràtio de publicació de 7000 tweets per segon). Per això neix la necessitat d’explotar la tecnologia existent per intentar detectar un comportament suïcida de forma automàtica i tenir la possibilitat d’intervenir a temps.

Un primer pas pot ser identificar les zones geogràfiques amb major interès online en suïcidi i Google ofereix algunes eines per fer-ho. Per exemple, Google Trends permet conèixer l’interès despertat al llarg del temps d’alguns termes introduïts com a consultes en el motor de cerca. La Figura 1 mostra un exemple en el que veiem les Comunitats Autònomes on s’han realitzat més cerques amb el terme “suïcidar-me”. Podem veure que Google Trends ens indica, a més, altres consultes relacionades amb la introduida i temes similars que ens poden donar una idea dels termes que la gent busca dins del mateix context. Pel cas de la Figura 1, veiem interès pels medicaments amb els que potser es pugui cometre suïcidi.

Figura 1: Exemple d’ús de Google Trends

Un exemple de l’ús de Google Trends per aquest propòsit, és un estudi recent que va mostrar l’interès que havia despertat el suïcidi després de l’estrena de la famosa sèrie d’adolescents 13 Reasons Why. El número de consultes relacionades amb suïcidi i introduïdes en el cercador de Google, va patir un pic després del primer episodi d’aquesta sèrie que gira entorn al suïcidi d’una adolescent.

Gran part de les investigacions relacionades amb la prevenció del suïcidi online es dediquen a analitzar les publicacions d’usuaris en les xarxes socials. Plataformes com Twitter o Facebook ofereixen eines que faciliten l’accés al seus continguts, encara que cal tenir especial cura i respectar els termes de privacitat de les dades. Són les anomenades APIs (Application Programming Interface), de fàcil ús per a usuaris amb coneixements de programació. L’API de Twitter, permet descarregar tweets en temps real, establint un filtrat per determinades paraules clau, geolocalització, idioma i altres aspectes que poden ser d’interès per un estudi particular. Un cop s’hagin recopilar les dades que es considerin necessàries, es procedirà a la seva anàlisi per, per exemple, intentar predir tendències suïcides en usuaris de Twitter amb publicacions en l’àrea metropolitana de Barcelona durant un mes. En tot aquest procés entren en joc tant el coneixement expert de psicòlegs com el coneixement en tecnologies avançades de computació.

Fer una màquina que entengui el llenguatge natural (el que parlem i escrivim els humans) és una tasca complexa. Per a un humà pot resultar trivial reconèixer el sentiment negatiu o positiu d’un tweet (malgrat no sempre és així, especialment si considerem el límit de 280 caràcters en Twitter). A una màquina li costa inclús més, degut a l’ambigüitat que pot presentar el text, especialment si conté ironia. Per això s’utilitzen tècniques avançades d’anàlisi de sentiment, detecció d’ironia, estudi d’emoticones, etc. Al mateix temps, aquestes tècniques es poden combinar amb l’anàlisi d’imatge, doncs les xarxes socials com Instagram, les imatges són les que contenen la major part de la informació.

Bé sigui del text, de la imatge o de qualsevol altre contingut de la publicació que vulguem considerar, s’extraurà un conjunt de característiques possiblement representatives per detectar comportament suïcida, com poden ser el sentiment del tweet, la freqüència de l’ús de determinades paraules que s’associen a aquests perfils psicològics, l’hora de publicació o l’ús d’emoticones. Aquest conjunt, que pot contenir inclús milers de característiques, serà l’entrada a un algoritme de classificació automàtica (machine learning), que permetrà assignar als usuaris un determinat risc de suïcidi amb un determinat marge d’error. L’elecció d’aquesta algoritme tampoc és trivial, doncs depèn de les característiques anteriorment extretes i de la correlació que tenen amb la variable de risc que es vol estimar. Posteriorment, es poden seleccionar algoritmes que identifiquen relacions més senzilles, “lineals” (ex.: Logistic Regression, Naive Bayes) o altres que identifiquin relacions més complexes, no lineals, com Support Vector Machine, Decision Trees o Neural Networks. Com introducció a aquestes tècniques i per a veure alguns casos d’ús bàsics, recomano el curs de Universitat d’Stanford, impartit per Andrew Ng, a través de la plataforma online Coursera.

Estem parlant d’intel·ligència artificial utilitzada per predir per predir comportaments que inclús de vegades poden resultar difícils de detectar per personal especialitzat en Salut Mental. D’aquí que la precisió d’aquests algoritmes probablement es situï en valors inferiors al 90%. Tot i això, aquestes investigacions poden donar lloc al desenvolupament de sistemes de gran utilitat per ajudar a possibles subjectes en risc i planificar algun tipus d’intervenció no intrusiva.

 

Aquesta entrada s'ha publicat dins de General i etiquetada amb , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

L'adreça electrònica no es publicarà.