“Algoritme stelt depressie vast”. Profiling met social media

lost-927078_640

Afgelopen week werd ik benaderd met de vraag of ik het niet bijzonder vond dat door het toepassen van een algoritme op Instagram-foto’s het mogelijk zou zijn depressiviteit vast te stellen. Door een slimme koppeling met de behandelend (huis)arts zou je dan theoretisch een belletje over deze diagnose van de dokter kunnen krijgen nog voor je zelf het plan hebt om contact op te nemen. In eerste instantie moest ik heel hard lachen, omdat het aandoenlijk is om te zien hoe mensen zich in allerlei bochten wringen om de zogenaamde suprematie van de ICT bij het diagnosticeren van ziektes over het voetlicht te brengen. Bij nadere beschouwing komen vervelende en ingrijpende consequenties van dit soort technieken te voorschijn, onder andere  omdat er hiermee een vorm van “profiling” opdoemt in het zorglandschap. Het bericht over dit onderzoek trok veel aandacht, je kon wel zeggen, het werd gehypet, in de internationale en nationale media zonder dat men wat dieper lijkt te kijken en er over na lijkt te denken. Het signaal dat er van uit ging, namelijk dat zoiets mogelijk zou zijn leek het belangrijkst zonder überhaupt  naar negatieve kanten te kijken.

Facies melancholica

Technisch gezien is wat hier gebeurt niet eens zo verschrikkelijk spectaculair. Het is in de eerste plaats een vorm van digitale beoordeling van iets wat in de psychiatrie al lang bekend is. Het gaat daarbij namelijk om het gelaat met depressieve trekken: het zogenaamde facies melancholica.  In de tweede plaats wordt gebruik gemaakt van de vorm- en kleurkeuzes die een depressief persoon anders maakt dan iemand die daar geen last van heeft. Niet al te verrassende kenmerken.

Techniek

Instagram is een app voor smartphones waarmee foto’s van de eigenaar gedeeld kunnen worden met anderen. De foto’s kunnen voor publicatie ook op een aantal manieren bewerkt worden voor publicatie. Daarbij gaat het o.a. om de kleurkeuze. Door een algoritme te maken dat gelaatstrekken selecteert die veel voorkomen bij depressieve mensen met als aanvulling de kleurkeuze bij de fotobewerking claimen de auteurs bij 70 % van depressieve mensen deze diagnose correct te kunnen vaststellen met de gebruikte technieken. Dat zou nauwkeuriger zijn dan bestaande vragenlijsten of behandelaar-patiënt-gesprekken.

Plaatsbepaling

Wat heb je op individueel niveau nu aan zo’n soort app? De behandeling van psychisch lijden berust op een menselijke interactie tussen zieke en zorgaanbieder. Ik kan me niet voorstellen dat de individuele patiënt zijn of/haar Instagramfoto’s door het genoemde algoritme gaat halen alvorens de zorgaanbieder te bezoeken. Andersom denk ik niet dat een zorgaanbieder opeens toestemming gaat vragen aan hem/haar consulterende patiënten om Instagramfoto’s te mogen delen met het doel deze door het algoritme te halen en zo depressiviteit op te sporen. Het enige wat ik me kan voorstellen is dat bij twijfel over een onbegrepen toestandsbeeld het beoordelen van de Instagramfoto’s van iemand met diens goedkeuring op individuele basis richting kan geven aan verdere diagnostiek. Wat de auteurs van het wetenschappelijke stuk over de toepassingsmogelijkheden zeggen in de discussie geeft precies de richting aan die mij zeer ongewenst lijkt.

“Health care providers may be able to improve quality of care and better identify individuals in need of treatment based on the simple, lowcost methods outlined in this report. Given that mental health services are unavailable or underfunded in many countries), this computational approach, requiring only patients’ digital consent to share their social media histories, may open avenues to care which are currently difficult or impossible to provide.”

En even verder:

“Paired with a commensurate focus on upholding data privacy and ethical analytics, the present work may serve as a blueprint for effective mental health screening in an increasingly digitalized society”

 

Profiling

Wat men hier als toepassing ziet, is niet het onderzoek van patiënten richting doen geven bij onbegrepen klachten, maar het doen op grote schaal van iets wat de auteurs screening noemen. Voor een screeningsmethode is de nauwkeurigheid van de beschreven methodiek ten enenmale veel te laag. Het is echter een vorm van “profiling”, een op aanzienlijke schaal toekennen van een kenmerk aan een subpopulatie van de onderzochte populatie, in dit geval het toekennen van een psychiatrische diagnose. Als je maar toestemming geeft de op sociale media vastgelegde “voorgeschiedenis”( je foto’s) te delen dan kan deze “dienstverlening” gestart van start gaan. De nauwkeurigheid van de uitkomst van het algoritme gaat niet boven de 70%. Er zullen dus ten onrechte veel positieve uitslagen  en ten onrechte negatieve uitkomsten kunnen voorkomen. Door dit “profilen” heeft de burger opeens iets uit te leggen aan de zorgaanbieder/zorgorganisatie bij een afwijkende testuitslag als hij/zij zich helemaal niet depressief voelt. De omgekeerde wereld dus. Dat soort geneeskunde is niet waar we met zijn allen naar toe moeten willen. Bovendien weten we hoe het er aan toegaat als mensen om hun toestemming gevraagd wordt (medische) informatie te delen. Bij het Landelijk SchakelPunt(LSP) heeft de Vereniging van Zorgaanbieders voor Zorgcommunicatie(VZVZ) als verantwoordelijke voor het LSP ook prachtige protocollen over hoe op papier de toestemmingsvraag gesteld moet worden. In de praktijk blijkt die toestemmingsvraag vaak niet zo gesteld te worden, maar meer als een terloopse vraag of de huisartsenpost de gegevens van de eigen huisarts mag inzien. Het is niet te verwachten dat het bij andere globale inzage-vragen van data er anders aan toe zou gaan.

Privacy is bottleneck

De schrijvers Reece en Danforth stellen in bovenvermeld citaat wel heel simpel dat alleen maar een digitale toestemming om de data van de sociale media te delen nodig is. In de discussie bij het artikel blijkt wel echter zeer duidelijk dat het verkrijgen van die toestemming door de auteurs, terecht, nog niet zo eenvoudig was. Van de 509 individuen die men wilde beoordelen aan het begin van het onderzoek, weigerden er op voorhand 221(43%) ook al gaf men uitgebreide garanties over het gebruik, de opslag en de bewerking van de data. Uiteindelijk geeft de studie aan dat de data van 166 individuen gebruikt werden. Nog minder mensen dus. Ze hadden zelf dus wel degelijk last van argwaan en bezwaren van burgers, ondanks uitgebreide geruststellingen. Misschien dat men daarom misschien wel stelt dat het een middel is om toe te passen in samenlevingen met slecht beschikbare en onderbetaalde gezondheidszorg. Daar verwacht  men dan minder tegenstand te ervaren. Het zijn overigens dan wel nogal vreemde argumenten om een doel-populatie uit te zoeken.

W.J. Jongejan




Smartphone detecteert depressie: kritiekloze journalistiek over nietszeggend wetenschappelijk onderzoek

despair-513529_640

Half juli publiceerden wetenschappers van de North Western University in Illinois (USA) in het hier niet al te bekende Journal of Medical Internet Research de resultaten van een onderzoek naar de mate waarin het gebruik van een smartphone het hebben van een depressie bij de eigenaar kan aangeven. Met koppen als: Can your smartphone tell you have a depression en Phone app can identify behaviors linked to depression, study shows komen grote en kleine nieuwsstations in de Verenigde Staten met dit nieuws. Ook Nederlandse nieuwsmedia nemen het gretig over. Even met Google kijken met als zoektermen “smartphone” en “depression “ of depressie” levert zeer veel hits op. Het lijkt wonderbaarlijk dat gebruiksparameters van een smartphone iets over de geestelijke gesteldheid van de bezitter kunnen zeggen. Bij nadere bestudering van de studie blijkt de vlag de lading niet te dekken. Het verhaal rammelt aan alle kanten.

Artikel

In het artikel wordt gemeld dat een app ontwikkeld was, genaamd Purple Robot, die het gebruik van de verschillende functies van een smartphone registreerde en ook de locatiegegevens van de smartphone vastlegde. 40 personen deden mee, waarvan er 28 gedurende twee weken voldoende data voor analyse genereerden. Die 28 werden weer in twee groepen van 14 verdeeld op basis van hun score op een depressie-scoringslijst, de PHQ-9. De onderzoekers concludeerden op basis van de locatie- en gebruiksgegevens van mensen uit beide groepen dat ze met 87% zekerheid konden inschatten of de eigenaar van de smartphone een depressie had. Mensen met een depressie zouden in dit onderzoek gemiddeld 68 minuten per dag hun smartphone gebruiken en niet depressieven 17 minuten. Depressieven zouden gemiddeld minder van locatie wisselen per dag dan hun tegenhangers. Het onderzoek zou volgens de auteurs mogelijkheden openen om continu populaties te monitoren die “at risk” zijn en interventies mogelijk maken als de psychische situatie van mensen verslechtert. Eén van de auteurs meldt trots dat het nu mogelijk is passief vast te stellen of iemand depressieve symptomen heeft zonder hem vragen te stellen.

Kritiek

Op het artikel is heel veel af te dingen omdat het methodologisch van geen kant klopt. In vrijwel geen enkel artikel in de nieuwsmedia is enig woord van kritiek te vinden. Toch is er gelukkig één helder artikel op de website van de National Health Service in het Verenigd Koninkrijk te vinden dat gehakt maakt van deze studie. In de eerste plaats is het goed om vast te stellen dat het om een observationele studie gaat en niet om een gerandomiseerde gecontroleerde trial.  Daarnaast is een groep van 28 personen die ook nog in tweeën gedeeld wordt  wel heel erg klein. Bovendien was de verdeling man/vrouw ongelijk (20 mannen en 8 vrouwen), waarbij de verdeling in de subgroepen niet vermeld wordt. De subgroepen zijn verder niet gematched voor factoren als: het verder hebben van enige ziekte, voor leeftijd, voor het wel of niet werkloos zijn en andere relevante factoren. Ook is niet bekend of er bij de deelnemers niet sprake was van enig ander geestelijk lijden. Het hebben van depressieve symptomen werd uitsluitend vastgelegd op basis van het invullen van de Personal Health Questionaire-9 zonder enig gesprek of onderzoek door een psychiater. Het vreemde is dat de PHQ-9 een score-mogelijkheid heeft op een schaal van drie, terwijl de één van de auteurs spreekt over het scoren op een schaal van 10. Tenslotte gaat de studie er van uit dat alle deelnemers continu hun smartphone bij zich hadden. Controle daarop vond niet plaats. De auteur van het kritische stuk raadt daarom terecht aan weinig waarde te hechten aan de publicatie en adviseert bij een herhaling van dit onderzoek een groter aantal deelnemers te nemen en de studie veel beter op te zetten.

Hype

De vraag is waarom zoveel nieuwsmedia op de gewraakte publicatie gedoken zijn. Het is te verklaren door de fascinatie voor techniek en voor de fascinatie voor het trekken van conclusies uit big data. Het is griezelig om te zien hoe kritiekloos een dergelijk artikel overal in de media overgenomen wordt terwijl er ernstige methodologische bezwaren aan kleven.

Hoewel de auteurs van het artikel spreken over toestemming van deelnemers en van potentiele deelnemers aan dit soort surveillance in de toekomst zou het monitoren van metadata van smartphones het volgen van de psychische gesteldheid van mensen zonder hun toestemming eventueel mogelijk kunnen maken.

Nergens realiseert men zich dat als de these zou kloppen de zo te verkrijgen informatie zeer veel interesse zou hebben van verzekeraars, werkgevers, overheidsdiensten etc. Vanwege de assumptie dat depressieve mensen kunnen neigen tot( zelf)destructie zouden inlichtingendiensten ook geïnteresseerd kunnen zijn.

In elk geval kan geconcludeerd worden dat het gewraakte artikel ten onrechte leidde tot een mediahype.

W. J. Jongejan