Tidsskriftet.no: De dokter over het gebruik van kunstmatige intelligentie: „Ik heb meer tijd om te ademen”

Steeds meer huisartsen maken gebruik van kunstmatig intelligente assistenten die transcriberen tijdens patiëntconsulten. Eén van hen is de specialist in algemene geneeskunde, Benedicte Wardemann.
— Als je wilt, kan ik een patiënt spelen en een probleem voorleggen? Dan kunnen we zien hoe het programma de verschillende onderdelen oppakt?
Huisarts Benedicte Wardemann van Vest Helse og Trening in Bærum laat zien hoe haar kunstmatig intelligente assistent werkt. Ze drukt op de knop „nieuwe consultatie” op de pc voordat ze begint te spreken:
— Hallo, ik wil graag hulp bij het afvallen. Ik heb het eerder geprobeerd en heb veel verschillende diëten geprobeerd. Het lukt me misschien om vijf kilo af te vallen voordat ik merk dat het te moeilijk wordt om vol te houden. Dan ga ik kapot en kom ik weer aan. Dit is natuurlijk beschamend voor mij, en ik heb het gevoel dat ik faal in iets dat iedereen als vanzelfsprekend beschouwt.
Terwijl Wardemann spreekt, worden de woorden in realtime op het pc-scherm getranscribeerd — via een kleine, ronde, zwarte microfoon op het bureau. De naam van het programma is Noteless, een kunstmatig intelligente assistent die is ontworpen om zorgpersoneel te helpen met documentatiewerk.
Wardemann blijft een typische patiënt spelen voordat ze zich in dit fictieve consult voordoet als de dokter.
Gesystematiseerde medische dagboeknotitie
Als het gesprek voorbij is, maakt de huisarts een paar klikken op de computer. Het resultaat? Een concept van een voltooide dagboeknotitie. Ze leest de samenvatting hardop voor:
Huidige situatie: Wil hulp bij het afvallen. Heeft eerder verschillende diëten geprobeerd met slechts tijdelijke effecten. Het lukt om ongeveer vijf kilo af te vallen voordat het te moeilijk wordt om het gewichtsverlies vol te houden, en komt dan weer aan. Ervaart dit als psychisch schrijnend, met gevoelens van schaamte en gebrek aan controle.
Het programma organiseert systematisch de inhoud van de patiëntenconsultatie onder de secties Huidige situatie, bevindingen, beoordelingen en maatregelen. Volgens Wardemann is het briefje uiteindelijk veel langer dan wat ze zelf zou hebben geschreven.
— Ik vind het fascinerend dat er zulke goed gestructureerde zinnen worden gebruikt. Als ik dit zelf had geschreven, had ik hoogstens een of twee regels gebruikt. Ik had waarschijnlijk ook niet meegerekend dat ze gevoelens van schaamte en gebrek aan controle ervaart, die ook deel uitmaken van de complexiteit van afvallen.
Nadat is geverifieerd dat alles in de conceptnota klopt, neemt de huisarts de tekst over naar het officiële medisch dossier van de patiënt, wat waardevolle minuten bespaart.
AI-onderzoek in opkomst
Het feit dat Wardemanns door AI gegenereerde medische notities langer en gedetailleerder zijn en nuances bevatten waar ze misschien geen prioriteit aan had gegeven, is een belangrijke overweging bij het onderzoeken van onderzoek naar verschillende taalmodellen. Verschillende onderzoeken tonen aan dat door AI gegenereerde antwoorden op gezondheidsgerelateerde vragen vaak als empathischer worden ervaren dan die van echte artsen.
Recentelijk Tijdschrijven publiceerde een studie met de titel Kunstmatige intelligentie en antwoorden van artsen op gezondheidsvragen (1). In dit onderzoek zijn 192 gezondheidsgerelateerde vragen en de bijbehorende antwoorden van artsen afkomstig van de website StudenterSpør.no. Het taalmodel GPT-4 werd vervolgens gebruikt om een nieuwe reeks antwoorden op dezelfde vragen te genereren. In een blinde test werden zowel de door artsen als AI gegenereerde reacties geëvalueerd door een groep respondenten met een achtergrond in de gezondheidszorg.
De resultaten?
De door AI gegenereerde reacties werden als empathischer, beter geïnformeerd en behulpzaam ervaren dan de reacties van echte artsen.
Een van de onderzoekers achter het onderzoek, Ib Jammer, een Ph.D. en anesthesist aan het Haukeland University Hospital, legt de achtergrond van het onderzoek uit:
In een van zijn lezingen had hij een soortgelijk onderzoek uit de VS gepresenteerd (2), waarin werd onderzocht hoe ChatGPT reageerde op gezondheidsgerelateerde vragen.
— De destijds gepubliceerde resultaten lieten zien dat de reacties van ChatGPT vaak significant beter werden beoordeeld dan die van menselijke artsen. Dat vonden we intrigerend. Zou een computer echt beter kunnen zijn dan wij? Hoe is dat mogelijk? En geldt dit ook in het Noors?

Foto: Leikny Havik Skjærseth
Met deze achtergrond hebben Jammer en zijn collega's hun onderzoek uitgevoerd. Ondanks meerdere onderzoeken die aantonen dat de antwoorden van taalmodellen op gezondheidsgerelateerde vragen vaak als beter geïnformeerd worden beschouwd, is het cruciaal om de zwakke punten van de modellen te erkennen.
Behoefte aan regelgeving
Er zijn gevallen geweest waarin taalmodellen uitspraken hebben gedaan die ze niet hadden moeten doen, zegt Ishita Barua, een arts met een doctoraat in kunstmatige intelligentie.
— Ik geloof dat er in België een geval was waarin een man zelfmoord pleegde nadat hij advies van een taalmodel had opgevolgd. Juist dit soort onbedoelde gevolgen moeten we vermijden. Daarvoor is regulering nodig, en dat maakt taalmodellen uitdagend, omdat communicatie zeer dynamisch is. Het is vandaag moeilijk om dit te reguleren, en dat zal ook in de toekomst moeilijk blijven. Maar mensen moeten begrijpen dat dit slechts een taalmodel is — er is geen echte empathie.
Barua is van mening dat taalmodellen een waardevol hulpmiddel kunnen zijn voor zowel artsen als patiënten, zolang ze maar goed worden begrepen en correct worden gebruikt. Ze benadrukt echter dat we nog veel aspecten van het gebruik ervan moeten overwegen, en sommige waarvan we ons misschien nog niet eens bewust zijn.
— Er zijn veel eenzame mensen met niemand om mee te praten die veel troost vinden in het gebruik van taalmodellen. We kunnen op dit moment bijvoorbeeld niet volledig aan deze behoeften voldoen binnen de psychiatrie. Aangezien deze technologie er is om te blijven, moeten we dus doen wat we kunnen om ervoor te zorgen dat deze modellen zo veilig mogelijk zijn. Maar nogmaals, ik weet niet of het mogelijk is om dit volledig te regelen.
AI beter dan artsen — of niet?
De studie is gepubliceerd in Tijdschrijven is een van de vele recente onderzoeken naar het gebruik van taalmodellen in de gezondheidszorg. Verschillende van deze onderzoeken suggereren dat AI-modellen beter presteren dan artsen zelf, zegt Ishita Barua.
— In de afgelopen zes maanden hebben meerdere onderzoeken taalmodellen getest op medische vragen en gevallen. Doorgaans is ChatGPT getest en verschillende resultaten geven aan dat het beter presteert dan artsen alleen, zelfs beter dan artsen die taalmodellen gebruiken. Dat laatste punt was bijzonder verrassend.
Echter, een Zweedse studie, onlangs gepubliceerd in BMJ Open (3), leverde tegengestelde bevindingen op. Barua benadrukt dat dit onderzoek beter vergelijkbaar is met Noorse omstandigheden, aangezien het in een buurland is uitgevoerd en casestudies zijn gebruikt die sterk lijken op echte klinische situaties.
— In dat onderzoek presteerden artsen beter dan taalmodellen. De bevindingen wijzen dus in de tegenovergestelde richting. Misschien moeten we meer gewicht geven aan onderzoeken die zich richten op echte klinische scenario's, waarbij taalmodellen niet overeenkomen met de prestaties van artsen.
Het is fascinerend dat we nu onderzoeken hebben met tegenstrijdige resultaten.
Op de AI-trein springen
Ondanks de uiteenlopende onderzoeksresultaten is kunstmatige intelligentie zonder twijfel een blijvertje — niet alleen in de gezondheidszorg, maar op vele gebieden van de samenleving. Sommigen hebben AI-tools al omarmd, anderen blijven sceptisch. Voor sommigen kan deze krachtige technologie zelfs als een bedreiging aanvoelen.
— Ik denk niet dat professionals in de gezondheidszorg zullen worden vervangen door AI, maar we zouden kunnen worden vervangen door mensen die weten hoe ze AI-tools effectief kunnen gebruiken. Ik zeg altijd dat we niet overbodig zullen worden, we moeten gewoon nieuwe niches vinden om in te werken. Weerstand bieden aan AI helpt niet. Het komt eraan. We hebben een keuze: omarm het en spring op de trein, of blijf achter op het station, zegt stoorzender.
Ishita Barua vergelijkt de huidige AI-revolutie met de introductie van het internet.
— Dit zal diep geïntegreerd raken in alle aspecten van de samenleving. Het is vergelijkbaar met de vraag waarom we moesten leren hoe we het internet moesten gebruiken. We hebben iedereen nodig om een basiskennis te hebben van wat AI is. Wanneer artsen aanbevelingen krijgen van AI-modellen, moeten ze hun professionele integriteit handhaven. Ze moeten begrijpen wat deze technologie werkelijk is en herkennen wanneer ze in een grijs gebied terechtkomt dat menselijke tussenkomst vereist. Het is cruciaal om te anticiperen op mogelijke fouten en valkuilen voordat ze zich voordoen.
Volgens Barua zijn de gebieden die het meest vooruitgang hebben geboekt op het gebied van AI-adoptie in de gezondheidszorg de gebieden die sterk afhankelijk zijn van beeldvorming en patroonherkenning, zoals radiologie, cardiologie, dermatologie en gastro-enterologie.
— Daarnaast is er veel aandacht voor generatieve AI en taalmodellen, voegt ze eraan toe.
Valkuilen van AI in de gezondheidszorg
Terug naar van Benedicte Wardemann huisartsenpraktijk bij Vest Helse og Trening in Bærum, overal op kantoor hangen briefjes waarin patiënten worden geïnformeerd dat AI wordt gebruikt tijdens consulten. Volgens Wardemann hebben geen enkele patiënt negatief gereageerd, ook al kunnen ze zien dat hun woorden live op het computerscherm worden getranscribeerd.
Ze verduidelijkt dat de microfoon dat niet doet vastleggen het gesprek, maar transcribeert wat er wordt gezegd. Bovendien werkt het AI-systeem onafhankelijk van het officiële medische dossiersysteem.
— Het is niet gebruikelijk om tijdens een consult de naam of het geboortenummer van een patiënt hardop te zeggen. Daarom blijft het systeem volledig onafhankelijk van persoonlijke gegevens.
Zodra het consult is afgerond, besteedt Wardemann ongeveer één minuut de dagboeknotitie bekijken om nauwkeurigheid te garanderen.
— Je moet het altijd controleren. Het AI-model is een 'aanwinst': het is altijd positief en erkent de beperkingen van zijn kennisbasis niet.
Deze behoefte aan toezicht is beslissend, volgens Ishita Barua.
— Ik denk dat automatiseringsbias een van de grootste valkuilen is. We hebben de neiging machines te veel te vertrouwen, waardoor we te sterk afhankelijk zijn van door AI gegenereerde beslissingen en aanbevelingen. Het tweede probleem is algoritmische vooringenomenheid: sommige AI-modellen zijn mogelijk niet getraind op een dataset die voldoende divers is.
— We hebben een buitensporig vertrouwen in machines, waardoor we te afhankelijk zijn van door AI gegenereerde beslissingen en aanbevelingen.
Als het gaat om tijd besparen, Ib Jammer wijst erop dat de effectiviteit van AI-taalmodellen sterk afhangt van hoe goed de instructies zijn geformuleerd.
— Als we in ons onderzoek geen specifieke instructies hadden gegeven, alleen een vraag hadden gesteld, zouden we antwoorden hebben gekregen die aanzienlijk moesten worden bewerkt, legt hij uit.
Artsen hebben nog steeds de leiding
Voor huisarts Benedicte Wardemann, die een patiëntenlijst beheert van 1.150 mensen, AI-aangedreven technologie heeft haar meer ademruimte gegeven in haar dagelijkse werk.
— Hoeveel tijd denk je te besparen tijdens een gemiddelde werkdag?
— Meer dan een uur. En het heeft er niet toe geleid dat ik meer patiëntenafspraken heb gemaakt, het heeft me gewoon meer ademruimte gegeven. Ik voel me beter in mijn vel.
Ze gelooft dat het omarmen van nieuwe technologie is essentieel.
— Ik denk dat we nieuwe technologie moeten durven gebruiken die ons kan helpen in ons dagelijks werk. Ik heb het gevoel dat ik mijn tijd terugkrijg en meer tijd besteed aan mijn eigenlijke rol als dokter. Mijn advies aan collega's is dus om het eens te proberen, open te staan voor nieuwe technologie, maar onthoud natuurlijk altijd: wij hebben nog steeds de touwtjes in handen.
Gebruikt door vertrouwde organisaties



.avif)




.avif)




.avif)

Neem contact met ons op
Ons team staat klaar om u te helpen met al uw vragen of feedback. We kijken ernaar uit om van je te horen!