Entrada de blog

5 minutos de lectura

Tidsskriftet.no: El doctor habla sobre el uso de la inteligencia artificial: «Tengo más tiempo para respirar»

Publicado el

mar. 11 de marzo de 2025

Cada vez más médicos generalistas utilizan asistentes con inteligencia artificial que transcriben durante las consultas de los pacientes. Una de ellas es la especialista en medicina general, Benedicte Wardemann.

— Si quieres, ¿puedo hacer el papel de paciente y presentar un problema? Entonces, ¿podemos ver cómo el programa recoge las diferentes partes?

La médica generalista Benedicte Wardemann de Vest Helse og Trening en Bærum demuestra cómo funciona su asistente con inteligencia artificial. Presiona el botón de «nueva consulta» del ordenador antes de empezar a hablar:

— Hola, me gustaría recibir ayuda para perder peso. Lo he probado antes y he probado muchas dietas diferentes. Podría lograr perder cinco kilos antes de darme cuenta de que se vuelve demasiado difícil de mantener. Luego me desmorono y vuelvo a subir de peso. Esto es, por supuesto, vergonzoso para mí, y siento que estoy fallando en algo que todos los demás dan por sentado.

Mientras Wardemann habla, las palabras se transcriben en tiempo real en la pantalla del ordenador, a través de un micrófono pequeño, redondo y negro sobre el escritorio. El nombre del programa es Noteless, un asistente con inteligencia artificial diseñado para ayudar al personal sanitario con la documentación.

Wardemann continúa interpretando el papel de una paciente típica antes de hacerse pasar por la doctora en esta consulta ficticia.

Nota de revista médica sistematizada

Cuando termina la conversación, el médico de cabecera hace unos pocos clics en la computadora. ¿El resultado? Un borrador de una nota de diario completa. Lee el resumen en voz alta:

Situación actual: Quiere ayuda para perder peso. Ha intentado anteriormente varias dietas con solo efectos temporales. Logra perder aproximadamente cinco kilos antes de que le resulte demasiado difícil mantener la pérdida de peso, y luego lo recupera. Experimenta esto como algo psicológicamente angustiante, con sentimientos de vergüenza y falta de control.

El programa organiza sistemáticamente el contenido de la consulta del paciente en las secciones Situación actual, hallazgos, evaluación y medidas. Según Wardemann, la nota termina siendo mucho más larga de lo que ella misma habría escrito.

— Creo que es fascinante que utilice frases tan bien estructuradas. Si lo hubiera escrito yo mismo, habría usado solo una o dos líneas, como máximo. Probablemente tampoco habría incluido el hecho de que experimenta sentimientos de vergüenza y falta de control, que también son parte de la complejidad de perder peso.

Tras comprobar que todo lo que figura en el borrador de la nota es correcto, el médico generalista copia el texto en la historia clínica oficial del paciente, lo que ahorra valiosos minutos en el proceso.

La investigación sobre IA va en aumento

El hecho de que las notas médicas generadas por la IA de Wardemann sean más largas y detalladas y capten matices que quizás no haya priorizado es una consideración importante a la hora de examinar la investigación sobre diferentes modelos lingüísticos. Varios estudios indican que las respuestas generadas por la IA a las preguntas relacionadas con la salud suelen percibirse como más empáticas que las de los médicos de verdad.

Recientemente, Tidskrift publicó un estudio titulado Inteligencia artificial y respuestas de los médicos a las preguntas de salud (1). En este estudio, 192 preguntas relacionadas con la salud y sus correspondientes respuestas de los médicos se obtuvieron del sitio web StudenterSpør.no. A continuación, se utilizó el modelo lingüístico GPT-4 para generar un nuevo conjunto de respuestas a las mismas preguntas. En una prueba a ciegas, un grupo de encuestados con experiencia en el ámbito de la salud evaluó tanto las respuestas de los médicos como las generadas por la IA.

¿Los resultados?

Las respuestas generadas por la IA se percibieron como más empáticas, informadas y útiles que las que dieron los médicos reales.

Uno de los investigadores detrás del estudio, Ib Jammer, doctor y anestesiólogo del Hospital Universitario de Haukeland, explica los antecedentes de la investigación:

En una de sus conferencias, había presentado un estudio similar realizado en EE. UU. (2), en el que se examinaba la forma en que ChatGPT respondía a las preguntas relacionadas con la salud.

— Los resultados publicados en ese momento mostraron que las respuestas de ChatGPT a menudo se calificaban como significativamente mejores que las de los médicos humanos. Eso nos pareció intrigante. ¿Podría un ordenador ser realmente mejor que nosotros? ¿Cómo es posible? ¿Y esto también es válido en noruego?

‍

KI-ASSISTENT: Den lille, runde mikrofonen registrerer lyden i rommet slik at KI-programmet kan lage et utkast til… — El micrófono pequeño y redondo captura el sonido de la habitación, lo que permite al programa de inteligencia artificial redactar una nota de diario.
Foto: Leikny Havik Skjærseth

‍

Con estos antecedentes, Jammer y sus colegas realizaron su estudio. Sin embargo, a pesar de múltiples estudios que muestran que las respuestas de los modelos lingüísticos a las preguntas relacionadas con la salud a menudo se perciben como más informadas, es crucial reconocer las debilidades de los modelos.

Necesidad de regulación

Ha habido casos en los que los modelos lingüísticos han hecho declaraciones que no deberían haber hecho, dice Ishita Barua, un médico con un doctorado en inteligencia artificial.

— Creo que hubo un caso en Bélgica en el que un hombre se quitó la vida tras seguir el consejo de una modelo lingüística. Es precisamente este tipo de consecuencias imprevistas las que debemos evitar. Esto necesita regulación, y eso es lo que hace que los modelos lingüísticos sean un desafío, porque la comunicación es muy dinámica. Regular esto hoy es difícil y seguirá siéndolo en el futuro. Sin embargo, la gente debe entender que esto es solo un modelo lingüístico, no tiene verdadera empatía.

Barua cree que los modelos lingüísticos pueden ser una herramienta valiosa tanto para los médicos como para los pacientes, siempre que se entiendan y utilicen correctamente. Sin embargo, enfatiza que hay muchos aspectos de su uso que aún debemos considerar, y es posible que aún no conozcamos algunos.

— Hay muchas personas solitarias sin nadie con quien hablar que encuentran un gran consuelo en el uso de modelos lingüísticos. Por ejemplo, actualmente no podemos satisfacer plenamente estas necesidades en psiquiatría. Por lo tanto, dado que esta tecnología ha llegado para quedarse, debemos hacer todo lo posible para garantizar que estos modelos sean lo más seguros posible. Pero, repito, no sé si es posible regular esto por completo.

La IA es mejor que la de los médicos, ¿o no?

El estudio publicado en Tidskrift es uno de los muchos estudios recientes que examinan el uso de modelos lingüísticos en la atención médica. Varios de estos estudios sugieren que los modelos de IA funcionan mejor que los propios médicos, afirma Ishita Barua.

— En los últimos seis meses, varios estudios han puesto a prueba modelos lingüísticos sobre cuestiones y casos médicos. Por lo general, ChatGPT se ha sometido a pruebas y varios resultados indican que funciona mejor que el de los médicos por sí solos, incluso mejor que los de los médicos que utilizan modelos lingüísticos. Este último punto ha sido particularmente sorprendente.

Sin embargo, un Estudio sueco, publicado recientemente en Abierto BMJ (3), arrojó conclusiones opuestas. Barua enfatiza que este estudio es más comparable a las condiciones noruegas, ya que se llevó a cabo en un país vecino y utilizó estudios de casos que se parecen mucho a situaciones clínicas reales.

— En ese estudio, los médicos superaron a los modelos lingüísticos. Por lo tanto, los hallazgos apuntan en la dirección opuesta. Quizás deberíamos dar más peso a los estudios que se centran en escenarios clínicos reales, en los que los modelos lingüísticos no coinciden con el rendimiento de los médicos.

Es fascinante que ahora tengamos estudios con resultados contradictorios.

‍

Subirse al tren de la IA

A pesar de los diferentes resultados de los estudios, no hay duda de que la inteligencia artificial llegó para quedarse, no solo en la atención médica, sino en muchos ámbitos de la sociedad. Si bien algunos ya han adoptado las herramientas de inteligencia artificial, otros siguen siendo escépticos. Para algunos, esta poderosa tecnología puede incluso parecer una amenaza.

— No creo que la IA vaya a reemplazar a los profesionales de la salud, pero podríamos ser reemplazados por personas que sepan cómo aprovechar las herramientas de IA de manera efectiva. Siempre digo que no nos quedaremos obsoletos, solo necesitamos encontrar nuevos nichos en los que trabajar. Resistirse a la IA no ayudará. Ya viene. Tenemos una opción: aceptarlo y subirnos al tren, o quedarnos en la estación, dice bloqueador.

Ishita Barua compara la revolución actual de la IA con la introducción de Internet.

— Esto se integrará profundamente en todos los aspectos de la sociedad. Es similar a preguntarnos por qué necesitábamos aprender a usar Internet. Necesitamos que todos tengan un conocimiento básico de lo que es la IA. Cuando los médicos reciben recomendaciones de modelos de IA, deben defender su integridad profesional. Deben comprender qué es realmente esta tecnología y reconocer cuándo entra en una zona gris que requiere la intervención humana. Es crucial anticipar los posibles errores y dificultades antes de que ocurran.

Según Barua, los campos que más han avanzado en la adopción de la IA en la atención médica son aquellos que dependen en gran medida del reconocimiento de patrones y imágenes, como radiología, cardiología, dermatología y gastroenterología.

— Además, hay un enfoque significativo en la IA generativa y los modelos lingüísticos, añade.

‍

Los escollos de la IA en la atención médica

De vuelta a De Benedicte Wardemann En el consultorio de medicina general de Vest Helse og Trening en Bærum, se publican notas en el consultorio para informar a los pacientes de que se utiliza la IA durante las consultas. Según Wardemann, ningún paciente ha reaccionado negativamente, a pesar de que pueden ver sus palabras transcritas en directo en la pantalla del ordenador.

Aclara que el micrófono no récord la conversación pero transcribe lo que se dice. Además, el sistema de IA funciona de forma independiente del sistema oficial de registros médicos.

— No es una práctica común decir en voz alta el nombre o el número de nacimiento de un paciente durante una consulta. Es por eso que el sistema permanece completamente independiente de los datos personales.

Una vez finalizada la consulta, Wardemann gasta aproximadamente un minuto revisando la nota del diario para garantizar la precisión.

— Siempre tienes que comprobarlo. El modelo de IA es «agradable»: siempre es positivo y no reconoce las limitaciones de su base de conocimientos.

‍

Esta necesidad de supervisión es crucial, según Ishita Barua.

— Creo que el sesgo de automatización es uno de los mayores escollos. Tendemos a confiar demasiado en las máquinas, lo que nos lleva a confiar demasiado en las decisiones y recomendaciones generadas por la IA. El segundo problema es el sesgo algorítmico: es posible que algunos modelos de IA no estén entrenados en un conjunto de datos lo suficientemente diverso.

— Confiamos demasiado en las máquinas, lo que nos hace depender demasiado de las decisiones y recomendaciones generadas por la IA.

Cuando se trata de ahorrando tiempo, En Jammer señala que la eficacia de los modelos de lenguaje de IA depende en gran medida de qué tan bien se formulen las instrucciones.

— Si no hubiéramos proporcionado instrucciones específicas en nuestro estudio (solo habíamos presentado una pregunta) habríamos recibido respuestas que requerían una edición significativa, explica.

‍

Los médicos siguen a cargo

Para médica generalista Benedicte Wardemann, que gestiona una lista de pacientes de 1.150 personas, la tecnología impulsada por la inteligencia artificial le ha dado más espacio para respirar en su trabajo diario.

— ¿Cuánto tiempo crees que ahorras durante una jornada laboral promedio?

— Más de una hora. Y no me ha llevado a hacer más consultas con los pacientes, simplemente me ha dado más espacio para respirar. Me siento mejor conmigo misma.

Ella cree que adoptar nuevas tecnologías es esencial.

— Creo que debemos atrevernos a usar nuevas tecnologías que puedan ayudarnos en nuestro trabajo diario. Siento que estoy recuperando mi tiempo y dedicando más tiempo a mi función actual como médico. Por eso, mi consejo a mis colegas es que lo prueben, estén abiertos a las nuevas tecnologías, pero, por supuesto, recuerden siempre que seguimos al mando.

‍