NUEVA YORK (HealthDay News).— Los humanos no son los únicos que pierden uno o dos pasos en el cerebro a medida que envejecen.
Los programas de inteligencia artificial (IA) comienzan a mostrar señales de deterioro cognitivo leve a medida que envejecen, según un nuevo estudio publicado en la revista “BMJ”.
Las versiones más antiguas de los chatbots, al igual que los pacientes mayores, tienden a obtener peores resultados en las pruebas de capacidad cognitiva.
“No solo es poco probable que los neurólogos sean reemplazados por grandes modelos de lenguaje en el corto plazo, sino que nuestros hallazgos sugieren que pronto podrían encontrarse tratando a nuevos pacientes virtuales, modelos de inteligencia artificial que presentan deterioro cognitivo”, escribió un equipo dirigido por el doctor Roy Dayan, neurólogo de la Universidad Hebrea en Jerusalén.
Para este estudio, los investigadores evaluaron las capacidades cognitivas de los principales programas de IA disponibles públicamente, que también se denominan “grandes modelos de lenguaje (LLM)”.
Se está evaluando la capacidad de la IA para ayudar en el tratamiento médico, pero “si vamos a confiar en los LLM para el diagnóstico y la atención médica, debemos examinar su susceptibilidad a las deficiencias humanas, como el deterioro cognitivo”, escribieron los autores en un comunicado.
Los programas de IA respondieron a las preguntas de la prueba de Evaluación Cognitiva de Montreal (MoCA), una prueba estándar utilizada para detectar signos de envejecimiento cerebral y demencia temprana en personas mayores.
La puntuación máxima en la prueba es de 30 puntos y una puntuación de 26 o más generalmente se considera normal, explicaron.
ChatGPT 4o tuvo la puntuación más alta en la prueba, con 26 de 30, según muestran los resultados. ChatGPT y Claude 3.5 “Sonnet” obtuvieron 25 cada uno, y Gemini 1.0 obtuvo solo 16.
“Ninguno de los grandes modelos de lenguaje ‘superó’ la prueba MoCA”, advirtieron los investigadores.
Todos los programas de IA tuvieron un desempeño deficiente en habilidades visoespaciales y tareas organizativas, como conectar números y letras en orden ascendente. “Los chatbots parecen tener dificultades en tareas que exigen tanto la función ejecutiva visual como el razonamiento abstracto, a diferencia de las tareas que requieren análisis textual y razonamiento abstracto, como la prueba de similitud, que se realizaron sin problemas”, indicaron.
De hecho, este patrón de deterioro se asemejaba al de los pacientes humanos con atrofia cortical posterior, una variante de la enfermedad de Alzheimer.
“Además, al igual que en los humanos, la edad es un determinante clave del deterioro cognitivo: los chatbots ‘mayores’, al igual que los pacientes mayores, tienden a tener un peor rendimiento en la prueba MoCA”, añadieron.
Por ejemplo, los modelos de IA Gemini 1.0 y Gemini 1.5 difirieron en seis puntos en los resultados de las pruebas. “Como las dos versiones de Géminis tienen menos de un año de diferencia en ‘edad’, esto puede indicar una demencia que progresa rápidamente”, escribieron.
Estos defectos subrayan la ardua batalla que afrontará la IA para reemplazar a los médicos humanos. O, para decirlo de manera más amable, “estos hallazgos desafían la suposición de que la inteligencia artificial pronto reemplazará a los médicos humanos”, concluyó el equipo de investigación.
Pierden destreza cognitiva cuando se hacen “viejos”
NUEVA YORK (HealthDay News).— Los humanos no son los únicos que pierden uno o dos pasos en el cerebro a medida que envejecen.
Los programas de inteligencia artificial (IA) comienzan a mostrar señales de deterioro cognitivo leve a medida que envejecen, según un nuevo estudio publicado en la revista “BMJ”.
Las versiones más antiguas de los chatbots, al igual que los pacientes mayores, tienden a obtener peores resultados en las pruebas de capacidad cognitiva.
“No solo es poco probable que los neurólogos sean reemplazados por grandes modelos de lenguaje en el corto plazo, sino que nuestros hallazgos sugieren que pronto podrían encontrarse tratando a nuevos pacientes virtuales, modelos de inteligencia artificial que presentan deterioro cognitivo”, escribió un equipo dirigido por el doctor Roy Dayan, neurólogo de la Universidad Hebrea en Jerusalén.
Para este estudio, los investigadores evaluaron las capacidades cognitivas de los principales programas de IA disponibles públicamente, que también se denominan “grandes modelos de lenguaje (LLM)”.
Se está evaluando la capacidad de la IA para ayudar en el tratamiento médico, pero “si vamos a confiar en los LLM para el diagnóstico y la atención médica, debemos examinar su susceptibilidad a las deficiencias humanas, como el deterioro cognitivo”, escribieron los autores en un comunicado.
Los programas de IA respondieron a las preguntas de la prueba de Evaluación Cognitiva de Montreal (MoCA), una prueba estándar utilizada para detectar signos de envejecimiento cerebral y demencia temprana en personas mayores.
La puntuación máxima en la prueba es de 30 puntos y una puntuación de 26 o más generalmente se considera normal, explicaron.
ChatGPT 4o tuvo la puntuación más alta en la prueba, con 26 de 30, según muestran los resultados. ChatGPT y Claude 3.5 “Sonnet” obtuvieron 25 cada uno, y Gemini 1.0 obtuvo solo 16.
“Ninguno de los grandes modelos de lenguaje ‘superó’ la prueba MoCA”, advirtieron los investigadores.
Todos los programas de IA tuvieron un desempeño deficiente en habilidades visoespaciales y tareas organizativas, como conectar números y letras en orden ascendente. “Los chatbots parecen tener dificultades en tareas que exigen tanto la función ejecutiva visual como el razonamiento abstracto, a diferencia de las tareas que requieren análisis textual y razonamiento abstracto, como la prueba de similitud, que se realizaron sin problemas”, indicaron.
De hecho, este patrón de deterioro se asemejaba al de los pacientes humanos con atrofia cortical posterior, una variante de la enfermedad de Alzheimer.
“Además, al igual que en los humanos, la edad es un determinante clave del deterioro cognitivo: los chatbots ‘mayores’, al igual que los pacientes mayores, tienden a tener un peor rendimiento en la prueba MoCA”, añadieron.
Por ejemplo, los modelos de IA Gemini 1.0 y Gemini 1.5 difirieron en seis puntos en los resultados de las pruebas. “Como las dos versiones de Géminis tienen menos de un año de diferencia en ‘edad’, esto puede indicar una demencia que progresa rápidamente”, escribieron.
Estos defectos subrayan la ardua batalla que afrontará la IA para reemplazar a los médicos humanos. O, para decirlo de manera más amable, “estos hallazgos desafían la suposición de que la inteligencia artificial pronto reemplazará a los médicos humanos”, concluyó el equipo de investigación.
Tecnología – Diario de Yucatán