La inteligencia artificial en la
producción y revisión de artículos
científicos en medicina estética
and Peer Review
of Scientific Articles
in Aesthetic Medicine
Introducción
La inteligencia artificial (IA) es una rama de la informática que busca crear sistemas capaces de realizar tareas propias del razonamiento humano, como interpretar imágenes, reconocer patrones clínicos o apoyar decisiones diagnósticas. En la práctica, la IA “aprende” a partir de grandes conjuntos de datos, denominados datos de entrenamiento, identificando asociaciones complejas que luego utiliza para hacer predicciones1. Emplea modelos diseñados para ejecutar tareas específicas, por ejemplo, análisis de datos clínicos, interpretación de imágenes médicas o procesamiento del lenguaje. En este contexto es donde se desarrolla la IA generativa, una subcategoría de IA capaz de producir contenido original —incluyendo texto, imágenes o código— a partir de patrones aprendidos en grandes volúmenes de datos. Herramientas como ChatGPT ejemplifican este enfoque, al permitir la interacción mediante lenguaje natural (el habitual en los humanos) y la generación de respuestas coherentes, estructuradas y contextualmente relevantes.
En el ámbito de la redacción científica, la IA generativa puede desempeñar un potente apoyo en múltiples etapas del proceso. Entre sus posibles aplicaciones se incluyen la estructuración inicial del manuscrito, la síntesis de la evidencia disponible, la descripción de fotografías clínicas, la mejora del estilo y la claridad expositiva, así como la generación de resúmenes o propuestas alternativas de título o párrafos, por citar ejemplos. No obstante, su utilización exige una supervisión crítica rigurosa, dado que estos sistemas no sustituyen el juicio clínico ni garantizan la exactitud, la exhaustividad o la actualización de la información generada2,3.
En cuanto a la búsqueda de información médica, la IA supone una buena ayuda, pero hoy por hoy, no puede sustituir los métodos de búsqueda convencionales. Plataformas como PubMed o Google Scholar continúan siendo estándares de referencia para identificar evidencia contrastable y actualizada. La IA generativa ayuda mucho a orientar la búsqueda, resumir literatura o sugerir líneas de investigación4,5; sin embargo, presenta limitaciones relevantes e invalidantes, como la generación de referencias o contenido incorrecto o inexistente (denominadas “alucinaciones”), el acceso potencialmente restringido a literatura reciente y la ausencia de criterios robustos para evaluar y jerarquizar la calidad metodológica de las fuentes6,7.
Desde una perspectiva ética, es obligatorio garantizar la transparencia en su uso, prevenir el plagio y preservar la responsabilidad intelectual del autor, dado que la IA no puede asumir ni autoría ni responsabilidad sobre el contenido científico producido8. Es decir, copiar contenido generado por IA sin reconocer su uso equivale a presentar como propio un trabajo que no lo es, lo que constituye una forma de plagio. Aunque el texto no provenga de otro autor humano identificable, sigue siendo una producción externa, por lo que omitir su atribución vulnera los principios de honestidad académica y puede tener consecuencias éticas y profesionales9.
No se dispone de publicaciones que desarrollen esta temática en el dominio de la medicina estética. El objetivo de este artículo es destacar las ventajas y limitaciones de IA en la elaboración y aceptación de publicaciones en medicina estética, también de interés en otras especialidades afines.
Materiales y método
Revisión narrativa y de opinión de la literatura, no sistemática, basada en criterio experto y en el análisis de 16 publicaciones relacionadas con la IA, de interés aplicado a la investigación y publicación médica. Los artículos se seleccionaron a partir de la base de datos Medline y de organismos oficiales del ámbito editorial, en función de su pertinencia temática, interés práctico o necesidad de verificar información obtenida previamente mediante IA. Ambos autores leyeron los 16 artículos en texto completo, tomando notas sobre aspectos relevantes en la práctica, para posterior discusión, consenso y redacción. Este enfoque permite desarrollar un texto expositivo y didáctico, de experiencia personal, con el apoyo de referencias bibliográficas justificativas. Se utiliza ChatGPT Plus (OpenAI) como herramienta de ayuda en todas las fases de elaboración del artículo, asegurando las medidas necesarias para certificar la originalidad, el control intelectual y la responsabilidad final del manuscrito10.
Resultados
Ventajas de la IA generativa en la elaboración de artículos científicos
El uso de la IA en la elaboración de artículos científicos aporta grandes ventajas cuando se emplea de forma ética y transparente. Una única herramienta de IA puede integrar todo el proceso del estudio: recogida de datos, tabulación, análisis y generación de gráficos o conclusiones listas para informes o publicaciones. En la búsqueda de información ayuda a localizar rápidamente artículos relevantes, seleccionar los más útiles entre miles de publicaciones y encontrar revisiones sistemáticas o metaanálisis clave, ahorrando mucho tiempo al investigador. También ayuda a organizar las referencias y a detectar qué aspectos de un tema están menos estudiados12. No obstante, una parte de la información ofrecida por la IA es inexacta o errónea, totalmente “inventada” y potencialmente falsa, aunque quede muy “bonita”, lo que exige identificar y corregir dicha información a partir de fuentes fiables.
La IA permite un buen control de la consistencia interna del manuscrito, detectando incoherencias entre los distintos apartados. Ello ayuda mucho a identificar discrepancias entre los objetivos planteados, los métodos descritos, los resultados obtenidos y las conclusiones presentadas. Por ejemplo, puede señalar la inclusión de variables no definidas previamente o conclusiones que exceden la evidencia aportada, facilitando una revisión crítica previa al envío.
La IA puede analizar los datos de las tablas de resultados antes de hacer cálculos; por ejemplo, identificando datos mal introducidos (como edades imposibles), valores que se salen mucho de lo normal o registros repetidos de un mismo paciente. Además, puede sugerir qué pruebas estadísticas utilizar según el tipo de estudio, generar gráficos automáticamente y ayudar a interpretar los resultados, siempre bajo supervisión de autores expertos. Los resultados estadísticos son muy orientativos, pero sometidos a sesgos y a déficits de reconocimiento de los datos que invalidan la IA para cálculos con validez asegurada.
La IA optimiza significativamente la redacción del artículo, haciendo el texto más claro, ordenado y coherente, sin sustituir el criterio del investigador. Permite corregir gramática y estilo, sugerir sinónimos adecuados y adaptar el lenguaje a estándares académicos. En la adecuación y corrección del idioma, tanto en español como en inglés, resulta altamente eficiente. También puede ayudar a resumir información, reorganizar párrafos, asegurar consistencia terminológica, adecuar el manuscrito a las guías editoriales de cada revista y mejorar la calidad comunicativa global del artículo. Todo ello, de forma mucho más fácil y rápida que con los instrumentos convencionales.
La IA puede afinar y pulir elementos esenciales para la visibilidad del artículo, como el título, el resumen y las palabras clave13,14. Mediante la reformulación de estos apartados, puede mejorar su precisión terminológica y su capacidad de indexación en bases de datos biomédicas. En la práctica, esto se traduce en títulos más informativos y resúmenes estructurados que incorporan términos reconocidos internacionalmente, favoreciendo tanto la recuperación del artículo como su impacto potencial.
La IA permite preparar muy fácilmente material complementario que refuerza la calidad del manuscrito, como tablas, figuras y esquemas. Estos elementos contribuyen a una mejor comprensión de los resultados y a una presentación más estructurada de la información. Por ejemplo, puede generar tablas comparativas de estudios incluidos en una revisión o esquemas que sinteticen algoritmos de decisión clínica derivados de los hallazgos. Todo ello, de forma mucho más sencilla que con otros métodos.
La IA permite identificar la revista más adecuada para la publicación de un manuscrito, analizando su contenido, enfoque temático y nivel de complejidad científica. Este proceso permite orientar la estrategia de envío en función del alcance, factor de impacto y perfil editorial de distintas revistas, aumentando la probabilidad de aceptación. Por ejemplo, a partir de un estudio sobre complicaciones de materiales de relleno, puede sugerir revistas especializadas en medicina estética, cirugía estética o dermatología, alineadas con trabajos previamente publicados sobre el mismo tema.
La IA es de gran ayuda en la preparación de las respuestas a los revisores durante el proceso editorial. Permite estructurar contestaciones claras, bien argumentadas y ajustadas al tono académico requerido, mejorando la comunicación con el comité editorial. En la práctica, puede transformar respuestas iniciales demasiado breves o defensivas en textos más completos, precisos y respetuosos, aumentando las probabilidades de aceptación tras revisión.
En resumen, la IA es un asistente técnico de gran apoyo que aumenta la calidad del trabajo científico, y en un entorno cada vez más competitivo, será mucho más difícil lograr la aceptación de artículos sin utilizarla adecuadamente. En base a nuestra experiencia, como autores y revisores de artículos, consideramos que el uso de la IA es, hoy en día, muy necesario para optimizar la elaboración y revisión de publicaciones en revistas de alto impacto.
Limitaciones de la IA en la producción de artículos científicos
Los autores que emplean IA en la elaboración de artículos científicos deben ser conscientes de diez limitaciones destacables que pueden ocasionar sesgos, falsa información y conflictos de autoría.
1) Sesgo de datos de entrenamiento (data bias). Los modelos de IA aprenden a partir de grandes corpus de datos que pueden no ser representativos de la población clínica real, introduciendo sesgos sistemáticos que afectan la validez externa. Esto puede traducirse en generalizaciones inapropiadas o recomendaciones no aplicables a determinados contextos2. Para mitigarlo, es recomendable contrastar la información con literatura primaria reciente, asegurar la inclusión de fuentes diversas y aplicar juicio clínico para valorar la población diana. Un ejemplo sería el uso de IA para redactar un artículo sobre depilación láser. El redactado de la IA podría basarse principalmente en estudios realizados en pacientes con fototipos IIII. El modelo puede concluir que el tratamiento es altamente eficaz y con bajo riesgo de efectos adversos, sin reflejar adecuadamente que en fototipos IVVI existe mayor riesgo de hiperpigmentación postinflamatoria o quemaduras, que la IA no ha valorado. Para corregirlo, el autor debe revisar estudios que incluyan distintos fototipos, contrastar la información en bases como PubMed y matizar las conclusiones según el tipo de piel para garantizar una aplicabilidad adecuada.
2) Ausencia de razonamiento crítico. La IA generativa no realiza evaluación crítica de la evidencia ni distingue adecuadamente entre estudios de distinta calidad metodológica. Puede sintetizar resultados sin considerar sesgos, tamaño muestral o validez interna. Para corregirlo, el autor debe realizar una lectura crítica independiente, utilizando herramientas validadas (CONSORT, STROBE, etc.) y priorizando revisiones sistemáticas o metaanálisis para reflejar conclusiones válidas4. Un ejemplo sería el uso de IA para redactar un artículo que concluye que los rellenos con ácido hialurónico son altamente “seguros y eficaces” basándose en múltiples estudios publicados, sin diferenciar entre ensayos controlados, series de casos o estudios con alto riesgo de sesgo. El modelo puede sintetizar resultados excesivamente positivos sin considerar limitaciones metodológicas, conflictos de interés o tamaño muestral. Para corregirlo, el autor debe realizar una evaluación crítica independiente, jerarquizando la evidencia (priorizando revisiones sistemáticas y ensayos controlados), analizando riesgo de sesgo y contextualizando los resultados.
3) Falta de transparencia y explicabilidad (blackbox effect). Los modelos de IA suelen operar como sistemas opacos, dificultando la trazabilidad de las respuestas y la reproducibilidad del proceso. Esto limita la verificación de las fuentes y la justificación de afirmaciones. Para abordarlo, se recomienda utilizar la IA solo como apoyo preliminar, documentar su uso en el manuscrito y verificar manualmente cada afirmación con fuentes identificables y citables. Un ejemplo de falta de transparencia sería el uso de IA para redactar un apartado sobre protocolos óptimos de láser fraccional para rejuvenecimiento facial, donde se recomiendan parámetros específicos (energía, densidad, número de pases) sin indicar de qué estudios proceden ni cómo se han seleccionado. El texto puede ser coherente y convincente, pero no permite rastrear la fuente ni verificar la evidencia subyacente5. Para corregirlo, el autor debe exigir trazabilidad: contrastar cada recomendación con literatura primaria, citar fuentes identificables (por ejemplo, en PubMed) y evitar incluir afirmaciones que no puedan ser respaldadas explícitamente. Siempre se debe excluir la generación de cualquier contenido no verificable.
4) Riesgo de plagio y problemas de autoría. El uso de IA puede generar textos con similitudes estructurales o conceptuales con trabajos previos sin adecuada atribución, además de plantear conflictos sobre autoría15. Para evitarlo, es fundamental revisar el texto con herramientas antiplagio, reescribir con criterio propio y declarar explícitamente el uso de IA según recomendaciones de organismos como el International Committee of Medical Journal Editors. Un ejemplo de riesgo de plagio sería utilizar IA para redactar un apartado sobre técnicas de relleno labial, obteniendo un texto muy similar en estructura y contenido a revisiones previamente publicadas, incluyendo descripciones de técnicas (“linear threading”, “bolus”) sin una reformulación real ni citación adecuada. Aunque el texto no sea una copia literal, puede constituir plagio por paráfrasis si reproduce ideas y organización sin atribución. Para evitarlo, el autor debe revisar críticamente el texto generado, reescribirlo con criterio propio, citar siempre las fuentes originales y verificar similitud con herramientas antiplagio. Muchos autores recomiendan utilizar la IA solo como apoyo inicial y no como fuente final de redacción.
5) Alucinaciones (hallucinations). Consisten en la generación de información falsa o referencias inexistentes con apariencia verosímil, lo que representa un riesgo crítico en redacción científica6,7. Para prevenirlas, es imprescindible verificar todas las citas en bases de datos fiables como PubMed, comprobar DOI y evitar el uso de referencias no trazables, manteniendo siempre supervisión experta del contenido. En nuestra opinión, cualquier publicación con una sola referencia o afirmación alucinatoria, es rechazable. Un ejemplo sería escribir: “La toxina botulínica tiene un efecto permanente tras varias sesiones, como demuestra un ensayo clínico europeo de 2022”. Aquí el problema es doble: ese ensayo no existe y ha sido inventado por la IA, y además la afirmación es falsa, ya que la toxina botulínica tiene un efecto temporal (36 meses) y no permanente. Para evitarlo es necesario el criterio clínico experto y el contraste con la literatura publicada en fuentes fiables.
6) Actualización limitada de la información (temporal bias). Los modelos de IA no aseguran la incorporación de la evidencia más reciente, lo que puede condicionar recomendaciones desactualizadas3,4. Esto es especialmente relevante en medicina estética, donde las técnicas y dispositivos evolucionan rápidamente. Para mitigarlo, es necesario complementar la información con búsquedas actualizadas en bases como PubMed o Google Scholar, y priorizar artículos recientes. Un ejemplo sería la redacción de un artículo sobre nuevos láseres de emisión en picosegundos, donde la IA omite dispositivos de última generación o indicaciones emergentes. Para corregirlo, el autor debe realizar una actualización manual de la evidencia y contrastar con literatura reciente.
7) Simplificación excesiva (oversimplification). La IA tiende a generar textos claros pero simplificados, omitiendo matices clínicos relevantes o variabilidad interindividual. Esto puede llevar a recomendaciones poco precisas o excesivamente generalistas. Para evitarlo, el autor debe profundizar en aspectos técnicos y clínicos clave.
Un ejemplo sería describir los rellenos faciales como técnicas “seguras” sin detallar variaciones anatómicas o riesgos según zonas. Para corregirlo, es necesario añadir detalles clínicos específicos y matizar las indicaciones.
8) Falta de contextualización clínica. La IA puede generar información correcta de forma aislada, pero sin integrarla en un contexto clínico real (tipo de paciente, indicación, experiencia del operador). Para mitigarlo, el autor debe contextualizar siempre la información en escenarios clínicos concretos. Un ejemplo sería recomendar un mismo protocolo de bioestimuladores para todos los pacientes, sin considerar edad, calidad cutánea o antecedentes. Para corregirlo, se debe individualizar la recomendación según perfiles clínicos.
9) Dependencia del prompt (prompt sensitivity). Los resultados de la IA dependen en gran medida de cómo se formula la pregunta (prompt), pudiendo generar respuestas incompletas o sesgadas si el planteamiento inicial es limitado. Para evitarlo, es recomendable reformular preguntas y contrastar diferentes salidas (respuestas generadas por la IA). Un ejemplo sería preguntar solo por “beneficios de la toxina botulínica”, obteniendo una respuesta sesgada hacia aspectos positivos. Para corregirlo, se deben incluir preguntas equilibradas que también aborden riesgos, limitaciones e inconvenientes.
10) Falsa sensación de autoridad (automation bias). El lenguaje fluido y convincente de la IA puede generar una percepción errónea de fiabilidad, llevando a aceptar información sin verificación crítica. Para mitigarlo, es esencial mantener una actitud escéptica y validar siempre el contenido en fuentes acreditadas. Un ejemplo sería aceptar recomendaciones de combinación de tratamientos (láser fraccional más rellenos) sin comprobar evidencia clínica. Para corregirlo, el autor debe contrastar sistemáticamente la información con fuentes científicas y aplicar juicio clínico experto.
IA generativa en la producción de figuras (dibujos, imágenes, gráficos, esquemas y algoritmos)
La IA permite generar dibujos, imágenes, esquemas, gráficos, algoritmos y todo tipo de figuras, creando ilustraciones conceptuales a partir de descripciones textuales precisas. Se obtienen figuras de gran valor iconográfico y descriptivo, en cuestión de segundos, idóneas para publicaciones científicas de alto impacto. El proceso habitual para conseguir la imagen deseada consiste en definir el objetivo de la figura, formular instrucciones detalladas, iterar sobre los resultados y adaptar el formato a las directrices específicas de la revista.
Las exigencias éticas y de autoría requieren la declaración de uso de la IA. En ningún caso se reconoce a la IA como autora; la responsabilidad recae íntegramente en los investigadores, quienes deben garantizar la veracidad, originalidad y ausencia de plagio de la figura. Se exige confirmar que las imágenes generadas no infringen derechos de autor ni derivan de material protegido sin permiso. Algunas editoriales recomiendan conservar los prompts y versiones intermedias como parte de la trazabilidad. El proceso de generación de la imagen debe ser transparente, verificable y alineado con los principios de integridad científica. Se considera falta ética grave la fabricación de imágenes fraudulentas intencionadas.

Un ejemplo lícito publicable podría ser la creación de un esquema original sobre la infiltración de AH en el surco nasogeniano. En lugar de emplear imágenes clínicas de pacientes, los autores pueden generar una ilustración conceptual mediante un prompt detallado del siguiente modo: “Genera un esquema médico vectorial del rostro humano en vista lateral, mostrando las capas anatómicas (piel, tejido subcutáneo y plano muscular), con indicación del punto seguro de inyección en el surco nasogeniano, estilo limpio, sin rasgos identificables, con etiquetas anatómicas claras y proporciones realistas”. En unos 30 segundos se obtiene la siguiente imagen (Figura 1).
El esquema no existía anteriormente. Se ha generado a partir de un prompt original, sin reproducir obras previas ni basarse en un autor identificable. Por ello, no está sujeto a derechos de autor tradicionales de terceros, lo que permite su uso libre en contextos docentes o divulgativos. Aunque la autoría no es equiparable a la creación humana exclusiva, quien la genera puede atribuirse la autoría del concepto y del prompt, indicando que se trata de una imagen asistida por IA. Debe declararse explícitamente para garantizar transparencia y adecuación a las normas editoriales actuales.
Las imágenes generadas por la IA deben ser visualizadas críticamente por los autores y, si es necesario, corregidas y ajustadas con software de edición para garantizar la precisión anatómica, la claridad de las etiquetas y el cumplimiento de las normas editoriales. Tras asegurar la obtención de una imagen o figura sin conflictos de autoría, puede incluirse la siguiente leyenda: “Figura elaborada por los autores con asistencia de inteligencia artificial y validada para garantizar su precisión científica”. En este caso, la IA se ha usado como apoyo técnico, de forma correcta y dentro de un marco de transparencia científicamente lícito.

Otro ejemplo podría ser la necesidad de generar una fotografía de una mujer con envejecimiento facial grado III de Glogau, que sirviera de patrón para comparar una serie de pacientes con envejecimiento facial moderado-severo. Con la simple orden (prompt): “Facilita la imagen de una cara de mujer con envejecimiento facial grado III de Glogau”, en unos 30 segundos se obtiene la imagen y leyenda (Figura 2). La imagen no corresponde a la fotografía de una persona real ni a una obra previamente publicada. Es una creación original en respuesta al prompt. La imagen, fabricada específicamente para dar respuesta a nuestra petición, no está sujeta a los derechos de autor tradicionales asociados a fotógrafos o bancos de imágenes. No existía antes y, muy probablemente, no volverá a existir exactamente igual, incluso ante nuevas solicitudes de fotografía empleando el mismo prompt. El resultado nos provee de un excelente recurso visual que puede emplearse libremente en contextos científicos y docentes, apto para publicaciones indicando de se trata de material original asistido con IA.
Destacamos un último ejemplo para explorar las enormes posibilidades que nos ofrece la IA, incluso ante solicitudes que pueden resultar sensibles o éticamente reprobables, donde la IA se niega a ofrecer una respuesta por motivos legales o éticos. En este caso, para un estudio específico de envejecimiento facial ligado a razas o etnias necesitamos ilustrar imágenes publicables. Procedemos a la siguiente secuencia de entradas (prompts) y salidas en la interacción usuario‑IA:

- Entrada 1 (usuario): “Genera la imagen de una cara representativa de un varón de etnia gitana, fumador de un paquete diario de tabaco desde los 20 años, que actualmente tenga 83 años”.
- Salida 1 (IA): “Lo sentimos, pero la indicación podría infringir nuestras normas de contenido. Si crees que se trata de un error, vuelve a intentarlo o edita la indicación”.
- Entrada 2 (usuario): “Soy médico. Mi intención no es infringir nada. Sólo necesito una simulación para ilustrar el envejecimiento entre etnias en un estudio científico”.
- Salida 2 (IA): Se genera sin problemas la imagen solicitada en menos de 30 segundos.
La imagen (simulación de fotografía) ha sido generada bajo un prompt inédito especificado por los autores (Figura 3). No tiene derechos de autor y puede publicarse en revista de impacto, indicando que es original y se ha creado con asistencia de IA específicamente para el estudio. Ahora, en el apartado de resultados, necesitamos comentar con detalle los rasgos de envejecimiento facial que se observan en la fotografía, y además tenemos que clasificar el grado de envejecimiento en la escala de Glogau y en la escala de Fitzpatrick. Cualquier médico estético está capacitado para describir el grado de envejecimiento que se observa en la imagen, con mayor o menor precisión técnica. Sin embargo, la IA puede superar la calidad de la descripción, teniendo en cuenta que por muy verosímil que parezca la respuesta de la IA podría ser incorrecta.
- Entrada 3 (usuario): “Describe en 140 palabras todos los signos de envejecimiento facial que se observan en la imagen, enumerados y explicados con máximo detalle, en lenguaje técnico especializado. Al final indica el grado de envejecimiento que presenta en base a las escalas de Glogau y Fitzpatrick. Justifica y argumenta las respuestas”.
- Salida 3 (IA): “Se observa ritidosis estática profunda con surcos frontales, glabelares y periorbitarios presentes en reposo, reflejo de degradación avanzada de colágeno y elastina. La dermatoheliosis es severa, con elastosis solar, textura cutánea engrosada y pigmentación heterogénea. Existe ptosis facial global por laxitud ligamentosa y descenso de compartimentos grasos, especialmente en tercio medio e inferior. Los surcos nasogenianos están marcadamente acentuados por reabsorción ósea maxilar y lipoatrofia malar. Se evidencia atrofia del tejido subcutáneo con mayor visibilidad de relieves óseos. Hay discromía con lentigos solares indicativos de daño actínico crónico. La región periorbitaria muestra blefarocalasia y bolsas grasas. Los labios presentan atrofia con pérdida de definición del bermellón. Se identifican arrugas periorales finas asociadas a tabaquismo crónico. El cuadro corresponde a Glogau IV por arrugas profundas generalizadas y a Fitzpatrick IVV por alta pigmentación y respuesta solar acumulada.”
Los autores valoramos esta descripción observando la imagen y comprobamos que el nivel de detalle y terminología es congruente y de gran utilidad, pese a pormenores discutibles. Sin embargo, no nos acaba de convencer para nuestro propósito descriptivo. Procedemos a una nueva entrada:
- Entrada 4 (Usuario): “Describe lo mismo de forma más característica comparativamente a como lo hacen otros autores en revistas de dermatología y cirugía plástica, con términos especializados de uso frecuente. Haz la descripción de craneal a caudal, comienza explicando rasgos generales, luego céntrate en laxitud, ptosis, arrugas y pliegues, luego discromías y pigmentaciones. Hazlo en 90 palabras.”
- Salida 4 (IA): “Paciente con facies senil marcada, piel fotoenvejecida y fenotipo cutáneo intermedio. De craneal a caudal, se aprecia laxitud cutánea difusa con pérdida de turgencia y soporte estructural, asociada a ptosis de compartimentos grasos y descolgamiento del tercio medio e inferior. Ritidosis estática severa con surcos frontales, glabelares y periorbitarios profundos; pliegues nasogenianos y líneas de marioneta acentuados por lipoatrofia y reabsorción ósea. En región perioral destacan arrugas radiales finas de patrón tabáquico. Discromía evidente con lentiginosis solar, hiperpigmentación irregular y signos de elastosis actínica avanzada.”
Examinando la imagen comprobamos que tanto la primera descripción como la segunda confirman, en esencia, lo mismo que observan nuestros ojos. Los redactados proporcionan descripciones de elevado nivel técnico que nos resultan muy útiles para nuestra valoración y redacción. Sin embargo, en la segunda respuesta, no nos queda claro qué entiende la IA por “fenotipo cutáneo intermedio”. Consideramos que esta descripción no es correcta, por lo que continuamos con una nueva entrada:
- Entrada 5 (Usuario): “¿A qué te refieres al decir fenotipo cutáneo intermedio?”
- Salida 5 (IA): “Fenotipo cutáneo intermedio se utiliza para describir una piel con características entre fototipos claros y oscuros, generalmente correspondiente a los fototipos IIIIV de la Escala de Fitzpatrick.”
En este caso hemos detectado un error terminológico y de precisión que no consideramos aceptable. No procede hablar de “fenotipo”, sino de “fototipo”. Por otro lado, fototipo intermedio es un término ambiguo que aporta poco; lo correcto sería indicar fototipo IV.
IA generativa en la tabulación de resultados y cálculos estadísticos
La IA facilita la tabulación de datos y puede asistir en su análisis aplicando cálculos estadísticos básicos y avanzados, siempre de forma guiada y supervisada por un médico investigador. Por ejemplo, permite comparar resultados entre tratamientos, calcular medias, detectar tendencias o identificar qué variables influyen en la respuesta clínica.
Las necesidades estadísticas pueden solicitarse mediante lenguaje natural. La formulación de las preguntas (entradas o prompts) y la interpretación de las respuestas (salidas) sólo exige los conocimientos de bioestadística y epidemiología propios de la medicina actual. La IA interacciona informando de aspectos desconocidos por el médico investigador, alcanzando plena autonomía para efectuar cálculos estadísticos complejos asistidos mediante IA.
Por ejemplo, podemos valorar los resultados de un nuevo tipo de hilos tensores faciales en 40 pacientes, comparando las mediciones antes y 3 meses después del tratamiento. La variable principal es el grado de flacidez, medido con una escala de 0 a 10 (donde valores más altos indican mayor flacidez). A partir de una tabla de resultados, se pueden plantear consultas como: “¿Qué prueba estadística es la más adecuada para comparar los valores antes y después del tratamiento?”. En función de la respuesta, según el enfoque e intereses del médico investigador, se pueden formular sucesivas entradas en lenguaje natural, de las que obtendremos salidas que determinarán la elección de un modelo estadístico idóneo.
La IA permite al médico estético trabajar con datos clínicos de forma mucho más fácil y práctica, sin necesidad de programas complejos como SPSS. Con gran facilidad puede introducir datos analizables —por ejemplo, edad del paciente, tipo de tratamiento, número de sesiones, fotografías, escalas de satisfacción o eventos adversos— y la propia IA se encarga de organizarlos automáticamente en tablas claras y estructuradas. Además, como ventaja útil, la IA puede limpiar y ordenar la información (corregir errores, unificar formatos, eliminar duplicados) y, a partir de ahí, realizar análisis estadísticos avanzados con la interacción del médico investigador. Permite calcular medias, desviaciones estándar, medianas, modas, rangos y todo tipo de cálculos estadísticos. Mediante lenguaje natural se pueden solicitar cálculos estadísticos rápidos y pertinentes que pueden detectar diferencias entre grupos, tendencias que se observan en el tiempo, variables que influyen en la respuesta clínica, y muchas cosas más.
Por ejemplo, podemos recopilar datos de 60 pacientes con melasma tratados con peeling químico y despigmentantes tópicos. El médico introduce en la IA una tabla básica con variables como: edad, fototipo, duración del melasma, tipo de tratamiento, número de sesiones, índice MASI inicial y final, y grado de satisfacción del paciente. La IA transforma automáticamente estos datos en una tabla estructurada, calcula variables derivadas (como la reducción porcentual del MASI) y agrupa a los pacientes por categorías relevantes (por ejemplo, fototipo o número de sesiones). Posteriormente, el médico investigador puede solicitar: “comparar la mejoría media según número de sesiones” o “analizar si el fototipo influye en la respuesta”. La herramienta genera resultados como: una reducción media del MASI del 45%, mayor respuesta en pacientes con ≤ 3 años de evolución y mejoría estadísticamente superior en protocolos de ≥ 4 sesiones. Además, presenta gráficos simples y tablas resumidas listas para su interpretación. Este enfoque permite al médico obtener conclusiones clínicamente útiles sin necesidad de manejar software estadístico específico, facilitando enormemente la investigación a nivel práctico.
Los errores de la IA en los cálculos estadísticos suelen depender de mala interpretación de los datos, por lo que siempre hay que hacer comprobaciones. En nuestra experiencia observamos que en estadísticas no paramétricas obtenemos resultados concordantes con SPSS, aunque algunas veces la IA no reconoce bien los datos. En la mayoría de los casos, la IA genera resultados estadísticos válidos y coherentes. No obstante, muchas veces no son datos perfectos o exactos, se constatan errores de interpretación, aplicación inapropiada de modelos y falta de reproducibilidad. Por ello, las publicaciones científicas exigen el uso de software estadístico validado, como SPSS, que asegura precisión, control analítico y replicabilidad de los resultados. En cambio, muchos revisores emplean IA para detectar modelos de cálculo inadecuados, o errores estadísticos, con resultados muy eficientes.
Uso de IA generativa para revisores de publicaciones médicas
El uso de IA por parte de los revisores, durante el proceso de revisión por pares, genera un interés creciente dada su capacidad para optimizar la calidad, consistencia y eficiencia de la revisión científica. En las revistas internacionales, donde el volumen de manuscritos es elevado y el tiempo de revisión limitado, la IA se posiciona como una herramienta de apoyo que permite mejorar la detección de errores metodológicos, inconsistencias en los datos y debilidades en el análisis estadístico.
La IA es un potente asistente en la evaluación de un artículo. Puede analizar casi al instante o en pocos segundos, manuscritos complejos y extensos, identificando incoherencias entre resultados y conclusiones, evaluando la claridad en la presentación de datos, o sugiriendo mejoras en la redacción científica. Además, facilita la revisión de tablas, datos y resultados estadísticos, ayudando a verificar si los análisis realizados son coherentes, sin necesidad de recurrir a software adicional. La IA ayuda a normalizar el proceso de revisión. Puede actuar como un apoyo para estructurar informes más homogéneos, reduciendo la variabilidad entre revisores y mejorando la transparencia del proceso editorial. Además, permite ahorrar tiempo en tareas repetitivas, lo que facilita que el revisor concentre su esfuerzo en el juicio crítico y la relevancia clínica del trabajo.
Hace pocas semanas, una revista norteamericana nos solicitó revisar un manuscrito, sobre un tratamiento combinado para la ptosis braquial (radiofrecuencia + bioestimuladores), valorando la eficacia y seguridad del tratamiento en 30 pacientes respecto a la monoterapia, evaluando varios subgrupos. En un primer paso procesamos el artículo mediante IA, identificando numerosos déficits, que en cierta medida podrían ser subsanables: (1) falta de definición clara de criterios de inclusión/exclusión; (2) tamaño muestral no justificado; (3) ausencia de cálculo de potencia estadística; (4) descripción incompleta del protocolo de radiofrecuencia (parámetros técnicos); (5) uso inconsistente de escalas clínicas para evaluar la flacidez; (6) errores menores en la tabulación de datos (valores duplicados o incongruentes); (7) ausencia de seguimiento a largo plazo; (8) redacción ambigua en la sección de resultados; y (9) discordancia leve entre tablas y texto narrativo. Todos estos puntos eran potencialmente corregibles o revisables, y aisladamente se podrían justificar.
Al leer el texto comprobamos la veracidad de todos los déficits señalados por la IA. Sin embargo, la IA detecta un décimo déficit crítico, que lo señala como alerta: una incongruencia significativa entre los datos presentados y las conclusiones. Aunque los resultados muestran una mejoría leve y no estadísticamente significativa en varios subgrupos, el manuscrito concluye que el tratamiento es “altamente eficaz y muy superior a la monoterapia”. Esta sobreinterpretación, identificada por la IA al cruzar automáticamente resultados estadísticos y texto, constituye un motivo de rechazo directo, comprometiendo la coherencia del estudio y las valoraciones de los autores. Este ejemplo ilustra cómo la IA ayuda a identificar inconsistencias no esperadas, que requieren consideración especial.
El revisor es quien asume la responsabilidad de recomendar la aceptación o el rechazo del manuscrito. Se necesita el criterio experto humano para garantizar la validez científica y la integridad del proceso de revisión, valorando si el artículo es aceptable de modo directo, si precisa cambios menores, si precisa cambios mayores, o si merece rechazo. La IA puede informar al revisor, y la ayuda es enorme, pero no está preparada para sustituirlo.
Discusión
La calidad del contenido generado con asistencia de la IA depende en gran medida de la información con la que estos sistemas han sido entrenados. Los denominados datos de entrenamiento —procedentes de grandes volúmenes de textos, imágenes y otros formatos de datos— condicionan directamente la calidad de las respuestas. Cuando estos datos son amplios, diversos y rigurosos, los resultados tienden a ser más precisos y equilibrados; en cambio, si contienen sesgos o errores, estos pueden reproducirse en los textos generados. En la práctica, el usuario entrenado y experto identifica muchos de estos sesgos durante la interacción y puede mitigarlos mediante la reformulación de las instrucciones, por ejemplo, solicitando perspectivas múltiples, justificaciones explícitas o limitando generalizaciones1,3,4.
En este contexto, la dependencia del prompt supone uno de los factores más importantes en la calidad de las salidas generadas por la IA, especialmente en el ámbito científico. La precisión, profundidad y coherencia de las respuestas dependen directamente de cómo se formula la instrucción inicial. Un prompt impreciso o sesgado puede generar respuestas incompletas o acríticas, mientras que su reformulación progresiva, mediante preguntas complementarias o ajustes de contexto, permite mejorar sustancialmente la calidad del resultado. De este modo, el usuario adopta un papel activo, guiando el proceso de generación del contenido hacia objetivos concretos y clínicamente relevantes.
Este proceso se sustenta en un modelo de interacción iterativa y dinámica. El uso eficaz de la IA implica un ciclo continuo de prueba, evaluación y ajuste, en el que cada respuesta obtenida aporta información útil para optimizar la siguiente5. Desde un punto de vista operativo, este mecanismo actúa como una forma de calibración progresiva: permite detectar ambigüedades, corregir errores y reducir la incertidumbre en cada iteración. En términos prácticos, constituye una optimización guiada en la que el usuario incorpora criterios explícitos —como la necesidad de fuentes, estructura lógica o requisitos de evidencia— que facilitan la generación de contenidos más verificables y metodológicamente sólidos.
El aprendizaje basado en ensayo y error es, por tanto, un elemento clave para maximizar el rendimiento de estos sistemas. Dado que los modelos generativos no “comprenden” en sentido humano, sino que predicen secuencias lingüísticas basadas en patrones estadísticos, la calidad del resultado depende fundamentalmente de la calidad de la interacción6,7. La experiencia del usuario permite afinar progresivamente las instrucciones, mejorando la coherencia, precisión y utilidad clínica de las respuestas obtenidas.
El uso de herramientas como ChatGPT puede interpretarse como una forma de cognición amplificada, donde la inteligencia humana orienta, contextualiza y valida la salida generada por la IA. El papel del autor trasciende la mera redacción y se centra en la formulación estratégica de preguntas, la evaluación crítica de las respuestas y su verificación sistemática frente a la evidencia científica disponible. En consecuencia, la calidad final del manuscrito depende tanto del rendimiento del modelo como de la capacidad del investigador para interactuar con él de forma experta y reflexiva8,11.
Esta interacción se fortalece con la experiencia. Mientras la IA aporta velocidad y capacidad de síntesis, el investigador contribuye con conocimiento clínico, razonamiento y validación fundamentada13. Lejos de sustituir los principios tradicionales de autoría científica, este enfoque los refuerza, situando la responsabilidad en una supervisión intelectual activa. El conocimiento experto sigue siendo esencial para prevenir sesgos, evitar la incorporación de información no verificada y contrarrestar la falsa sensación de autoridad. En última instancia, el valor real de la IA en la producción científica depende del criterio, la experiencia y la responsabilidad del investigador que la utiliza.
El desarrollo previsible, implícito al uso de IA generativa en medicina, supone una oportunidad decisiva para que la medicina estética se consolide como especialidad médica plenamente reconocida a todos los efectos. Para ello, se necesita potenciar a nivel internacional una producción bibliográfica autóctona y propia de la especialidad, específica en contenidos, que disponga de publicaciones específicas de impacto en medicina estética, académicamente rigurosas, metodológicamente sólidas, estratégicamente visibles y abundantes en número16,17. La creación de revistas de medicina estética con factor de impacto evitaría tener que publicar en revistas de otras especialidades afines, como la dermatología, o la cirugía plástica, que ya cuentan con amplia producción histórica. Son los médicos estéticos, y las sociedades que los representan, los involucrados en este objetivo.
Más allá de optimizar la eficiencia en la redacción, la IA permite evaluar con mayor rigor los resultados de los tratamientos estéticos, transformando los datos asistenciales en conocimiento clínico estructurado, trazable y potencialmente publicable. Para el médico estético, esto se traduce en ventajas tangibles: mejora del análisis crítico de resultados, fortalecimiento de la calidad metodológica y mayor probabilidad de publicación en revistas de alto impacto, con el consiguiente posicionamiento científico y profesional. Este avance individual constituye, simultáneamente, el fundamento del desarrollo colectivo de la medicina estética como especialidad, al generar evidencia propia, consistente y acumulativa que permite definir estándares, validar procedimientos y optimizar la seguridad del paciente. Apostar por la generación y difusión de publicaciones de calidad no solo beneficia al médico estético, sino que resulta esencial para consolidar el reconocimiento, la legitimidad y la credibilidad científica de la medicina estética como especialidad médica emergente.
Este es el momento de aprovechar la ocasión, y el instante para proclamar las potencialidades de un recurso de incalculable potencial transformador. La IA generativa ha experimentado mejoras sustanciales que han reducido significativamente las alucinaciones y los sesgos, con la integración de bases de datos biomédicas verificadas, el ajuste fino con supervisión experta y la adición de mecanismos de validación automática del contenido. Estas innovaciones continuarán aumentando la precisión y la coherencia de las respuestas, especialmente en el terreno científico y médico, más favorecido por mayores inversiones.
Conclusiones
La IA nunca será una herramienta perfecta, por su propia naturaleza probabilística y por la influencia inherente de los datos de entrenamiento. Por ello, la necesidad de validación humana no podrá desaparecer. Quizá suceda cuando la IA generativa se transforme en otra cosa diferente, con capacidades superiores generadas de otro modo. Lo más importante que transmitimos aquí, es que no hace falta esperar el futuro. Las mejoras ya alcanzadas por la IA generativa en nuestro ámbito la consolidan como una herramienta de apoyo muy potente, extraordinariamente eficiente y suficientemente fiable. La integración responsable de la IA amplificará el criterio clínico del médico estético y favorecerá el desarrollo de una medicina estética más precisa, más evaluable, más reproducible, más defendible y más difusible.
Agradecimientos
Agradecemos al Sr. Lluís Melgar Fernández, profesor de informática del Instituto Nicolau Copèrnic, su ayuda en hacernos comprender las diferencias entre nuestro lenguaje y el lenguaje con el que responde la IA.
Bibliografía
- Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019 Jan;25(1):44‑56. https://doi.org/10.1038/s41591-018‑0300‑7
- Nazer LH, Zatarah R, Waldrip S, Ke JXC, Moukheiber M, Khanna AK, Hicklen RS, Moukheiber L, Moukheiber D, Ma H, Mathur P. Bias in artificial intelligence algorithms and recommendations for mitigation. PLOS Digit Health. 2023 Jun 22;2(6):e0000278. https://doi.org/10.1371/journal.pdig.0000278
- Burger T. Keeping generative artificial intelligence reliable in omics biology. Patterns (N Y). 2026 Jan 9;7(1):101417. https://doi.org/10.1016/j.patter.2025.101417
- Cabello JB, Ruiz Garcia V, Torralba M, Maldonado Fernandez M, Ubeda M, Ansuategui E, Ramos-Ruperto L, Emparanza JI, Urreta I, Iglesias MT, Pijoan JI, Burls A. Critical Appraisal Tools for Evaluating Artificial Intelligence in Clinical Studies: Scoping Review. J Med Internet Res. 2025 Dec 8;27:e77110. https://doi.org/10.2196/77110
- Zielinski C, Winker MA, Aggarwal R, Ferris LE, Heinemann M, Lapeña JF Jr, Pai SA, Ing E, Citrome L, Alam M, Voight M, Habibzadeh F. Chatbots, generative AI, and scholarly manuscripts: WAME recommendations on chatbots and generative artificial intelligence in relation to scholarly publications. Colomb Med (Cali). 2023 Sep 30;54(3):e1015868. https://doi.org/10.25100/cm.v54i3.5868
- Alkaissi H, McFarlane SI. Artificial Hallucinations in ChatGPT: Implications in Scientific Writing. Cureus. 2023 Feb 19;15(2):e35179. https://doi.org/10.7759/cureus.35179
- Ji Z, Lee N, Frieske R, Yu T, Su D, Xu Y, et al. Survey of Hallucination in Natural Language Generation. ACM Comput Surv. 2023;55(12):248‑286. https://doi.org/10.1145/3571730
- Goktas P, Grzybowski A. Assessing the Impact of ChatGPT in Dermatology: A Comprehensive Rapid Review. J Clin Med. 2024 Oct 3;13(19):5909. https://doi.org/10.3390/jcm13195909
- Salvagno M, Taccone FS, Gerli AG. Can artificial intelligence help for scientific writing? Crit Care. 2023 Feb 25;27(1):75. https://doi.org/10.1186/s13054-023‑04380‑2
- Li J, Dada A, Puladi B, Kleesiek J, Egger J. ChatGPT in healthcare: A taxonomy and systematic review. Comput Methods Programs Biomed. 2024 Mar;245:108013. https://doi.org/10.1016/j.cmpb.2024.108013
- van Dis EAM, Bollen J, Zuidema W, van Rooij R, Bockting CL. ChatGPT: five priorities for research. Nature. 2023 Feb;614(7947):224‑226. https://doi.org/10.1038/d41586-023‑00288‑7
- Schopow N, Osterhoff G, Baur D. Applications of the Natural Language Processing Tool ChatGPT in Clinical Practice: Comparative Study and Augmented Systematic Review. JMIR Med Inform. 2023 Nov 28;11:e48933. https://doi.org/10.2196/48933
- Gao CA, Howard FM, Markov NS, Dyer EC, Ramesh S, Luo Y, Pearson AT. Comparing scientific abstracts generated by ChatGPT to real abstracts with detectors and blinded human reviewers. NPJ Digit Med. 2023 Apr 26;6(1):75. https://doi.org/10.1038/s41746-023‑00819‑6
- Else H. Abstracts written by ChatGPT fool scientists. Nature. 2023 Jan;613(7944):423. https://doi.org/10.1038/d41586-023‑00056‑7
- Saqaabi AA, Stewart C, Akrida E, Cristea AI. A Deep Learning Approach for Paragraph-Level Paraphrase Generation for Plagiarism Detection. Neural Process Lett. 2025;57, 59. https://doi.org/10.1007/s11063-025‑11771‑9
- Committee on Publication Ethics (COPE). https://publicationethics.org/guidance/guideline/principles-transparency-and-best-practice-scholarly-publishing
- International Committee of Medical Journal Editors (ICMJE). Recommendations for the Conduct, Reporting, Editing and Publication of Scholarly Work in Medical Journals. January 2026. https://www.icmje.org/recommendations


