El uso de la inteligencia artificial generativa en publicaciones científicas requiere declaración obligatoria
La inteligencia artificial regenerativa (IAG) está basada en transformers y modelos de lenguaje a gran escala, facilitando la elaboración de artículos científicos. El empleo de estos sistemas avanzados es lícito siempre que se declare su utilización. Se aconseja que las instrucciones sean precisas y requiere verificación exhaustiva por parte de los autores de cualquier contenido de salida generado. Las alucinaciones siguen produciéndose en los sistemas más avanzados, de ahí deriva la necesidad de disponer de datos primarios ante su posible requerimiento. El uso racional de IAG supone una importante ventaja, lo que exige responsabilidad científica y trazabilidad del conocimiento. Su empleo no invalida el trabajo, sino que puede incrementar su valor científico si su utilización se basa en principios éticos rigurosos.
Regenerative artificial intelligence (RAI) is based on transformers and large language models, facilitating the development of scientific articles. The use of these advanced systems is legitimate provided that their use is declared. It is recommended that prompts be precise, and exhaustive verification by authors of any generated output content is required. Hallucinations continue to occur even in the most advanced systems; hence the need to have access to primary data in case it is requested. The rational use of RAI represents a significant advantage, which requires scientific responsibility and traceability of knowledge. Its use does not invalidate the work; rather, it may enhance its scientific value when its application is grounded in rigorous ethical principles.
El desarrollo de arquitecturas basadas en transformers ha supuesto un cambio determinante en el procesamiento del lenguaje natural y en la generación automatizada de textos científicos1. Los transformers son un tipo de modelo de aprendizaje profundo (deep learning), que emplea “mecanismos de atención” para analizar simultáneamente las relaciones entre todas las palabras de un texto, permitiendo capturar el contexto de forma más eficiente que las arquitecturas secuenciales previamente empleadas. La capacidad de configurar dependencias complejas en grandes volúmenes de datos ha posibilitado modelos de lenguaje de gran escala (Large Language Model, LLM), como los sistemas de inteligencia artificial generativa (IAG), con capacidades avanzadas en tareas de redacción, síntesis, traducción y generación rápida de textos complejos2‑4.

El uso de IAG avanza a un ritmo trepidante en la producción de artículos científicos en sentido amplio: originales, revisiones, síntesis de evidencia, generación de imágenes y gráficos o valoraciones estadísticas, entre otras (Figura 1). Sin embargo, su naturaleza probabilística implica que estos sistemas no operan sobre mecanismos de verificación de contenidos, sino sobre patrones estadísticos de lenguaje que pueden generar textos incorrectos, inexactos o falsos5‑8. El resultado es un contenido no verificable de grave riesgo para el futuro desarrollo de la ciencia médica, en un contexto de sobreproducción de artículos complicados de gestionar por parte de editores y revisores7,8.
En ausencia de instrucciones claras en los prompts, los sistemas de inteligencia artificial (IA) tienden a generar contenidos de calidad variable, con errores tanto en el texto como en las referencias bibliográficas. En cambio, cuando las indicaciones son precisas y están bien estructuradas, la calidad de la salida mejora de forma significativa. Este aspecto resulta crítico en cuanto a posibles referencias inventadas o incorrectas, que constituyen un indicador suficientemente potente para rechazar el trabajo remitido por falta de fiabilidad9. Incluso los modelos de IA más avanzados —ChatGPT 5.5 (OpenAI), Claude 4.7 (Anthropic), Gemini 3.1 (Google), Grok 4.1 (xAI) o Perplexity AI— sucumben al fenómeno conocido como “alucinaciones”, es decir, la generación de información plausible pero incorrecta o no verificable10,11. Por este motivo, la supervisión y verificación humana es actualmente imprescindible en la elaboración y evaluación de los textos generados. Organismos internacionales como el Committee on Publication Ethics y el International Committee of Medical Journal Editors insisten en la necesidad de establecer políticas editoriales claras sobre el uso de la IA, así como de reforzar la responsabilidad de los autores en relación con la veracidad y la integridad del contenido publicado12‑14.
Cabe reiterar que la IAG puede producir conjuntos de datos simulados presentados con distribución estadística coherente; por ello, los textos generados deben verificarse a partir de fuentes primarias obligatoriamente9‑11. La finalidad es detectar contenidos falsos y citas inexistentes, de apariencia plenamente plausible, y de gran verosimilitud, que no reflejan el conocimiento de la realidad. Los falsos textos son comparables a manuscritos humanos bien elaborados, de difícil detección tanto para los revisores como para las herramientas habitualmente empleadas en la detección de plagio semántico15‑17. Se ha llegado a plantear un “deber ético” considerar la IAG utilizada como un coautor más del manuscrito remitido, algo que la comunidad científica rechaza mayoritariamente: no obstante, se debe declarar la participación de IAG cuando ha sido empleada como ayuda en tareas de docencia o publicación de contenidos18,19.
La influencia de la IAG en las publicaciones científicas se manifiesta a varios niveles interrelacionados: en el plano epistemológico, puede socavar los fundamentos, métodos y la validez del conocimiento científico20; en el metodológico, compromete la fiabilidad de revisiones sistemáticas y metaanálisis al introducir datos potencialmente contaminados o no verificables21; en el ámbito clínico puede favorecer la incorporación de evidencias no validadas, con el consiguiente riesgo de decisiones terapéuticas inadecuadas22; y en el plano editorial, incrementa la carga de trabajo y la complejidad del proceso de revisión por pares16. La magnitud de estos riesgos ha motivado que diferentes organizaciones internacionales emitan recomendaciones específicas para regular el uso de la IA en la investigación y en la publicación científica12‑14.
El origen de las alucinaciones parece relacionarse con limitaciones en la optimización de la coherencia lingüística, más evidentes en los modelos iniciales, pero persistentes en sistemas de última generación, lo que limita claramente la fiabilidad en contextos científicos4,10,11,17,18. La IAG puede amplificar sesgos preexistentes en los datos empleados en procesos de entrenamiento inicial, con la consiguiente reproducción y potencial intensificación de errores sistemáticos, heredados de la literatura científica previa o generados posteriormente23.
Los esfuerzos destinados a detectar el plagio continúan siendo poco eficaces, por el avance del parafraseo automatizado que logra evadir los algoritmos tradicionales basados en coincidencias exactas24. Ahora surgen nuevas alternativas como el watermarking digital, orientado a la protección de derechos de autor y al rastreo de contenido, así como enfoques basados en patrones estadísticos que muestran un alto potencial, aunque todavía carecen de la madurez operativa necesaria en entornos editoriales25‑28.
Paralelamente, la IAG se distingue de herramientas previas de asistencia a la escritura por su capacidad de generar textos completos con apariencia de rigor académico sin acceso a datos empíricos29, lo que introduce una distorsión epistemológica al desvincular la forma textual de su base empírica20,21. En consecuencia, los sistemas tradicionales de revisión, fundamentados en la coherencia narrativa y la integridad metodológica, resultan insuficientes para detectar contenidos sintéticos avanzados22, hasta el punto de que incluso revisores expertos pueden no distinguir entre contenido de origen humano y generado por IAG13,15. Todo ello refuerza la necesidad de implementar mecanismos de verificación sustentados, como se ha mencionado, en el acceso a datos primarios que los autores deben poner a disposición de los revisores.
Pendientes de nuevos avances, los sistemas de IA en biomedicina siguen generando textos con abundantes sesgos inaceptables debidos a datos incompletos, muestras no representativas y el uso de variables no relevantes ni ajustadas por factores. Para mitigar estos sesgos se plantean dos grupos de soluciones: métodos distribucionales, que modifican los datos (aumentándolos, perturbándolos o reequilibrándolos), y métodos algorítmicos, que actúan sobre el modelo mediante técnicas como aprendizaje adversarial o enfoques causales. Cada estrategia ofrece beneficios y limitaciones, siendo necesaria la combinación de enfoques para mejorar la equidad, fiabilidad y aplicabilidad clínica de la IA29.
En este momento, el uso racional y ético de la IAG supone una importante ventaja selectiva sobre los que no la usan. En nuestra opinión, el uso de la IAG en la investigación médica y en la comunicación de la investigación médica ya no tiene marcha atrás. Quienes tenemos años de experiencia en autoría y revisión de publicaciones, estamos presenciando un cambio transicional en el modo de buscar y manipular textos médicos con el objetivo de obtener un producto de máximo nivel académico, con un fondo basado en el más riguroso método científico y una expresión en lenguaje técnico depurado y apropiado a cada especialidad médica.
Para competir con el resto de autores es necesario aprovechar las ventajas que ofrece el uso de la IAG al mejorar la calidad científica y expositiva de las publicaciones. En el caso de las revistas de alto impacto, no utilizar IAG supone una clara desventaja respecto a quienes la emplean. En base a nuestra información, no existen publicaciones específicas para médicos estéticos que aporten información clara y útil capaz de facilitar una producción bibliográfica de calidad asistida mediante IAG. Por ello, junto a este editorial, presentamos un artículo de revisión de autores destacando las oportunidades que nos ofrece la IAG a nivel práctico, y reconociendo las limitaciones, para la elaboración de artículos científicos en el ámbito especializado de la medicina estética.
Finalmente, el conflicto que plantea la IA generativa en términos de autoría, responsabilidad científica y trazabilidad del conocimiento, hace que las revistas científicas incluyan en sus normas de publicación la obligatoriedad de declarar que el manuscrito se ha elaborado empleando herramientas de IA18,27. Ello no solo no invalida el trabajo, sino que puede incrementar su valor científico cuando se hace un buen uso basado en principios éticos rigurosos30. Por este motivo, el Comité Editorial de la revista “Medicina Estética” de la SEME establece, en su nueva normativa, la obligatoriedad de declarar el uso o no uso de IAG en la elaboración de los artículos remitidos para revisión y posible publicación.
Bibliografía
- Zong H, Wu R, Cha J, Wang J, Wu E, Li J, Zhou Y, Zhang C, Feng W, Shen B. Large Language Models in Worldwide Medical Exams: Platform Development and Comprehensive Analysis. J Med Internet Res. 2024 Dec 27;26:e66114. https://doi.org/10.2196/66114
- Bommasani R, Klyman K, Longpre S, Xiong B, Kapoor S, Maslej N, Narayanan A, Liang P. Foundation Model Transparency Reports. 2024, Oct 16;7(1):181‑95. https://doi.org/10.1609/aies.v7i1.31628
- van Dis EAM, Bollen J, Zuidema W, van Rooij R, Bockting CL. ChatGPT: five priorities for research. Nature. 2023 Feb;614(7947):224‑226. https://doi.org/10.1038/d41586-023‑00288‑7
- Dergaa I, Saad HB, El Omri A, Glenn JM, Clark CCT, Washif JA, et al. Using artificial intelligence for exercise prescription in personalised health promotion: A critical evaluation of OpenAI's GPT‑4 model. Biol Sport. 2024 Mar;41(2):221‑241. https://doi.org/10.5114/biolsport.2024.133661
- Goktas P, Grzybowski A. Assessing the Impact of ChatGPT in Dermatology: A Comprehensive Rapid Review. J Clin Med. 2024 Oct 3;13(19):5909. https://doi.org/10.3390/jcm13195909
- Salvagno M, Taccone FS, Gerli AG. Can artificial intelligence help for scientific writing? Crit Care. 2023 Feb 25;27(1):75. https://doi.org/10.1186/s13054-023‑04380‑2
- Li J, Dada A, Puladi B, Kleesiek J, Egger J. ChatGPT in healthcare: A taxonomy and systematic review. Comput Methods Programs Biomed. 2024 Mar;245:108013. https://doi.org/10.1016/j.cmpb.2024.108013
- Kung TH, Cheatham M, Medenilla A, Sillos C, De Leon L, Elepaño C, et al. Performance of ChatGPT on USMLE: Potential for AI‑assisted medical education using large language models. PLOS Digit Health. 2023 Feb 9;2(2):e0000198. https://doi.org/10.1371/journal.pdig.0000198
- Schopow N, Osterhoff G, Baur D. Applications of the Natural Language Processing Tool ChatGPT in Clinical Practice: Comparative Study and Augmented Systematic Review. JMIR Med Inform. 2023 Nov 28;11:e48933. https://doi.org/10.2196/48933
- Alkaissi H, McFarlane SI. Artificial Hallucinations in ChatGPT: Implications in Scientific Writing. Cureus. 2023 Feb 19;15(2):e35179. https://doi.org/10.7759/cureus.35179
- Ji Z, Lee N, Frieske R, Yu T, Su D, Xu Y, et al. Survey of Hallucination in Natural Language Generation. ACM Comput Surv. 2023;55(12):248‑286. https://doi.org/10.1145/3571730
- Committee on Publication Ethics (COPE). https://publicationethics.org/guidance/guideline/principles-transparency-and-best-practice-scholarly-publishing
- International Committee of Medical Journal Editors (ICMJE). Recommendations for the Conduct, Reporting, Editing and Publication of Scholarly Work in Medical Journals. January 2026. https://www.icmje.org/recommendations
- UNESCO. Artificial Intelligence and emerging technologies. https://www.unesco.org/en/artificial-intelligence
- Else H. Abstracts written by ChatGPT fool scientists. Nature. 2023 Jan;613(7944):423. https://doi.org/10.1038/d41586-023‑00056‑7
- Gao CA, Howard FM, Markov NS, Dyer EC, Ramesh S, Luo Y, Pearson AT. Comparing scientific abstracts generated by ChatGPT to real abstracts with detectors and blinded human reviewers. NPJ Digit Med. 2023 Apr 26;6(1):75. https://doi.org/10.1038/s41746-023‑00819‑6
- Walters WH, Wilder EI. Fabrication and errors in the bibliographic citations generated by ChatGPT. Sci Rep. 2023 Sep 7;13(1):14045. https://doi.org/10.1038/s41598-023‑41032‑5
- Stokel-Walker C. ChatGPT listed as author on research papers: many scientists disapprove. Nature. 2023 Jan;613(7945):620‑621. https://doi.org/10.1038/d41586-023‑00107‑z
- Thorp HH. ChatGPT is fun, but not an author. Science. 2023 Jan 27;379(6630):313. https://doi.org/10.1126/science.adg7879
- Peters U, Chin-Yee B. Generalization bias in large language model summarization of scientific research. R Soc Open Sci. 2025 Apr 30;12(4):241776. https://doi.org/10.1098/rsos.241776
- Blaizot A, Veettil SK, Saidoung P, Moreno-Garcia CF, Wiratunga N, Aceves-Martins M, Lai NM, Chaiyakunapruk N. Using artificial intelligence methods for systematic review in health sciences: A systematic review. Res Synth Methods. 2022 May;13(3):353‑362. https://doi.org/10.1002/jrsm.1553
- Li ZQ, Xu HL, Cao HJ, Liu ZL, Fei YT, Liu JP. Use of Artificial Intelligence in Peer Review Among Top 100 Medical Journals. JAMA Netw Open. 2024 Dec 2;7(12):e2448609. https://doi.org/10.1001/jamanetworkopen.2024.48609
- Naik N, Hameed BMZ, Shetty DK, Swain D, Shah M, Paul R, et al. Legal and Ethical Consideration in Artificial Intelligence in Healthcare: Who Takes Responsibility? Front Surg. 2022 Mar 14;9:862322. https://doi.org/10.3389/fsurg.2022.862322
- Santos D, Barreiro A. Paraphrase and translation: the importance of being close. Open Res Eur. 2025 Feb 18;5:52. https://doi.org/10.12688/openreseurope.19108.1
- Dathathri S, See A, Ghaisas S, Huang PS, McAdam R, Welbl J, et al. Scalable watermarking for identifying large language model outputs. Nature. 2024 Oct;634(8035):818‑823. https://doi.org/10.1038/s41586-024‑08025‑4
- Saqaabi AA, Stewart C, Akrida E, Cristea AI. A Deep Learning Approach for Paragraph-Level Paraphrase Generation for Plagiarism Detection. Neural Process Lett. 2025;57, 59. https://doi.org/10.1007/s11063-025‑11771‑9
- Wang C, Fang Y, Wang R. Advancing integrity in science: the imperative for AI‑driven plagiarism detection in scientific writing. Int J Surg. 2024 Jul 1;110(7):4488‑4489. https://doi.org/10.1097/JS9.0000000000001412
- Zielinski C, Winker MA, Aggarwal R, Ferris LE, Heinemann M, Lapeña JF Jr, et al. Chatbots, generative AI, and scholarly manuscripts: WAME recommendations on chatbots and generative artificial intelligence in relation to scholarly publications. Colomb Med (Cali). 2023 Sep 30;54(3):e1015868. https://doi.org/10.25100/cm.v54i3.5868
- Yang Y, Lin M, Zhao H, Peng Y, Huang F, Lu Z. A survey of recent methods for addressing AI fairness and bias in biomedicine. J Biomed Inform. 2024 Jun;154:104646. https://doi.org/10.1016/j.jbi.2024.104646
- Alcolea López JM. La inteligencia artificial en medicina estética. Actualidad y perspectivas. Medicina Estética. 2024;80(3):7‑10. https://doi.org/10.48158/MedicinaEstetica.080.E
- Grupo de trabajo de Inteligencia Artificial Generativa de la UNAM. Recomendaciones para el uso de Inteligencia Artificial Generativa en la docencia. Universidad Nacional Autónoma de México. Octubre 2003. https://iagen.unam.mx/recomendaciones.php


