Vibe citing
Los investigadores de IA ya tienen nombre para lo que pasa cuando usas un modelo para generar citas que suenan bien pero no existen.
Kara Swisher leyó una cita suya en un libro recién publicado y sorprendida tuvo que aclarar que nunca había dicho eso. La frase que le atribuían aparecía en The Future of Truth, el ensayo de Steven Rosenbaum sobre cómo la inteligencia artificial está erosionando la verdad. La neurocientífica Lisa Feldman Barrett se encontró en la misma situación. El libro le adjudicaba una reflexión sobre emociones y verdad que ella jamás había escrito. Barrett fue más allá y respondió al artículo de New York Times que las citas “no aparecen en mi libro y además son incorrectas”, dijo, y añadió que son afirmaciones que ella “nunca diría”. El autor del libro en cuestión, Rosenbaum, admitió haber usado ChatGPT y Claude durante la investigación, la escritura y la edición de un libro que, precisamente, advertía de los riesgos de confiar en estas herramientas. Irónico pero cierto. Sabéis aquello de “dime de qué presumes y te diré de lo que careces”, pues eso.
Y es que el caso Rosenbaum no es la anécdota de un divulgador poco concienzudo. Es el síntoma más visible de algo que está pasando a una escala que debería preocuparnos. En Estados Unidos se publicaron cerca de 4 millones de libros en 2025, un 32% más que el año anterior. De esos 4 millones, al menos 3 millones fueron autopublicados. Nadie sabe cuántos los escribió una IA, entre otras cosas porque los detectores no son fiables. Lo que sí sabemos es que los ISBNs de ficción autopublicada saltaron de 306.000 a 477.000 títulos en un solo año, según datos de Bowker. Kobo, una de las mayores plataformas de autopublicación, rechazó cerca del 45% de los manuscritos recibidos en 2025, y alrededor del 80% de esos rechazos fueron por sospechar que el contenido era total o mayoritariamente generado con IA. Algo que, según la propia Kobo, apenas habría sido un factor en años anteriores. El mercado editorial se ha convertido en una fábrica de volumen donde la velocidad de producción importa más que la verificación de lo producido. Y los distribuidores, según Publishers Lunch, no tienen herramientas efectivas para detectar el problema.
Lo mismo está pasando en los premios literarios. La semana pasada, The Guardian y Wired explicaban que el cuento ganador del Commonwealth Short Story Prize está bajo sospecha de haber sido escrito con IA. La obra, The Serpent in the Grove de Jamir Nazir, obtuvo una puntuación del 100% como contenido generado por IA en el detector Pangram. El dato que convierte esto en algo más que un escándalo puntual está en la respuesta oficial de la propia Commonwealth Foundation. La organización no usa detectores de IA en su proceso de selección porque someter obras inéditas a esas herramientas “plantea preocupaciones significativas en torno al consentimiento y la propiedad artística”. Es decir, la institución que otorga el premio se encuentra atrapada en un bucle que de momento no sabe resolver.
Si esto solo afectara a divulgadores con prisas y a premios literarios con procesos anticuados, sería un problema menor. El caso es que la misma dinámica está operando en el corazón de la investigación académica sobre inteligencia artificial. Un análisis de 2,5 millones de artículos científicos y 111 millones de referencias identificó más de 140.000 citas falsas generadas por IA solo en 2025, según Nature. Un estudio de GPTZero sobre los 4.841 artículos aceptados en NeurIPS 2025, la conferencia de IA más prestigiosa del mundo con revisión por pares de tres a cinco expertos por artículo, encontró más de 100 citas alucinadas en 51 de esos papers. Los investigadores acuñaron un término que lo resume todo.
“Vibe citing”. Usar IA para generar referencias que tienen el ambiente correcto sin que existan.
Los propios investigadores que desarrollan los modelos publican artículos con citas inventadas por esos mismos modelos. La serpiente mordiéndose la cola a una velocidad que ningún comité de revisión puede seguir.
Eso conecta todos estos casos. No estamos ante fallos individuales de personas irresponsables. Estamos ante un problema estructural donde los incentivos empujan a producir más rápido de lo que se puede verificar. El mercado editorial necesita libros sobre IA antes de que el ciclo de atención pase a otra cosa. Los premios necesitan seleccionar obras sin poder examinarlas. Las conferencias académicas necesitan revisar miles de artículos con comités desbordados.
El giro que nadie quiere asumir es que los modelos mejoran... pero no lo suficiente. Los benchmarks de 2026 muestran que GPT-5.5 y Claude Opus 4.7 han reducido las tasas generales de alucinación hasta el rango del 3 al 10%. Pero en tareas de citación (precisamente lo que Rosenbaum necesitaba que funcionara bien) la tasa media sigue en el 12,4% incluso con las configuraciones más avanzadas activadas, según un estudio independiente de mayo de 2026. O sea, que de cada ocho citas que le pidas a un modelo de última generación, una puede ser inventada. Y no inventada de forma obvia, sino con autores que suenan reales, títulos que encajan y DOIs que no llevan a ningún sitio.
No sé si Rosenbaum fue negligente, seguramente se confió demasiado. Preguntaros cuántos libros, artículos e informes que damos por buenos están construidos sobre citas que nunca existieron y argumentos que suenan convincentes porque el algoritmo es muy bueno sonando convincente. Si hasta ahora teníamos un problema de desinformación y personas tragando con burdas capturas de pantalla manipuladas, no os quiero ni contar lo que supone todo esto. La velocidad de producción ya ha superado la capacidad de verificación. Y eso no es algo que se arregle con la próxima versión del modelo, sino con formación y concienciación.



El problema de las falsas referencias provocadas por alucinaciones de una IA es la punta del iceberg de un problema mayor, que engloba estas falsas citas y que ya existía desde hace tiempo: los investigadores incluyen citas y referencias sin haberlas leído. La causa es la mima: la necesidad de publicar, el poco tiempo disponible y la falta de ética investigadora. El investigador necesita documentar sus afirmaciones, darle contexto a su artículo o fundamentar un marco teórico: solo tiene que interrogar a una base de datos bibliográfica para que le dé un montó de artículos sobre el tema, elige los más citados y los casca en su trabajo sin haberlos leído ni examinado. Ahora, pudiendo usar la inteligencia artificial, el proceso sigue siendo el mismo, pero la diferencia es que las referencias obtenidas no tienen por qué ser reales.
Hace poco en una revista profesional se recomendaba a los investigadores que comprueben que sus referencias son reales. Yo recomendaría que no incluyan ninguna referencia a trabajos que no hayan leído, por muy reales que sean.