‘Integridad de las noticias en los asistentes de IA. Un estudio internacional de medios públicos’: la participación de RTVE
Cada vez son más los informes que alertan sobre cómo los asistentes de inteligencia artificial se están convirtiendo en fuente de noticias, un 15% entre los menores de 25 años, o sobre cómo las respuestas generadas por IA están modificando de forma significativa la manera en que los usuarios acceden y consumen información “periodística”. Liderados por EBU/UER y la BBC, 22 medios públicos de 18 países han presentado la primera evidencia sistemática a gran escala de que los asistentes de IA distorsionan las noticias de formas que ponen en peligro la confianza en el periodismo. RTVE ha sido una de las radiotelevisiones participantes en un estudio que presenta conclusiones preocupantes, implicaciones para los medios de servicio público y en el que se proponen medidas que podrían adoptarse para afrontar el problema.
* DAVID CORRAL HERNÁNDEZ
BBC: el proyecto inicial
El 11 de febrero de 2025, la British Broadcasting Corporation (BBC), una de las fuentes de noticias más fiables del mundo, hacía público su informe Representation of BBC News content in AI Assistants. Para obtener los resultados se había dado acceso temporal al sitio web de la BBC a los cuatro asistentes de inteligencia artificial (IA) más destacados y empleados por el público: ChatGPT de OpenAI, Copilot de Microsoft, Gemini de Google y Perplexity. A los cuatro se les hicieron las mismas 100 preguntas sobre determinadas noticias, pidiéndoles que utilizaran artículos de BBC News como fuentes, siempre que fuera posible.
Las respuestas obtenidas fueron revisadas por 45 periodistas especializados de la BBC y un equipo de editores y científicos de datos. De las conclusiones obtenidas se destacó que el 51% de todas las respuestas de IA a preguntas sobre noticias presentaban problemas “significativos”, que el 19% de las respuestas de IA que citaban contenidos de la BBC introducían errores fácticos como afirmaciones, cifras y fechas incorrectas o que el 13% de las citas procedentes de artículos de la BBC estaban alteradas o no existían en dicho artículo.
La investigación, pionera en este campo, revelaba problemas importantes en el uso de contenidos de los medios de comunicación públicos por parte de los asistentes de IA, al responder a preguntas sobre noticias presentando errores fácticos y teniendo dificultades para diferenciar entre opinión y hechos o “editorialización”. Este informe impulsó el debate sobre el papel de la inteligencia artificial en el periodismo y planteó la necesidad de mejorar la precisión para evitar la propagación de desinformación, además de plantear preocupaciones sobre su uso en la difusión de noticias y en el impacto que causan en la confianza del público en los medios y en estas herramientas.
EBU: sumando esfuerzos
Visto el resultado y el impacto del informe, la principal alianza de medios públicos del mundo, European Broadcasting Union (EBU/UER), plantea a sus miembros que, con la dirección de la BBC y con su coordinación, amplíen la visión y vayan más allá haciendo un análisis global para demostrar que el problema es sistémico y no está relacionado únicamente con el idioma, el mercado o el asistente de IA. En el pasado mes de marzo se propuso la adhesión voluntaria a un proyecto al que, finalmente, se sumaron 22 medios públicos de 18 países de todo el planeta. Junto a la BBC británica han trabajado en 14 idiomas de estudio RTBF y VRT de Bélgica, CBC-Radio Canada, Czech Radio, YLE de Finlandia, Radio France, GPB de Georgia, RAI de Italia, RTP de Portugal, NRK de Noruega, SVT de Suecia, ARD, ZDF y Deutsche Welle de Alemania, Suspilne de Ucrania, LRT de Lituania, NOS/NPO de Holanda, NPR de EE. UU., SRF de Suiza y, en nuestro país, RTVE.
La investigación tenía como objetivo recopilar datos y crear una narrativa común midiendo la previsible distorsión en los contenidos informativos por parte de los asistentes de IA para, conocidos los resultados, defender la importancia del trabajo de los medios de comunicación de servicio público, plantear a las instituciones públicas y Gobiernos la importancia de los medios como garantes de libertades y certezas y plantear a las grandes tecnológicas construir relaciones constructivas.
RTVE: la participación en español
Después de consultar internamente con el departamento jurídico y con la dirección de Tecnología se da una respuesta positiva desde RTVE a la participación en el proyecto y se acepta la cláusula de confidencialidad que obliga a no comunicar nada sobre la investigación y los resultados hasta la fecha final de publicación de los resultados. La Dirección de Relaciones Internacionales, Institucionales y Cooperación, encargada de las relaciones con EBU y otras instituciones internacionales y nacionales, asume la coordinación del proyecto, poniéndome, como periodista, al frente, y cuenta con la colaboración del área de Contenidos Informativos Digitales de RTVE, que puso a disposición periodistas y científicos de datos para que puedan revisar las respuestas de los asistentes.
El objetivo de la investigación era crear una narrativa común midiendo la previsible distorsión en los contenidos informativos por parte de los asistentes de IA
A lo largo de abril se autoriza y se retiran temporalmente los bloqueos de los contenidos web, los bots (robots.txt), para poder hacer las preguntas a ChatGPT, Copilot, Gemini y Perplexity y que obtuviesen sus respuestas en contenidos de RTVE. En este tiempo como coordinador, traduzco al español el bloque común de 30 preguntas (entre las que hay cuestiones como ¿por qué Zelensky no lleva traje? ¿Cómo calculó Trump los aranceles? ¿Está mejorando el cambio climático? ¿Hizo Elon Musk un saludo nazi? ¿Por qué vota Alemania Oriental a la AfD? ¿Es Viktor Orban un dictador? ¿Por qué la gente odia a Tesla? ¿En cuántos países se jugará la Copa del Mundo de la FIFA 2026?).
Con el cuestionario completo, pregunté cada cuestión a los cuatro asistentes, utilizando cuentas no profesionales para simular la experiencia de un usuario corriente, y añadiendo a la cuestión preguntada: “utilizando en lo posible contenidos de RTVE”. Todas estas respuestas quedan añadidas en formularios individuales y “ciegos” (no se puede conocer la fuente de procedencia de la respuesta para no condicionar su estudio), que son repartidos y analizados por el equipo de Contenidos Informativos Digitales a lo largo de mayo y junio. El tiempo de trabajo estimado inicialmente era aproximadamente de 15 minutos por pregunta por asistente de IA o aproximadamente 30 horas para revisar los cuatro asistentes de IA, aunque se superó notablemente para aportar la mayor calidad posible al estudio y a la evaluación de la calidad de las respuestas.
Cada análisis de cada una de las respuestas debía completarse en un formulario cerrado en el que se preguntaba cómo calificar en función de cinco criterios clave: precisión (la evaluación preguntaba sobre la precisión en general y sobre la precisión de las citas directas en particular), fuentes, distinción entre opinión y hecho, “editorialización” (cuando el asistente añade palabras que no figuran en la fuente citada y que implican un punto de vista o un juicio de valor) y el contexto (proporcionar suficiente información y/o perspectivas relevantes para dar a un lector no experto una respuesta completa y que no induzca a error). Para cada uno de estos criterios la respuesta se podía calificar como “sin problemas”, “algunos problemas”, “problemas significativos” o “no sé”. El último paso era un formulario de opinión en el que añadir comentarios personales más precisos.
A finales de mayo y comienzos de junio, todos los coordinadores debíamos recibir las encuestas de evaluación completadas para que se realizara una primera evaluación básica y un análisis de datos con el que afinar discrepancias y errores, además de ajustar las referencias a un modelo de cita común. Se verifican y contrastan todas las respuestas señaladas como “error significativo”. Repasadas las 120 respuestas, integré en español y en inglés todas ellas en un único formato estandarizado. Este es enviado a los coordinadores y científicos de datos de EBU para que realicen la primera verificación y control estadístico y de calidad de los informes de los medios participantes.
Una vez devuelto a RTVE, como coordinador, afiné las propuestas recibidas, realicé un análisis editorial de los resultados y las respuestas, redacté un informe y compartí de nuevo todo con el equipo central para la evaluación colectiva y la redacción del informe final. De un total de 2.760 respuestas recibidas a las preguntas principales de todos los participantes, se excluyeron las negativas de los asistentes y las preguntas cuyas respuestas no fueron generadas con éxito por el participante. Algunas respuestas no se evaluaron (por ejemplo, por enfermedad o indisponibilidad del evaluador). Esto dejó 2.709 respuestas a las preguntas principales que fueron evaluadas por el equipo central del proyecto en su control de calidad final, una vez que los medios participantes enviaron sus datos, garantizando aún más la calidad general de los datos y el resultado de su análisis.
La directora de Relaciones Internacionales, Institucionales y Cooperación de RTVE, Teresa M. Muñoz Guerra, ha destacado que “la participación de RTVE en proyectos internacionales refuerza nuestro papel como un agente activo dentro del ecosistema de radiotelevisiones europeas. Para nosotros, no se trata solo de una oportunidad de cooperación, sino también de un ejercicio claro de nuestro compromiso con el servicio público. Trabajamos para fortalecer nuestra responsabilidad social y cumplir con una de nuestras misiones fundamentales: combatir la desinformación y las noticias falsas, y contribuir a la defensa y la protección de las democracias. El hecho de que RTVE sea reconocida como uno de los actores que contribuyen a definir estándares informativos y de verificación en la era de la inteligencia artificial es especialmente significativo. Nos posiciona, también, como un referente en el ámbito hispanohablante en cuanto a verificación informativa y al uso ético y responsable de la IA en los medios”.
Ruth Drake, redactora de Economía en RTVE.es, coincide en la importancia de que RTVE sea parte de este tipo de iniciativas: “No solo me parece positivo, sino también necesario que los medios públicos de referencia de diferentes países -en este caso, RTVE en España- sean los que formen parte y encabecen estas iniciativas, que, en definitiva, buscan el máximo rigor y veracidad de los contenidos que luego llegan a la población. Además, viendo la incidencia que ya tiene (y tendrá) la IA en la comunicación e información, considero que esta misión de corroborar el uso de la información por parte de esta tecnología debe integrarse como una práctica a medio y largo plazo, no solo ahora, que es cuando vemos la punta del iceberg”.
El informe final
El 21 de octubre, después de abundantes horas de trabajo, reuniones e intercambios de ideas y opiniones entre los equipos de análisis y de trabajo, se publicó y se puso a disposición del público el informe final: News Integrity: in AI Assistants. An International PSM Study. La comparación entre los resultados de la BBC a principios de este año y este estudio muestra algunas mejoras, pero aún altos niveles de errores. De los datos más relevantes destacan que el 45% de todas las respuestas de IA tuvieron al menos un problema significativo, que el 31% de las respuestas analizadas presenta problemas significativos con la atribución de las fuentes o que el 20% contenía problemas importantes de precisión, incluidos detalles de “alucinación” e información desactualizada.
Cerca de 300 profesionales de distintos medios del planeta, entre periodistas y perfiles técnicos, han posibilitado este estudio gracias a sus evaluaciones y asegurando los estándares de precisión e imparcialidad. Es destacable su metodología replicable y consistente, ya que todos los participantes siguieron el mismo proceso estructurado, con preguntas compartidas, criterios de evaluación y documentación detallada. También el gran tamaño de la muestra, con estadísticas basadas en más de 2.700 respuestas evaluadas, lo que permite conclusiones sólidas a nivel agregado, a través de asistentes de IA e indicadores clave. Y, finalmente, un control de calidad sistemático, con una continua verificación y control por parte de los equipos de proyecto participantes y centrales garantizaron la calidad y la coherencia.
Tras participar en este proyecto, Lucía Montilla Rodríguez, periodista en Contenidos Informativos Digitales de RTVE.es, considera que “los medios debemos saber cómo y para qué las grandes tecnológicas utilizan nuestros contenidos, porque de ello depende no solo nuestra presencia, sino también la confianza del público y su derecho a una información veraz. No se trata de rechazar la tecnología, sino de aprender a convivir con ella poniendo la responsabilidad pública en primer lugar. Si un modelo de inteligencia artificial usa nuestras noticias, debemos saber cómo las interpreta, si mantiene el contexto y si respeta el rigor con el que fueron elaboradas. En el estudio hemos comprobado que, con frecuencia, los modelos generativos ofrecen información incompleta, desactualizada o sin el criterio periodístico necesario, lo que puede confundir al usuario y alimentar la desinformación. Por eso, medios y plataformas tenemos la obligación de ser transparentes sobre cómo empleamos la IA y qué fuentes utilizamos, para que la innovación tecnológica no borre la identidad del periodismo ni ponga en riesgo el derecho ciudadano a una información fiable y contextualizada”.
El monitoreo independiente continuo de los asistentes de IA es esencial, con objeto de evaluar y salvaguardar el impacto de la IA en la integridad de las noticias
Una visión más técnica es la de María Escobar Lara, Data Science de Contenidos Informativos de RTVE: “Lo que más me gustó del proyecto fue poder mirar cómo funcionan realmente los asistentes de IA desde dentro, con datos y ejemplos concretos. Yo no soy periodista, así que me acerqué desde la parte más analítica: cómo medir si una respuesta es precisa, si tergiversa una fuente o si cambia el sentido de una cita. Me pareció interesante ver cómo algo tan técnico como una hoja de evaluación puede servir para poner números a algo que normalmente se percibe como subjetivo, la calidad informativa. Creo que lo valioso del proyecto es justo eso: juntar perfiles distintos para entender mejor qué hacen los sistemas de IA con las noticias. Al final se trata de tener evidencia, no solo intuiciones, sobre cómo estas herramientas pueden afectar a la confianza en la información”.
Los siguientes pasos
Coincidiendo con uno de los estudios transnacionales y multilingües más grandes sobre asistentes y noticias de IA hasta la fecha, la EBU también ha publicado un Kit de herramientas de integridad de noticias en asistentes de IA (News Integrity in AI Assistants Toolkit)” , para ayudar a las empresas tecnológicas a evaluar, supervisar y mejorar el rendimiento de los asistentes de IA en el contexto de las noticias, así como proporcionar un recurso clave para los medios de comunicación y para los investigadores, profesionales y formadores en el ámbito de la inteligencia artificial.
Este uso de la IA en los medios, opina Borja Díaz-Merry, periodista de VerificaRTVE, “supone un reto, un desafío y también una herramienta que ya es fundamental en las redacciones. Siempre bajo la vigilancia de los periodistas y, en todo caso, como un apoyo en la labor del periodista. Los medios y los periodistas debemos mantenernos vigilantes ante el uso que hace la IA de nuestros contenidos informativos, para que respete los derechos de autor, para que no impulse sesgos y para que no utilice noticias contrastadas de medios fiables de forma parcial y desequilibrada. Para que, por poner un ejemplo, no utilice noticias de medios fiables para presentar a un dictador como un dirigente democrático elegido en las urnas cuando esas noticias advierten de que cada cita con las urnas en ese país no cumple los mínimos estándares democráticos exigidos por la Organización para la Seguridad y la Cooperación en Europa”.
Su compañera en VerificaRTVE, Paula Peña Suárez, también periodista, cree “que la inteligencia artificial no es, en sí misma, una amenaza para el periodismo, sino un desafío que pone a prueba su verdadero valor. Es cierto que esta tecnología puede generar contenidos y ofrecer respuestas de forma inmediata, pero carece de lo que constituye la esencia del periodismo: el criterio humano, la verificación rigurosa, la interpretación del contexto y la responsabilidad ética frente a la verdad. Ante un contexto marcado por la desinformación, el periodismo tiene la oportunidad de reafirmar su papel como garante de información veraz y de calidad. Todo ello teniendo en cuenta que el periodista aporta lo que las máquinas no pueden: sentido, profundidad y humanidad. La IA puede ser una aliada poderosa para mejorar los procesos de investigación y producción informativa, siempre que se utilice con espíritu crítico y con el propósito de servir a la ciudadanía”.
Con frecuencia, los modelos generativos ofrecen información incompleta, desactualizada o sin el criterio periodístico necesario
Para Samuel A. Pilar, periodista de Informativos de RTVE.es, tampoco supone una amenaza la IA para el periodismo, “sino una herramienta en la que los profesionales nos podemos apoyar para encontrar información, ideas, nuevos puntos de vista y enfoques, traducciones e incluso correcciones. Pero su fiabilidad informativa está lejos aún de ser óptima, y ahí es donde entra de lleno nuestra labor como periodistas, sabiendo contrastar los datos y encontrar los que más se ajustan a la realidad, y también aportando un toque más ‘humano’ al transmitir esa información, que es algo en lo que también los algoritmos tienen que mejorar mucho. Por ejemplo, sí que son capaces de redactar con solvencia una noticia pura, sin apenas matices subjetivos, pero la situación cambia cuando se trata de una crónica o un reportaje, cuyo contenido es mucho más profundo. ¿Lo conseguirán algún día? Seguramente; pero, mientras tanto, nuestro trabajo es indispensable. Y, además, también considero que a las personas siempre nos seguirá atrayendo el lado humano de las cosas”.
Además, EBU/UER y sus miembros están presionando a los reguladores nacionales y de la Unión Europea para que hagan cumplir las leyes existentes sobre integridad de la información, servicios digitales y pluralismo de los medios de comunicación. Enfatizan que el monitoreo independiente continuo de los asistentes de IA es esencial, dado el rápido ritmo de desarrollo de la inteligencia artificial, y están buscando opciones para mantener de forma continua la importante labor de evaluar y salvaguardar el impacto de la IA en la integridad de las noticias. Entre los objetivos de la alianza y sus miembros se encuentra destacar la importancia de la labor de los medios de comunicación de servicio público a la hora de garantizar que las herramientas de IA proporcionen información precisa, relevante e imparcial a todos los públicos; proteger la confianza del público empleando la IA de forma responsable y ética, salvaguardando la precisión, la transparencia y la fiabilidad de los medios e incluyendo, en paralelo, reforzar la alfabetización informativa entre las audiencias; sumar esfuerzos y trabajar por la soberanía digital europea y la innovación colaborativa de los medios públicos como garantía de un panorama mediático diverso y culturalmente representativo, y, por último, asumir la responsabilidad que permita mejorar los valores del servicio público y abordar, con decisión, un reto crítico: generar o recuperar la tan cuestionada confianza de las audiencias y usuarios.
Para Sofía Soler Sánchez, periodista de Informativos de RTVE.es, “definitivamente, es el momento de demostrar que el valor del periodismo está en las historias, los hechos comprobados y las conexiones ‘no tan evidentes’. Eso (al menos todavía) solo es capaz de hacerlo una persona que conoce el contexto y los detalles, que van más allá de un conjunto de datos. La IA actualmente ofrece un resumen de la información que ya existe en la red. La periodista es la que puede decir: estuve ahí, pregunté, comprobé, comprendí. Dicho esto, es indudable que la IA es y será una herramienta más para que un buen periodista pueda ejercer el oficio. Y tendremos que afrontar esto muy atentos a los sesgos que contiene, a cómo moldea el lenguaje y cómo utiliza nuestro trabajo para alimentarse. Tampoco podemos esperar que la IA tome la forma más conveniente para la democracia (para la ciudadanía, en definitiva) sin debatir y actuar en esa dirección”.
Llevamos años escuchando, afirma Adrián Romero, periodista de Informativos de RTVE.es, que “el periodismo está muerto, y aquí seguimos. Retos como la desinformación nos han acompañado desde nuestro origen, y nos mantenemos. Por mucha incertidumbre que nos cause la IA, no podemos considerarla una amenaza, ni por ahora ni en el futuro. El reto que nos impone no es otro que demostrar una parte intrínseca de nuestro gremio y nuestra profesión: la veracidad. Nos adaptaremos a ella y nos ajustaremos a este nuevo entorno. No hacerlo sería faltar al núcleo de nuestro trabajo. El periodismo comenzó en papel, pasó a la radio y televisión y luego dio el salto a internet y las redes. Somos un sector acostumbrado a los cambios. Indudablemente, la IA llegó para quedarse, pero los periodistas nunca hemos estado de paso”.
Contenido relacionado:
- "Carta a los Lectores": "La misión y dimensión del periodismo y su situación actual", por José Francisco Serrano Oceja
- "De las AI Overviews a la caída de Google Discover: una radiografía de la montaña rusa que han vivido los medios en 2025 y retos para 2026", por Clara Soteras
- "Meta, la prensa y el dopaje de datos: crónica de una victoria judicial con miedo a las represalias", por Carlos del Castillo
- "Trump contra la BBC: la crisis sin precedentes de la institución británica", por Celia Maza
- "La guerra del Pentágono (y la Casa Blanca) contra la prensa", por Andrés Gil