1. Introducción
Las ciencias de la computación entienden la inteligencia artificial (IA) como el conjunto de sistemas o algoritmos que imitan la inteligencia humana para realizar determinadas tareas. Su evolución ya permite referirnos a máquinas inteligentes que operan y piensan como humanos, lo que incluye procesamiento del lenguaje natural (PLN) y reconocimiento de imágenes y voz (Gültekin, 2022), puesto que estos sistemas inteligentes aprenden automáticamente de datos en lugar de instrucciones codificadas (Duangekanong, 2022).
La Cuarta Revolución Industrial o Industria 4.0 (da Silva, Kovaleski y Negri, 2019) es la etapa más importante desde el inicio de la revolución industrial en el siglo XVIII. Se caracteriza por combinar técnicas de producción con sistemas inteligentes que se integran con organizaciones y personas (Kong et al., 2021), de modo que la IA se está convirtiendo en uno de los elementos más relevantes de esta nueva era (Aloqaily y Rawash, 2022) por la repercusión que tiene en distintas parcelas de la sociedad (Bolander, 2019) y por los beneficios de su implementación (Butler, 2020). El ámbito sanitario, la logística, las industrias creativas, la defensa o los distintos sistemas de fabricación, entre otros, están aplicando soluciones innovadoras basadas en IA (Alhwaiti, 2023).
El papel fundamental de la IA en las organizaciones radica en mejorar la eficiencia y la eficacia de diferentes áreas, servicios y sistemas para hacerlos más ágiles y precisos (Nankervis et al., 2021), lo que repercute en la reducción de costes. Ya se considera que la inmersión de empresas y organizaciones en la industria 4.0 implica necesariamente la implementación de IA para continuar siendo exitosas (Holmström, 2022), pero ¿también sucede esto en la industria periodística?
La comunicación y el periodismo no pueden permanecer ajenos a la Cuarta Revolución Industrial. Aunque en sus orígenes, a mediados del siglo XX, se esperaba que la IA se convirtiese en máquinas y robots con capacidades cognitivas semejantes a las de los humanos, esto no sucedió hasta la actualidad (Pillai y Shivathanu, 2020). Y es ahora cuando los medios se enfrentan al desafío de ir integrando en las redacciones y en los productos comunicativos tecnologías todavía incipientes o en fase de prueba o desarrollo, pero que están desintegrando los límites entre lo físico, lo digital y lo biológico.
Estudios han comprobado la repercusión de aplicar IA en tareas de gestión de la comunicación e información. Se ha descubierto que la automatización de tareas repetitivas que consumen mucho tiempo permite destinar esfuerzos a otras actividades que agregan valor y que requieren habilidades y destrezas específicas (Pillai y Shivathanu, 2020) y que la minimización de errores gracias al aprendizaje automático mejora la toma de decisiones (Michailidis, 2018). Otras investigaciones ponen de manifiesto la deshumanización de los procesos de comunicación, como sucede, por ejemplo, en el caso de los chatbots (Fritts y Cabrera, 2021) o la necesidad continua de mantenerse al día de los constantes cambios tecnológicos (Abdeldayem y Aldulaimi, 2020), lo que puede derivar en el tecnoestrés que sufren periodistas por el uso intensivo de tecnología (Malik et al., 2021).
Investigadores también han alertado sobre la posibilidad de que la IA reproduzca desigualdades existentes o que incluso las amplíe (Zou y Schiebinger, 2018) y han reportado casos de discriminación por parte de estos sistemas (Cachat-Rosset y Klarsfeld, 2023). Otros trabajos centrados en la ética y deontología concluyen que cuestiones como la moralidad, la no maleficencia, la autonomía, la privacidad, la responsabilidad, la transparencia y la equidad difícilmente pueden concebirse sin intervención humana (Hagendorff, 2022; Jobin, Ienca y Vayena, 2019).
1.1 IA en los medios digitales de la Cuarta Revolución Industrial
Si bien la IA se asocia a la creación de iniciativas colectivas para la digitalización (Hervás-Oliver, 2021), esta fase está ampliamente superada en el ámbito de los medios, como demuestran tres décadas de periodismo digital en España y su desarrollo como disciplina científica consolidada (Salaverría, 2019). Ahora es momento de comprobar si también en los medios digitales existen fábricas inteligentes de noticias en las que sistemas ciberfísicos monitorean procesos físicos y se comunican entre sí y con los humanos en tiempo real (Ciffolilli y Muscio, 2018), teniendo en cuenta, además, que el desarrollo de las tecnologías permite la generación de cantidades masivas de datos (Chandol y Rao, 2023) que el ser humano difícilmente podría interpretar sin ayuda tecnológica.
Estudios recientes han catalogado la oferta tecnológica de IA en España en tres fases del proceso periodístico (recogida de información, producción de contenido y distribución) y han detectado una apuesta decidida de las tecnológicas españolas para ofrecer servicios de IA para la práctica periodística (Sánchez-García et al., 2023). Detalladamente, la aplicación de IA al periodismo se ha fundamentado en la generación de contenidos, en su recomendación y clasificación, y en la generación de flujos, constatándose la existencia de algoritmos que sugieren contenidos, detectan noticias o automatizan determinadas fases de la producción informativa (Cifuentes y Sixto-García, 2022; Saurwein, 2019; Soffer, 2019; Tejedor et al., 2021) y otros que crean contenido, por ejemplo, en periodismo deportivo (Rojas-Torrijos y Toural-Bran, 2019).
La IA se considera vital para los servicios públicos audiovisuales del futuro, aunque su aplicación todavía no ocupa una posición estratégica en los departamentos de innovación, sino que las corporaciones se encuentran en una primera fase experimental sustentada en experiencias piloto (Fieiras-Ceide, Vaz-Álvarez y Túñez-López, 2022). Así, en otra investigación se confirma la voluntad de RTVE de ser referente como servicio público en la aplicación y desarrollo de IA de una forma sostenible (Sanahuja-Sanahuja y López-Rabadán, 2022). Otro estudio ya avisó de que la IA obligará a reformular la forma de organizar el trabajo en las redacciones (Parratt-Fernández, Mayoral-Sánchez y Mera-Fernández, 2021). Y una de las investigaciones más recientes en España observó la necesidad de un “cambio de mentalidad en las redacciones, superar el miedo a la sustitución, poner en valor la capacidad creativa y las decisiones editoriales humanas” (Mondría-Terol, 2023).
Otros trabajos alertan sobre amenazas para la buena praxis periodística que implican un ejercicio profesional basado en métricas y no en la calidad del producto (Ufarte-Ruiz y ManfrediSánchez, 2019). Si la autorregulación siempre ha sido el principal instrumento de control ético y deontológico de la profesión en España para garantizar el precepto constitucional del derecho a la información, al margen de algunas regulaciones concretas sobre la cláusula de conciencia (Ley Orgánica 2/1997) o la rectificación (Ley Orgánica 2/1984), otra investigación concluye que es necesario adaptar el Código Deontológico de la FAPE (Federación de Asociaciones de Periodistas de España) para que siga siendo operativo en el periodismo con IA y que los públicos tienen el derecho de conocer cuándo los informa una persona o una máquina (Ufarte-Ruiz, Calvo-Rubio y Murcia-Verdú, 2021).
En el caso de los verificadores, la IA se orienta a la verificación de fuentes, gestión de datos masivos y creación de chatbots (Sánchez-González, Sánchez-Gonzales y Martínez-Gonzalo, 2022). La utilidad de la IA para combatir la desinformación desde un planteamiento ético del desarrollo tecnológico también se ha destacado en otro estudio (Manfredi-Sánchez y Ufarte-Ruiz, 2020), pero, además, la IA debería ayudar a facilitar y mejorar la dieta informativa del usuario, alertándole, por ejemplo, sobre la presencia de noticias falsas. Flores (2019) exploró los principales desarrollos de bots utilizados para minimizar la toxicidad de la información y concluyó que estos aceleraban prácticamente por igual la difusión de noticias que la de informaciones falsas.
Aunque la IA aplicada al periodismo supone más competitividad, más flexibilidad, más fluidez y más rapidez (Aramburú, López-Redondo y López-Hidalgo, 2021), también presenta los mismos problemas que cualquier otro tipo de IA. Una debilidad de estos sistemas en relación con los humanos es su incapacidad de aplicar el conocimiento existente a un problema nuevo o a una situación que varía de para lo que fueron programados o entrenados (Guerin, 2022). Este es uno de los desafíos a los que debe enfrentarse el binomio periodismo-IA. Si un vehículo autónomo impulsado por IA tiene que elegir entre matar peatones o ponerse en riesgo a sí mismo y a su conductor, ¿qué hará o debería hacer la IA? (Nyholm y Smids, 2016). Si para una noticia hay que elegir entre contar la verdad o tergiversarla para ganar visitas, ¿qué hará la IA? Peña-Fernández et al. (2023) reclaman especial atención a cómo la IA puede afectar al público y a los periodistas, y cómo puede ser usada para fines propios de la profesión y el bien social.
Para que la IA funcione en una redacción, los periodistas también deben aprender a pensar como una máquina (Gonçalves y Melo, 2022; Lewis, Guzmán y Schmidt, 2019) y no solo a escribir para ellas, como llevan haciendo desde que el SEO cambió rutinas de producción informativa (Perreault y Ferrucci, 2020). Para ello resulta fundamental la formación en IA y, en consecuencia, su inclusión en los planes de estudios de grados y másteres en periodismo y comunicación (Gómez-Diago, 2022, Lopezosa et al., 2023), así como la incorporación de ingenieros y perfiles puramente tecnológicos a las plantillas de los medios, ya que las tecnologías de IA necesitan expertos en su desarrollo y gestión (Palos-Sánchez et al., 2022; Mondría-Terol, 2023).
En definitiva, parece que la supervivencia de las empresas periodísticas dependerá en gran medida de su capacidad de adaptación para incorporar IA a sus productos y a su modus operandi (Túñez, Ufarte y Mazza, 2022) y garantizar, al tiempo, que el periodismo siga cumpliendo su función social y de servicio público.
1.2 Objetivos
La Cuarta Revolución Industrial sigue cobrando impulso (Ojubanire, Sebti y Berbain, 2022), aunque todavía existen temores y sentimientos negativos sobre la aplicación de IA tanto entre empleados como entre gerentes (Palos-Sánchez et al., 2022). Es momento, pues, de analizar cómo se están adaptando los medios digitales españoles a este contexto 4.0, que no es exclusivo de la comunicación, pero al que, como tantos otros sectores, tendrá que adaptarse.
Esta investigación tiene dos objetivos generales:
OB1. Conocer y comparar el estado de desarrollo de IA y la percepción sobre su impacto en la profesión en medios representativos de la prensa tradicional y nativa digital en España.
OB2. Explorar un método de detección de generación de textos humanos vs sintéticos para evaluar si se está utilizando IA generativa.
En función de estos objetivos, los resultados se dividen en los obtenidos a partir de una encuesta (OB1) y los generados a partir de un experimento con ChatGPT 3.5 (OB2).
2. Metodología
Esta investigación combina una encuesta a responsables de medios digitales españoles y un experimento para la identificación de contenidos generados por IA. Se recurrió a la triangulación de métodos y técnicas cualitativas y cuantitativas, recomendable para fortalecer la investigación social sobre un fenómeno con múltiples perspectivas (Blaikie, 1991; Jick, 1979; Oppermann, 2000).
La encuesta se diseñó como paso previo para aplicar el experimento, con la idea de preguntar si estos periódicos utilizan o no IA y la opinión de sus responsables sobre esta tecnología.
2.1 Muestra
En una primera fase se seleccionó una muestra intencional homogénea en la que los medios elegidos comparten rasgos similares o características específicas (Andrade, 2021; Battaglia, 2008; Etikan et al., 2016). Para la selección (Figura 1) se recurrió a la clasificación de medios digitales en España Reuters Institute Digital News Report 2022 (Newman et al., 2022: 103).

Fuente: Reuters Institute Digital News Report 2022.
Figura 1 Clasificación de medios en línea en España más consumidos
De esa clasificación se seleccionaron 9 medios (Tabla 1) siguiendo estos criterios de homogeneidad:
Debía haber medios matriciales con ediciones online y nativos digitales, para establecer comparaciones.
2.2 Técnicas de investigación
2.2.1 Encuesta
La primera parte del estudio se fundamenta en una encuesta a responsables de medios de comunicación tradicionales y medios nativos digitales de España para conocer si utilizan herramientas de IA, por qué las usan o no y cuál es la percepción sobre su impacto en el sector. La encuesta, estructurada y bifurcada, se dividió en cuatro secciones, en las que se incluyeron preguntas dicotómicas, de opción única o múltiple, abiertas y de escala de Likert.
En la sección 1 se recogió información de los medios y representantes entrevistados, y la pregunta clave condicional sobre el uso de IA en el medio: “¿Se aplica algún tipo de inteligencia artificial en su medio?”. En la sección 2 (“En caso de que no utilicen IA”) se preguntó por las razones por las que no se han aplicado sistemas de IA, con posibilidad de respuesta de opción múltiple: desconocimiento sobre sus aplicaciones, falta de recursos económicos, falta de expertos en su desarrollo, falta de expertos en su uso, no la vemos útil, no se ha planteado su utilización, estamos diseñando un plan para su aplicación, otra (respuesta abierta). En la sección 3 (“En caso de que sí utilicen IA”) se preguntó desde cuándo, de qué tipo de producción es la IA utilizada (propia o de terceros), tipos de licencias (privativas o libres), fases de producción informativa y tareas específicas en las que se utiliza, beneficios que reporta la IA para el medio, su eficacia y su nivel de desarrollo y valoración del medio como fábrica inteligente de noticias. En la sección 4 (para todos los entrevistados) se pidió: 1) “Valore su grado de acuerdo con la siguiente afirmación: La IA es una amenaza para el empleo en el periodismo”, en una escala de 1 a 5, siendo 1=Nada de acuerdo, 2=Poco de acuerdo, 3=Medianamente de acuerdo, 4=Bastante de acuerdo, 5=Totalmente de acuerdo; 2) “Valore su grado de acuerdo con la siguiente afirmación: La IA es una amenaza para la ética periodística”, siendo 1=Nada de acuerdo y 5=Totalmente de acuerdo; 3) “¿Cree que la IA ya puede o podrá en un futuro realizar actividades relacionadas con el periodismo sin supervisión humana?”, pudiendo ser la respuesta “sí”, “no”, “no sé”; 4) “¿Cree importante incorporar ingenieros y perfiles tecnológicos en las redacciones para la gestión y uso de IA?”, pudiendo ser la respuesta 1=Nada importante, 2=Ligeramente importante, 3=Bastante importante, 4=Extremadamente importante; 5) “¿Qué nivel de formación y destreza tienen, en general, los periodistas en España para trabajar con IA?”, pudiendo responder 1=Muy bajo, 2=Bajo, 3=Medio, 4=Alto, 5=Muy alto.
La encuesta, diseñada en Google Forms, se distribuyó en línea durante marzo y abril de 2023 siguiendo el método CAWI (Computer Assisted Web Interviewing). De los 9 medios, dos respondieron el cuestionario: El Mundo y eldiario.es. La naturaleza de ambos medios justificaba el estudio. Las respuestas se consideraron lo suficientemente relevantes y sustanciales para continuar con la investigación, que se reorientó como estudio comparativo de dos casos mediante muestreo por conveniencia (Andrade, 2021; Batagglia, 2008) entre dos periódicos de referencia en España, uno matricial y otro nativo digital. Los medios nativos digitales o cibermedios nativos son “aquellos pensados y nacidos para internet”, mientras que los medios matriciales, tradicionales o migrantes digitales “derivan de las marcas previas a internet y que migraron a ese espacio” (Vázquez-Herrero, Negreira-Rey y López-García, 2023: 3).
Ambos periódicos tienen, además, líneas editoriales opuestas: El Mundo es un medio tradicional y conservador, mientras que la línea ideológica de eldiario. es es progresista (GIPEyOP/Mediaflows, 2017) y se enmarca en los llamados medios alternativos (Al Najjar-Trujillo, Arévalo-Salinas y Vilar-Sastre, 2020).
Con base en todo lo expuesto anteriormente, consideramos conveniente y oportuno el estudio y comparación de ambos medios por tratarse del periódico tradicional conservador y el nativo digital progresista más leídos de España. Además, la selección se adecúa a las singularidades del proyecto de I+D+i “Medios nativos digitales en España: estrategias, competencias, implicación social y (re)definición de prácticas de producción y difusión periodísticas” (PID2021122534OB-C21), financiado por el Ministerio de Ciencia e Innovación del Gobierno de España y el Fondo Europeo de Desarrollo Regional (FEDER) “Una manera de hacer Europa”.
2.2.2 Experimento
Para el segundo objetivo de la investigación se diseñó un experimento para comprobar si estos medios están publicando textos creados total o parcialmente con IA.
Existen tecnologías para detectar textos sintéticos, como GLTR (Gehrmann et al., 2019), GPTZero (Tian, 2023), DetectGPT (Mitchell et al., 2023) o AI Text Classifier (OpenAI, 2023; Kirchner et al., 2023), entre otras. Pero estas aplicaciones no serían 100 % fiables y pueden ser frágiles para detectar y diferenciar textos generados con IA y otros creados por humanos (Jawahar et al., 2020; Dalalah y Dalalah, 2023; He et al., 2023; Wang et al., 2023). De hecho, OpenAI decidió cerrar el proyecto AI Text Classifier medio año después de su lanzamiento debido a que no era muy preciso y podía generar falsos positivos (David, 2023); esto significa que en ocasiones etiquetaba texto escrito por humanos como generado por IA.
Además, los detectores de IA se han desarrollado fundamentalmente para identificar contenidos sintéticos en inglés y no parece existir una solución tecnológica robusta y fiable para textos en español (Gonzalo, 2023; Rogers, 2023). Por otro lado, la capacidad humana para detectar contenido generado por IA es limitada (Clark et al., 2021; Soni y Wade, 2023). Es por ello que aplicamos un experimento con la versión libre de ChatGPT 3.5 para comprobar si este chatbot puede identificar textos generados con IA, es decir, verificar si esta tecnología de IA tiene capacidad para detectarse a sí misma u otras similares. Este modelo de lenguaje de gran tamaño, desarrollado por OpenAI, fue entrenado con 45 TB de dados de texto y dispone de 175 mil millones de parámetros (Wu et al., 2023).
El experimento se desarrolló en dos fases. Las pruebas visuales de las preguntas de los investigadores y las respuestas de ChatGPT se comparten en el repositorio en línea Zenodo (Quian y Sixto, 2024).
2.2.2.1 Fase de control
Esta fase se desarrolló en dos pasos. En el primero preguntamos al chatbot sobre sus capacidades
para detectar textos sintéticos (Tabla 2).
Tabla 2 Primera prueba de la fase de control
Pregunta del investigador | Respuesta de ChatGPT |
---|---|
¿Puede ayudarme a analizar si un texto ha sido creado con inteligencia artificial? | ¡Cla o! Estoy aquí para ayudarte a analizar si un texto ha sido creado con inteligencia artificial. Aunque no puedo brindarte una respuesta definitiva, puedo proporcionarte algunas pautas para evaluar si un texto fue generado por un modelo de inteligencia artificial como yo. Aquí hay algunas señales que podrían indicar que un texto fue creado por una IA: |
1. Coherencia inusual: Los modelos de IA a menudo tienen dificultades para mantener la coherencia lógica a lo largo de un texto largo. Si encuentras que el texto es coherente en exceso o carece de errores o inconsistencias comunes en la escritura humana, puede ser una indicación de que fue generado por una IA. | |
2. Uso de frases o estructuras inusuales: Los modelos de IA pueden aprender a usar ciertas frases o estructuras gramaticales de manera poco común. Si el texto contiene construcciones sintácticas poco usuales o utiliza giros de frase inusuales, podría sugerir que fue generado por una IA. | |
3. Falta de conocimiento actualizado: Los modelos de IA tienen un conocimiento limitado, y su entrenamiento se basa en datos disponibles hasta su fecha de corte. Si el texto menciona eventos o desarrollos recientes que no ocurrieron antes de la fecha de corte de mi conocimiento (septiembre de 2021), eso podría indicar que fue creado por una IA. | |
4. Producción de texto demasiado perfecto: Los modelos de IA a menudo generan texto con una gramática y estructura casi perfecta, sin errores ortográficos o gramaticales comunes. Si el texto parece haber sido revisado minuciosamente y carece de errores que un escritor humano cometería, es posible que haya sido generado por una IA. | |
5. Respuestas poco contextuales: Los modelos de IA pueden tener dificultades para comprender y responder adecuadamente a preguntas o solicitudes complejas que requieren un conocimiento contextual profundo. Si el texto proporciona respuestas genéricas o mal relacionadas con la pregunta o el contexto, es posible que haya sido creado por una IA. | |
Es importante tener en cuenta que estas pautas son solo indicadores y no garantizan una respuesta definitiva. La IA ha avanzado rápidamente en los últimos años, y los modelos actuales pueden generar textos cada vez más sofisticados y difíciles de distinguir de los textos escritos por humanos. |
Fuente: elaboración propia.
En el segundo paso se pidió a ChatGPT que determinase si 15 textos en español generados por dos IA son, precisamente, contenidos sintéticos. Los textos fueron creados por Ana Futbot (n=10), el bot de Rl Jonfidencial para la escritura automática de crónicas deportivas, y Gabriele (n=5), una IA más nueva que crea para el medio ecuatoriano GK textos sobre criptomonedas y materias primas, además de clasificaciones de Netflix o Spotify. A diferencia de ChatGPT, que es un modelo de lenguaje grande diseñado para la interacción conversacional con el usuario humano, Ana Futbot y Gabriele son bots de inteligencia artificial generativa cuya función no es la interacción, sino la generación y publicación de textos periodísticos a partir de datos estructurados, utilizando algoritmos de machine learning y deep learning. La redacción automatizada basada en datos estructurados se usa en los medios de comunicación desde hace más de una década (Diakopoulos, 2023).
El criterio de selección de la muestra fue temporal, esto es, los diez últimos textos publicados por Ana Futbot, entre el 24 y el 16 de marzo de 2019 (Tabla 4), y los últimos cinco textos de información económica publicados por Gabriele en abril de 2022 (Tabla 6). Se excluyeron titulares y subtítulos, de modo que ChatGPT analizó los cuerpos de las noticias. Los 15 artículos de control se codificaron para su análisis en los resultados (C1-C15).
Se hizo una pregunta a ChatGPT antes de introducir los textos (Tablas 3 y 5).
Tabla 3 Pregunta a ChatGPT antes de introducir los textos de Ana Futbot
Pregunta del investigador | Respuesta de ChatGPT |
---|---|
¿Puede decirme si los siguientes diez textos que te iré mostrando han sido escritos total o parcialmente por una inteligencia artificial? | ¡Po supuesto! Estaré encantado de ayudarte a determinar si los textos que me muestres han sido escritos total o parcialmente por una inteligencia artificial. Por favor, muéstrame el primer texto y lo revisaremos juntos. |
Fuente: elaboración propia.
Tabla 4 Textos generados por Ana Futbot
C1 | El Cartagena y el Villanovense empatan(1-1) | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-24/el-cartagena-y-el-villanovense-empatan-1-1_1900806/ |
---|---|---|
C2 | Empate entre Cornellà y Peralada-Girona B | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-24/empate-entre-cornella-y-peralada-girona-b_1900798/ |
C3 | Tres puntos para el equipo local: Cultural Leonesa 3-1 Celta B | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-24/tres-puntos-para-el-equipo-local-cultural-leonesa-3-1-celta-b_1900794/ |
C4 | El Burgos vence y se lleva los tres puntos | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-24/el-burgos-vence-y-se-lleva-los-tres-puntos_1900790/ |
C5 | El Castellón vence y se lleva los tres puntos | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-24/el-castellon-vence-y-se-lleva-los-tres-puntos_1900802/ |
C6 | El Arenas de Getxo cae derrotado ante el Tudelano (0-1) | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-23/el-arenas-de-getxo-cae-derrotado-ante-el-tudelano-0-1_1900074/ |
C7 | La Real Sociedad B cae derrotado frente al Amorebieta (1-2) | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-23/la-real-sociedad-b-cae-derrotado-frente-al-amorebieta-1-2_1900070/ |
C8 | El At. Levante se impone por 0-1 al Ejea | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-16/el-at-levante-se-impone-por-0-1-al-ejea_1886734/ |
C9 | El Barcelona B cae derrotado ante el Espanyol B (0-1) | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-16/el-barcelona-b-cae-derrotado-ante-el-espanyol-b-0-1_1886730/ |
C10 | El Cornellà se queda los tres puntos ante el Ejea | https://www.elconfidencial.com/deportes/futbol/segunda-division-b/2019-03-10/el-cornella-se-queda-los-tres-puntos-ante-el-ejea_1872794/ |
Fuente: elaboración propia.
Tabla 5 Pregunta a ChatGPT antes de introducir los textos de Gabriele
Pregunta del investigador | Respuesta de ChatGPT |
---|---|
¿Puede decirme si los siguientes cinco textos que te iré mostrando han sido generados total o parcialmente por una inteligencia artificial? | Claro, estaré encantado de ayudarte a determinar si los textos que me muestres fueron generados total o parcialmente por una inteligencia artificial. Por favor, proporciona el primer texto y lo analizaré. |
Fuente: elaboración propia.
Tabla 6 Textos generados por Gabriele
C11 | Apertura del Ethereum del 29 de abril | https://gk.city/2022/04/29/apertura-ethereum-29-abril/ |
---|---|---|
C12 | Apertura del Decentraland del 29 de abril | https://gk.city/2022/04/29/apertura-decentraland-29-abril/ |
C13 | Apertura del Bitcoin del 29 de abril | https://gk.city/2022/04/29/apertura-bitcoin-29-abril/ |
C14 | Apertura del IOTA del 29 de abril | https://gk.city/2022/04/29/apertura-iota-29-abril/ |
C15 | Apertura del Solana del 29 de abril | https://gk.city/2022/04/29/apertura-solana-29-abril/ |
Fuente: elaboración propia.
2.2.2.2 Fase de análisis de textos de El Mundo y eldiario.es
Se solicitó a ChatGPT el mismo análisis para 15 artículos de El Mundo y 15 de eldiario.es. Solo se introdujo el cuerpo de los artículos (se excluyeron titulares y subtítulos).
La petición a ChatGPT fue: “¿Puedes decirme si el siguiente texto que te mostraré fue escrito total o parcialmente por una inteligencia artificial?”.
Los artículos se seleccionaron siguiendo estos criterios:
6. 20 textos no firmados por periodistas, donde la firma es “El Mundo” (n=10) y “eldiario.es” (n=10). Se utilizaron los buscadores de ambos medios y se excluyeron textos de agencias. No se realizó un cribado por secciones, de manera que podía entrar en la muestra cualquier tipo de información (Tabla 7).
7. 10 textos no firmados por periodistas de secciones y firmas seleccionados intencionalmente por entender que su naturaleza informativa es más susceptible de uso de IA generativa (Tabla 8):
ConsumoClaro: revista digital de eldiario.es sobre consejos para consumo y bienestar.
TresB: firma de la agencia de contenidos TresB Comunicación con la que publica una variedad de artículos en distintas secciones de El Mundo y revistas de este periódico.
Todos los textos fueron publicados en el período de realización de la encuesta. La selección se hizo por orden cronológico inverso, desde el 30 abril de 2023. A cada texto se le asignó un código (A1, A2, A3...).
Tabla 7 20 textos de la muestra donde la firma es eldiario. es y El Mundo
Medio | Código | Artículos | Enlace | Sección |
---|---|---|---|---|
eldiario.es | A1 | Nuevas Generaciones se mofa de la edad de Francina Armengol y se ve obligado a borrar el tuit: “No ha sido afortunado” | https://www.eldiario.es/illes-balears/politica/nuevas-generaciones-mofa-edad-francina-armengol-juventud-eterna_1_10164970.html | Política |
A2 | Tregua en el calor: el fin de semana del puente bajarán las temperaturas hasta ocho grados | https://www.eldiario.es/sociedad/desplome-temperaturas-semana-puente-ocho-grados_1_10160298.html | Sociedad | |
A3 | ¿Cómo se ha colado el presidente de México entre los ‘streamers’ más vistos por encima de El Rubius o JuanGuarnizo? | https://www.eldiario.es/rastreador/colado-presidente-mexico-streamers-vistos-rubius-juan-guarnizo_132_10155822.html | El Rastreador (blog) | |
A4 | Juan Carlos I tiene una hija secreta de una relación con una aristócrata, según ‘El Confidencial’ | https://www.eldiario.es/politica/juan-carlos-i-hija-secreta-relacion-aristocrata_1_10155845.html | Política | |
A5 | Disney denuncia al gobernador de Florida Ron DeSantis por usar su poder como “venganza política” | https://www.eldiario.es/internacional/disney-denuncia-ron-desantis-gobernador-florida-venganza-politica_1_10154611.html | Internacional | |
A6 | El calor lleva a España al “riesgo extremo” de incendios: “Esto es el cambio climático” | https://www.eldiario.es/sociedad/espana-riesgo-extremo-incendios-semana-cambio-climatico_1_10152735.html | Sociedad | |
A7 | Borrell apunta al “levantamiento gradual de sanciones” a Venezuela si avanza hacia la “normalización democrática” | https://www.eldiario.es/internacional/colombia-fuerza-salida-guaido-plantarse-invitacion-cumbre-petro-venezuela_1_10148868.html | Internacional | |
A8 | La estrella de Fox News Tucker Carlson deja la cadena tras el caso por las mentiras sobre el fraude electoral | https://www.eldiario.es/internacional/estrella-fox-news-tucker-carlson-deja-cadena-caso-mentiras-fraude-electoral_1_10147400.html | Internacional | |
A9 | Interrumpida durante una hora la circulación de trenes de alta velocidad entre Madrid y Barcelona por un incendio próximo a la vía | https://www.eldiario.es/sociedad/interrumpida-temporalmente-circulacion-trenes-alta-velocidad-madrid-barcelona_1_10145030.html | Sociedad | |
A10 | La Aemet alerta de “temperaturas excepcionalmente altas”: claves sobre la ola de calor de los próximos días | https://www.eldiario.es/sociedad/aemet-alerta-temperaturas-excepcionalmente-altas-proximos-dias_1_10144520.html | Sociedad | |
El Mundo | A11 | Se tatúa en la muñeca la bajada del paro: “Estoy orgulloso del trabajo hecho” | https://www.elmundo.es/economia/2023/04/30/644e459421efa0b0788b45af.html | Economía (Comunidad Valenciana) |
A12 | El Parralejo, Montalvo y José Escolar, en El Batán desde el 5 de mayo | https://www.elmundo.es/cultura/toros/2023/04/29/644d0152fc6c83f6328b45cb.html | Cultura | |
A13 | El plan Almeida para mejorar la seguridad ciudadana: mano dura contra los okupas, la venta ambulante ilegal y los ‘narcopisos’ | https://www.elmundo.es/madrid/2023/04/29/644bea0521efa00b0e8b45d7.html | Madrid | |
A14 | Alicante Futura redobla su apuesta como referente ‘gamer’ para captar talento desde el Tossal Lab | https://www.elmundo.es/comunidad-valenciana/2023/04/28/644c082bfc6c83f8118b45c3.html | Comunidad Valenciana | |
A15 | RTVE relega la primera semifinal de Eurovisión a La 2 para evitar interrumpir MasterChef | https://www.elmundo.es/television/2023/04/28/644bf9e6fdddff61828b4576.html | Televisión | |
A16 | IU alerta del despido de 11.000 sanitarios en junio, pero la Junta replica que se les renovarán los contratos | https://www.elmundo.es/andalucia/2023/04/28/644bfc65e4d4d862658b4575.html | Andalucía | |
A17 | Las petroleras piden al Gobierno que les escuche para la actualización del PNIEC | https://www.elmundo.es/ciencia-y-salud/medio-ambiente/2023/04/28/644bee29fdddff46bb8b45db.html | Ciencia y Salud | |
A18 | Unicaja Banco se hunde un 9,94% en bolsa tras anunciar una caída del 43% en su beneficio por el impuesto de Sánchez | https://www.elmundo.es/economia/empresas/2023/04/28/644b7b9fe4d4d82a478b45a3.html | Economía | |
A19 | Una nueva polémica sacude al trapero Kidd Keo: armas, drogas, felaciones y eyaculaciones en su nuevo videoclip | https://www.elmundo.es/cultura/musica/2023/04/28/644ba29afdddff1f2d8b45b2.html | Cultura | |
A20 | Ocho personas arrestadas por estafar hasta dos millones de euros con la venta de bonos para estancias en hoteles | https://www.elmundo.es/andalucia/2023/04/28/644b9d6021efa07f788b4591.html | Andalucía |
Fuente: elaboración propia.
Tabla 8 10 textos firmados por TresB y ConsumoClaro para El Mundo y eldiario.es
Firma | Código | Artículos | Enlace | Sección |
---|---|---|---|---|
TresB | A21 | Los 10 azulejos más bonitos para cocinas blancas y modernas que son tendencia en 2023 | https://www.elmundo.es/yodona/lifestyle/2023/04/30/643fb84efdddfff6b38b4585.html | YoDona / LifeStyle |
A22 | ¿Cómo hacer tortitas de avena? Estas son las recetas más fáciles y saludables | https://www.elmundo.es/yodona/vida-saludable/2023/04/30/64418986fdddffb5248b4572.html | YoDona / Vida Saludable | |
A23 | Dieta proteica, todo lo que tienes que saber para adelgazar de manera saludable | https://www.elmundo.es/yodona/vida-saludable/2023/04/29/642b2a25fc6c837b328b45a5.html | YoDona / Vida Saludable | |
A24 | Este es el significado de las zapatillas colgadas en cables en algunos barrios | https://www.elmundo.es/como/2023/04/28/644bb5efe4d4d80f328b459f.html | Cómo | |
A25 | Clavaíto, de Chanel y Abraham Mateo: letra y vídeo | https://www.elmundo.es/cultura/musica/2023/04/28/644be29e21efa019378b4586.html | Cultura | |
ConsumoClaro | A26 | Las virtudes nutricionales de un puñado de aceitunas de aperitivo o en la ensalada | https://www.eldiario.es/consumoclaro/comer/virtudes-nutricionales-aceitunas-aperitivo-ensalada_1_10134339.html | ConsumoClaro |
A27 | ¿Cuál es la diferencia entre artritis y artrosis? | https://www.eldiario.es/consumoclaro/cuidarse/diferencia-entre-artritis-y-artrosis_1_10136126.html | ConsumoClaro | |
A28 | ¿En qué se diferencian el aceite de oliva virgen y virgen extra del normal? | https://www.eldiario.es/consumoclaro/comer/diferencia-aceite-oliva-normal-virgen-y-virgen-extra_1_10132428.html | ConsumoClaro | |
A29 | Las ventajas de blanquear los alimentos en lugar de cocerlos directamente | https://www.eldiario.es/consumoclaro/comer/ventajas-blanquear-alimentos-lugar-cocerlos-directamente_1_10082900.html | ConsumoClaro | |
A30 | Qué son las cookies | https://www.eldiario.es/consumoclaro/comer/torrijas-semana-santa-recetas-pan_1_10091700.html | ConsumoClaro |
Fuente: elaboración propia.
Los resultados de las valoraciones de ChatGPT se clasificaron en tres categorías:
Humano: textos identificados como probable o muy probablemente escritos por personas.
IA: textos identificados como probable o muy probablemente escritos total o parcialmente por una IA.
Incierto: textos para los que ChatGPT concluye que pueden haber sido escritos tanto por humanos como por una IA.
Por último, se calculó la precisión, la exhaustividad y la puntuación F1 como métricas de evaluación para IA (Dalalah y Dalalah, 2023; He et al., 2023), para medir la capacidad de ChatGPT
3.5 en la detección de textos sintéticos o humanos. Primero, se sometieron a una prueba de control los textos de Ana FutBot y Gabriele, y luego se analizaron los de El Mundo y eldiario.es, supuestamente creados por humanos. La comprobación de aciertos o errores de verdaderos/ falsos positivos y verdaderos/falsos negativos es crucial para evaluar la precisión en el análisis (Dalalah y Dalalah, 2023: 8).
3. Resultados
3.1 Encuesta
La encuesta fue respondida por Vicente Ruiz (El Mundo) y Ander Iñaki Oliden (eldiario.es), directores adjuntos de sus respectivos medios y responsables del desarrollo y estrategia digital de estos periódicos.
En ambos casos se afirmó no usar IA, aunque los dos medios reconocieron que estaban diseñando un plan para su aplicación. Por lo tanto, la sección 3 del cuestionario, para medios que sí utilizan IA, quedó sin respuestas.
En la sección 2, dirigida a medios que no utilizan IA, solo en el caso de El Mundo se señalaron la “falta de expertos en su desarrollo” y la “falta de expertos en su uso” como razones para no aplicar estas tecnologías, mientras que desde el eldiario.es no se concretó ninguna causa para su no aplicación.
Se encontraron discrepancias en el nivel de formación y destreza que tienen los periodistas en España para trabajar con IA. Mientras El Mundo considera que es “muy bajo”, el eldiario.es cree que es “alto”.
Sobre el grado de acuerdo/desacuerdo con que la IA es una amenaza para el empleo en el periodismo, ambos se expresaron “poco de acuerdo”, mientras que sobre la afirmación de que la IA es una amenaza para la ética periodística, El Mundo respondió “poco de acuerdo” y el eldiario.es, “medianamente de acuerdo”.
En la pregunta sobre si la IA ya puede o podrá en un futuro realizar actividades relacionadas con el periodismo sin supervisión humana hubo coincidencia en la respuesta: “no”. Igualmente, sobre la importancia de incorporar ingenieros y perfiles tecnológicos en las redacciones para la gestión y uso de IA, ambos contestaron que es “bastante importante”.
3.2 Resultados del experimento
3.2.1 Prueba de control
ChatGPT identificó los 10 textos creados por Ana Futbot como contenido generado por IA (Tabla 9).
Tabla 9 Textos de Ana Futbot analizados por ChatGPT
Texto | Respuesta de ChatGPT |
---|---|
C1 | Este texto parece haber sido generado por una inteligencia artificial. Aunque contiene información sobre un partido de fútbol y proporciona detalles sobre los goles, tarjetas y clasificación de los equipos, presenta una estructura y un estilo bastante neutral y descriptivo, típicos de la redacción generada por IA. |
C2 | Este texto tiene características similares a los anteriores, lo que sugiere que también ha sido generado por una inteligencia artificial. Proporciona detalles sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en una forma neutral y descriptiva. |
C3 | Este texto también parece haber sido generado por una inteligencia artificial. Al igual que los anteriores, presenta una estructura y un estilo neutral y descriptivo, proporcionando información sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos. |
C4 | Este texto también parece haber sido generado por una inteligencia artificial. Al igual que los anteriores, presenta una estructura y un estilo neutral y descriptivo, proporcionando información sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos. |
C5 | Este texto también presenta características similares a los anteriores y parece haber sido generado por una inteligencia artificial. Proporciona información sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en una forma neutral y descriptiva. |
C6 | Este texto tiene características similares a los anteriores y sugiere que ha sido generado por una inteligencia artificial. Proporciona información detallada sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos. La redacción es neutral y descriptiva en estilo. |
C7 | Este texto también presenta características similares a los anteriores y parece haber sido generado por una inteligencia artificial. Proporciona información detallada sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en una forma neutral y descriptiva. |
C8 | Este texto sigue las mismas características que los anteriores y es probable que haya sido generado por una inteligencia artificial. Proporciona información detallada sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en un estilo neutral y descriptivo. |
C9 | Este texto presenta características similares a los anteriores y parece haber sido generado por una inteligencia artificial. Proporciona información detallada sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en un estilo neutral y descriptivo. |
C10 | Este texto sigue las mismas características que los anteriores y es probable que haya sido generado por una inteligencia artificial. Proporciona información detallada sobre el partido de fútbol, los goles, el marcador, la clasificación de los equipos y los próximos enfrentamientos en un estilo neutral y descriptivo. |
Fuente: ChatGPT. Elaboración propia.
ChatGPT también identificó los 5 textos creados por Gabriele como contenido sintético (Tabla 10).
Tabla 10 Textos de Gabriele analizados por ChatGPT
Texto | Respuesta de ChatGPT |
---|---|
C11 | Este texto parece ser generado por una inteligencia artificial. Contiene información factual sobre el precio y la volatilidad del Ethereum, pero la forma en que está estructurado y la manera en que se explica el concepto de volatilidad sugieren que fue generado por un programa de generación de texto. Además, el uso de frases y términos técnicos comunes en el ámbito financiero y de las criptomonedas también apunta a una generación automatizada. |
C12 | Este texto también parece ser generado por una inteligencia artificial. Al igual que el texto anterior, contiene información factual sobre el precio y la volatilidad del Decentraland, pero la forma en que se estructura y se explica el concepto de volatilidad sugiere una generación automatizada. El uso de frases y terminología técnica comunes en el ámbito financiero y de las criptomonedas es otro indicio de que este texto fue generado por una IA. |
C13 | Este texto parece ser generado por una inteligencia artificial. Al igual que los anteriores, contiene información factual sobre el precio y la volatilidad del Bitcoin, pero la estructura y la forma en que se explica el concepto de volatilidad sugieren que fue generado automáticamente. El uso de frases y terminología técnica comunes en el ámbito financiero y de las criptomonedas también respalda esta conclusión. |
C14 | Este texto también parece ser generado por una inteligencia artificial. Al igual que los anteriores, presenta una estructura y una explicación del concepto de volatilidad típicas de la generación automatizada de texto. Además, utiliza terminología financiera y de criptomonedas de forma consistente con la generación automatizada. |
C15 | Este texto también parece ser generado por una inteligencia artificial. Al igual que los anteriores, contiene información factual sobre el precio y la volatilidad del Solana, pero la estructura y la explicación del concepto de volatilidad siguen los patrones de generación automatizada. Además, el uso de terminología financiera y de criptomonedas es consistente con la generación automatizada de texto. |
Fuente: ChatGPt. Elaboración propia.
Los resultados de las métricas de evaluación para C1-C15 (Tablas 11 y 12) sugieren que ChatGPT 3.5 puede identificar textos generados por IA sin error.
Tabla 11 Recuento de verdaderos positivos, falsos positivos y falsos negativos de C1-C15
Verdaderos positivos (textos detectados correctamente como generados por IA) | 15 |
---|---|
Falsos positivos (textos detectados como generados por humanos, pero que en realidad fueron creados por IA) | 0 |
Falsos negativos (textos detectados como generados por IA, pero que en realidad fueron creados por humanos). | 0 |
Fuente: elaboración propia.
Tabla 12 Métricas de evaluación sobre el uso de ChatGPT como detector del uso de IA para la muestra C1-C15
Precisión (valor predictivo positivo) | VP / (VP + FP) = 15 / (15 + 0) = 1.0 (100%) |
---|---|
Exhaustividad (sensibilidad o recall) | VP / (VP + FN) = 15 / (15 + 0) = 1.0 (100%) |
Puntuación F1 (medida combinada de precisión y exhaustividad) | 2 * (Precisión * Exhaustividad) / (Precisión + Exhaustividad) = 2 * (1.0 * 1.0) / (1.0 + 1.0) = 1.0 (100%) |
Fuente: elaboración propia.
3.2.2 Análisis de textos de El Mundo y eldiario.es
Una vez comprobado que ChatGPT 3.5 ofrece indicios fiables de uso de IA en textos sintéticos, se solicitó al chatbot que valorase los 30 artículos supuestamente escritos por periodistas para de El Mundo y eldiario.es (Tablas 7 y 8). Las respuestas y resultados se recogen en la Tabla 13.
Tabla 13 Resultados de ChatGPT para 30 textos no firmados por periodistas (A1-A30)
Texto | Respuesta de ChatGPT | Resultado | |||
---|---|---|---|---|---|
A1 | El texto proporcionado parece ser una recopilación de información y citas relacionadas con un incidente específico que involucra a Nuevas Generaciones del Partido Popular (PP) y la presidenta de Balears y candidata socialista a la reelección, Francina Armengol. No puedo determinar si fue escrito total o parcialmente por una inteligencia artificial, ya que se trata de un conjunto de declaraciones y opiniones recopiladas de diversas fuentes. Si deseas más información sobre el tema o tienes alguna otra pregunta, no dudes en decírmelo. | Incierto | |||
A2 | A simple vista, el texto proporcionado parece ser un informe meteorológico que describe la influencia de una masa de aire caliente y seca en España, junto con pronósticos de temperaturas para los días siguientes. No es posible determinar con certeza si fue escrito total o parcialmente por una inteligencia artificial, ya que contiene información objetiva y no hay características distintivas que indiquen su origen. Puede haber sido redactado por un humano o generado por un programa de IA especializado en la redacción de informes meteorológicos. | Incierto | |||
A3 | Basándome en el texto que proporcionaste, parece que fue escrito por una persona y no por una inteligencia artificial. El texto presenta un estilo narrativo y contiene información actual y opiniones de diferentes personas, incluidos los streamers mencionados. No muestra señales evidentes de haber sido generado por una IA. | Humano | |||
A4 | Dado el contenido del texto proporcionado, no puedo determinar de manera definitiva si fue escrito total o parcialmente por una inteligencia artificial. El texto parece ser un artículo periodístico que informa sobre la supuesta existencia de una cuarta hija del rey Juan Carlos I y presenta declaraciones contradictorias tanto de fuentes anónimas como de personas involucradas. Para confirmar si el texto fue escrito por una inteligencia artificial, se requeriría información adicional sobre su origen y autoría. | Incierto | |||
A5 | A simple vista, el texto que me mostraste no parece haber sido generado por una inteligencia artificial. Tiene una estructura coherente y utiliza un lenguaje natural sin indicios claros de haber sido generado automáticamente. Sin embargo, ten en cuenta que no puedo asegurarte con certeza absoluta si el texto fue escrito por una persona o una IA, ya que no tengo acceso a información adicional sobre su origen. Mi análisis se basa únicamente en el texto proporcionado. | Humano | |||
A6 | Basado en el análisis del texto proporcionado, no hay indicios de que haya sido escrito total o parcialmente por una inteligencia artificial. El texto parece tener un estilo informativo y descriptivo típico de un artículo periodístico o una publicación científica. Sin embargo, ten en cuenta que soy una inteligencia artificial y no tengo acceso a información sobre la autoría específica de textos a menos que se mencione explícitamente. Mi evaluación se basa únicamente en el contenido y el estilo del texto que has proporcionado. | Humano | |||
A7 | El texto proporcionado parece haber sido escrito por un ser humano y no muestra señales claras de haber sido generado total o parcialmente por una inteligencia artificial. No obstante, ten en cuenta que las evaluaciones de este tipo pueden ser subjetivas y dependen del contexto. Si tienes más preguntas o necesitas ayuda adicional, no dudes en preguntar. | Humano | |||
A8 | Basado en el texto proporcionado, no parece que haya sido generado por una inteligencia artificial. El contenido parece ser un informe sobre eventos actuales relacionados con la cadena Fox News y la salida de Tucker Carlson, así como la salida del presentador Don Lemon de CNN. No se observan características o patrones distintivos que indiquen que el texto haya sido escrito por una IA. | Humano | |||
A9 | Basándome en el texto que me has proporcionado, no puedo determinar con certeza si fue escrito total o parcialmente por una inteligencia artificial. El contenido del texto parece ser una noticia relacionada con la interrupción del servicio de trenes de alta velocidad entre Madrid-Puerta de Atocha Almudena Grandes y Barcelona Sants debido a un incendio cercano a la vía. Este tipo de información puede ser redactada tanto por humanos como por sistemas automatizados, por lo que es difícil hacer una afirmación definitiva sin más contexto. | Incierto | |||
A10 | El texto proporcionado parece ser una transcripción de un informe o pronóstico meteorológico realizado por la Agencia Estatal de Meteorología (Aemet). No muestra indicios claros de haber sido generado por una inteligencia artificial, ya que se trata de una información basada en datos y observaciones climáticas, típicamente proporcionada por organismos meteorológicos o expertos en el campo. Por lo tanto, es probable que este texto haya sido escrito por humanos en lugar de una inteligencia artificial. | Humano | |||
A11 | Basándome en el texto proporcionado, no hay indicios claros de que haya sido escrito total o parcialmente por una inteligencia artificial. El texto parece ser una noticia o un artículo sobre el secretario autonómico de Empleo de la Generalitat Valenciana, Enric Nomdedéu, y sus declaraciones sobre la bajada del desempleo en la Comunidad Valenciana. No hay características específicas que indiquen la participación de una inteligencia artificial en la redacción del texto. | Humano | |||
A12 | Basándome en el texto proporcionado, no hay indicios claros de que haya sido escrito total o parcialmente por una inteligencia artificial. El contenido se refiere a eventos relacionados con corridas de toros y exhibiciones en la Plaza de Toros de Las Ventas, así como a la realización de tentaderos didácticos con alumnos destacados de la Escuela de Tauromaquia José Cubero 'Yiyo'. Estos son temas que pueden ser redactados tanto por personas como por inteligencias artificiales. Por lo tanto, no puedo determinar con certeza si este texto fue escrito por una inteligencia artificial o por un humano. | Humano | |||
A13 | No puedo determinar con certeza si el texto fue escrito total o parcialmente por una inteligencia artificial. Sin embargo, el texto parece ser una recopilación de declaraciones y propuestas atribuidas a José Luis Martínez-Almeida, candidato del Partido Popular a la alcaldía de Madrid, en un coloquio. Es posible que haya sido redactado por un humano, ya sea un periodista o un equipo de redacción, para informar sobre las posturas y propuestas del candidato en relación a la seguridad en la ciudad. | Humano | |||
A14 | El texto que me has mostrado parece haber sido escrito por una persona y no por una inteligencia artificial. No se observan características típicas de generación de texto automatizada en el contenido o en el estilo de escritura. Sin embargo, ten en cuenta que mi capacidad para detectar la autoría exacta de un texto es limitada, y siempre existe la posibilidad de que haya sido generado parcial o totalmente por una inteligencia artificial sin que sea evidente en su contenido. | Humano | |||
A15 | No puedo determinar con certeza si el texto fue escrito total o parcialmente por una inteligencia artificial. El texto parece ser una recopilación de información sobre Eurovisión 2023, incluyendo detalles sobre las semifinales, los participantes y el orden de las actuaciones. Es posible que haya sido generado por un redactor humano recopilando información de diversas fuentes. Sin más contexto o detalles sobre su origen, no puedo confirmar si una inteligencia artificial estuvo involucrada en la redacción de este texto. | Humano | |||
A16 | El texto proporcionado parece ser escrito por un ser humano y no muestra indicios de haber sido generado total o parcialmente por una inteligencia artificial. | Humano | |||
A17 | Basándome en el texto proporcionado, no parece haber indicios de que haya sido escrito total o parcialmente por una inteligencia artificial. El texto se enfoca en informar sobre la Asociación Española de Operadores de Productos Petrolíferos (AOP), su petición de participar en el proceso consultivo para elaborar el nuevo Plan Nacional Integrado de Energía y Clima (PNIEC) y los proyectos de descarbonización y sustitución de fuentes energéticas impulsados por las empresas miembro de AOP. Además, se mencionan los objetivos del PNIEC en cuanto a la reducción de emisiones de gases de efecto invernadero. En general, el texto parece haber sido redactado por un autor humano. | Humano | |||
A18 | Basándome en el texto proporcionado, no parece que haya sido generado por una inteligencia artificial. El texto describe la caída de las acciones de Unicaja Banco, así como su informe de beneficios y otros datos financieros relacionados. No hay indicadores claros de que haya sido producido por una IA, sino que parece ser un informe o artículo escrito por una persona. | Humano | |||
A19 | Basado en el texto proporcionado, no puedo afirmar con certeza si fue escrito total o parcialmente por una inteligencia artificial. El texto parece ser una descripción o artículo que aborda la polémica en torno a las letras y los videoclips del rapero Kidd Keo. Aunque la redacción es coherente, es difícil determinar si fue generada por una persona o por una inteligencia artificial sin más información sobre su origen. | Humano | |||
A20 | Basado en el texto proporcionado, no parece haber indicios de que haya sido escrito total o parcialmente por una inteligencia artificial. El contenido se refiere a la desarticulación de una organización criminal involucrada en estafas relacionadas con bonos de hotel, y describe sus métodos y objetivos. No se detectan patrones o características típicas de la generación de texto por parte de una IA. | Humano | |||
A21 | El texto que has proporcionado parece ser escrito por un autor humano y no muestra señales claras de haber sido generado por una inteligencia artificial. Contiene descripciones, consejos y sugerencias relacionadas con las tendencias de diseño de cocinas en el año 2023, así como recomendaciones sobre azulejos y combinaciones de colores. | Humano | |||
A22 | El texto que me has mostrado no parece haber sido escrito por una inteligencia artificial en su totalidad. Contiene información sobre las cantidades recomendadas de consumo de avena, las calorías de las tortitas de avena, los beneficios de consumir avena, instrucciones sobre cómo hacer tortitas de avena, y diversas recetas de tortitas de avena. Aunque podría haberse generado con la ayuda de una inteligencia artificial, es más probable que haya sido escrito por un autor humano recopilando información y proporcionando consejos relacionados con las tortitas de avena. | Humano | |||
A23 | No puedo determinar con certeza si el texto fue escrito totalmente o parcialmente por una inteligencia artificial. Sin embargo, la redacción y el contenido del texto parecen seguir una estructura y estilo coherentes, y abordan información relacionada con la dieta proteica de manera objetiva. Es posible que haya sido redactado por un autor humano o generado con la ayuda de una inteligencia artificial con instrucciones específicas. | Incierto | |||
A24 | Basándome en el texto proporcionado, no puedo determinar con certeza si fue escrito total o parcialmente por una inteligencia artificial. El texto parece ser una recopilación de información y teorías sobre el fenómeno de las zapatillas colgadas en cables. Dado que los temas abordados son ampliamente conocidos y se pueden encontrar en diversas fuentes, es posible que haya sido redactado por un ser humano recopilando información de diferentes fuentes. Sin embargo, no puedo descartar la posibilidad de que haya sido generado por una inteligencia artificial. | Incierto | |||
A25 | Basándome en el texto proporcionado, no hay indicios claros de que haya sido escrito total o parcialmente por una inteligencia artificial. El texto describe un nuevo sencillo de Chanel Terrero en colaboración con Abraham Mateo, menciona detalles sobre el videoclip y la letra de la canción, así como antecedentes de los artistas. Este tipo de información puede ser fácilmente generada por un escritor humano. Sin más contexto o características específicas del texto que indiquen la intervención de una inteligencia artificial, no es posible determinar con certeza si fue escrito por una IA o no. | Humano | |||
A26 | Basado en el texto proporcionado, no hay indicios claros de que haya sido escrito total o parcialmente por una inteligencia artificial. El texto parece presentar información sobre las aceitunas y sus beneficios para la salud, incluyendo datos nutricionales y estudios científicos. Puede ser resultado de la redacción humana o generada por un modelo de lenguaje similar al mío. Sin embargo, sin información adicional, no puedo determinar con certeza si una inteligencia artificial estuvo involucrada en su creación. | Humano | |||
A27 | A simple vista, el texto que me has mostrado parece haber sido escrito por un ser humano y no por una inteligencia artificial. La redacción es coherente y presenta información detallada sobre las diferencias entre la artritis y la artrosis, así como los posibles tratamientos para cada una de ellas. Sin embargo, ten en cuenta que mi análisis se basa únicamente en el contenido del texto y no puedo proporcionar una afirmación definitiva sobre su autoría. | Humano | |||
A28 | A simple vista, el texto parece haber sido escrito por un ser humano y no por una inteligencia artificial. Sin embargo, no puedo determinar con certeza si fue escrito totalmente por una persona o si se utilizó alguna ayuda de IA en su redacción. Es importante tener en cuenta que el texto contiene información precisa sobre el proceso de obtención del aceite de oliva y las diferencias entre las distintas categorías, lo cual sugiere un conocimiento especializado en el tema. En última instancia, se requeriría más información o contexto para realizar una evaluación más precisa. | Humano | |||
A29 | El texto que me has mostrado parece ser escrito por una persona y no por una inteligencia artificial. No se observan patrones o características específicas que indiquen una generación automatizada de contenido. El texto presenta una estructura coherente y utiliza lenguaje natural comúnmente utilizado al hablar sobre técnicas culinarias. | Humano | |||
A30 | Basándome en el texto proporcionado, no parece haber sido escrito total o parcialmente por una inteligencia artificial. El texto contiene información detallada sobre la elaboración de las torrijas, proporcionando diferentes variantes y recomendaciones para utilizar distintos tipos de pan. La redacción parece ser coherente y sigue un estilo descriptivo típico de un autor humano. | Humano |
Fuente: ChatGPT. Elaboración propia.
En 24 textos el resultado fue “humano” (80 %), en 6 fue “incierto” (20 %) y en ninguno se detectó claramente IA generativa (0 %) (Figura 2).
Aceptando que los 30 textos fueron escritos por humanos, basándonos en las afirmaciones de los encuestados, calculamos la precisión, la exhaustividad y la puntuación F1 como métricas de evaluación de la capacidad de ChatGPT 3.5 en la detección de textos generados por máquinas o humanos. Los resultados se recogen en las Tablas 14 y 15.
Tabla 14 Recuento de verdaderos positivos, falsos positivos, falsos negativos de A1-A30
Verdaderos positivos (textos identificados por ChatGPT como probable o muy probablemente escritos por humanos) | 24 |
---|---|
Falsos positivos (textos identificados por ChatGPT como claramente escritos por IA) | 0 |
Falsos negativos (textos no identificados correctamente por ChatGPT, con resultados inciertos) | 6 |
Fuente: elaboración propia.
Tabla 15 Métricas de evaluación sobre el uso de ChatGPT como detector del uso de IA para la muestra A1-A30
Precisión (valor predictivo positivo) | VP / (VP + FP) = 24 / (24 + 0) = 1.0 (100%) |
---|---|
Exhaustividad (sensibilidad o recall) | VP / (VP + FN) = 24 / (24 + 6) = 0.8 (80%) |
Puntuación F1 (medida combinada de precisión y exhaustividad) | 2 * (Precisión * Exhaustividad) / (Precisión + Exhaustividad) = 2 * (1.0 * 0.8) / (1.0 + 0.8) = 1.6 / 1.8 = 0.888 (88.8%) |
Fuente: elaboración propia.
4. Discusión y conclusiones
Este estudio explora mediante triangulación de métodos el uso de IA en dos periódicos digitales españoles, uno matricial y de tendencia conservadora y otro nativo y progresista. El hecho de que la encuesta fuese respondida por dos de los nueve periódicos inicialmente seleccionados nos hace plantear la hipótesis de que, al menos algunos de los medios contactados, querrían proteger sus posibles estrategias y usos actuales o futuros de IA en distintos procesos y fases de desarrollo y aplicación.
Con las respuestas obtenidas de El Mundo y eldiario.es reorientamos el estudio hacia un muestreo por conveniencia sobre el que realizar un análisis comparativo. La encuesta fue el paso previo necesario para la realización del experimento con el que comprobar las afirmaciones de los responsables de estos medios respecto al uso de IA, particularmente, en la generación de contenidos en sus sitios web.
Los resultados muestran que en estos medios referentes en España la IA es aún una posibilidad, un futurible sobre el que se están diseñando estrategias para su implementación (OB1). Esta no aplicación en las rutinas productivas sugiere que no existen todavía el conocimiento y la formación necesarios para su integración en las redacciones, lo que se confirmó en el caso de El Mundo. Si bien desde eldiario.es no se precisaron los motivos (desde este medio afirmaron que el nivel de formación y destreza de los periodistas en España para trabajar con IA es “alto”), esta discrepancia es sustancial y podría ser fruto de la realidad de cada medio, con equipos con formación y destrezas distintas debido a su carácter nativo o matricial, o podría ser fruto de una visión subjetiva y generalizada sobre el sector (OB1).
En ningún caso se especificó “desconocimiento sobre sus aplicaciones” para no utilizar IA, “falta de recursos económicos”, “no la vemos útil” o “no se ha planteado su utilización”. De hecho, ambos periódicos confesaron estar diseñando planes para su aplicación, por lo que parece existir interés concreto y conocimiento sobre el potencial y posibilidades de la IA. De esto se podría deducir un reconocimiento implícito de su utilidad, además de resultar viable económicamente, en consonancia con lo descubierto en estudios previos como el de Sánchez-García et al. (2023), que diagnosticaban la rentabilidad de la implantación de IA en los procesos periodísticos y detectaban un interés creciente de los medios en esta tecnología, si bien advertían de “un avance dispar que refleja «lentitud», «desconfianza» y «desconocimiento» ante la aplicación de IA” (p. 2).
En ambos casos sorprende la no aplicación de IA en el momento del estudio, pues hay constancia de que otros medios en España sí la están aplicado ya, por ejemplo, en sistemas de alertas y generación automática de textos. RTVE, Agencia EFE, el diario deportivo Sport o El Jonfidencial ya han experimentado con IA (Tejedor et al., 2021; Fieiras-Ceide, Vaz-Álvarez y Túñez-López, 2022). Particularmente interesante es el caso de Rl Jonfidencial, ya que se trata de un periódico nativo digital generalista y de ámbito estatal que formaba parte de nuestra primera muestra intencional y del que aprovechamos sus textos sintéticos para nuestra prueba de control. Rl Jonfidencial es competidor directo de eldiario.es y de El Mundo como periódico nativo digital y de tendencia conservadora. Sus experimentaciones con Ana Futbot comenzaron a publicarse el 22 de diciembre de 2018 y finalizaron el 24 de marzo de 2019, según consta en su hemeroteca. La experiencia fue efímera, pero con esta IA generativa Rl Jonfidencial marcó un hito al convertirse en el primer periódico generalista en España en aplicar esta tecnología para la escritura automática de crónicas deportivas, aparentemente con “más beneficios que perjuicios” (Rojas Torrijos y Toural Bran, 2019: 251).
La ausencia de respuestas por parte de los medios, la breve vida de Ana Futbot como periodista robot y la no utilización de IA en El Mundo y eldiario.es sugieren que el desarrollo y aplicación de IA en la prensa española está aún en una fase inicial, cuatro años después de aquella primera iniciativa. Esto se confirma en las respuestas de El Mundo y eldiario.es, que reconocen que no utilizan esta tecnología, aunque contemplan su empleo en el futuro, lo que también coincide con las observaciones de Sánchez-García et al. (2023) al advertir la “reticencia actual de los medios a afrontar y asumir la inexorable expansión de la IA, dejando a las empresas de ingeniería el papel de adalides del proceso de disrupción tecnológica” (Sánchez-García et al., 2023: 13), y de Mondría-Terol (2023), quien a partir de tres casos de estudio españoles (RTVE, El País y Newtral), identifica dos desafíos principales en las redacciones: “la resistencia de los trabajadores” a la implementación de IA y “la falta de habilidades técnicas necesarias” para su utilización (Mondría-Terol, 2023: 56).
La “falta de expertos” en su desarrollo y uso, y un nivel de formación y de destreza de los periodistas para trabajar con IA “muy bajo”, según El Mundo, refuerza la idea de un importante atraso en la prensa generalista española respecto a otros medios internacionales que vienen aplicando IA desde la década de 2010 (Tejedor et al., 2021: 974). Esto podría estar relacionado con carencias formativas sobre IA en el ámbito universitario español (Gómez-Diago, 2022), donde se observa “un grado de consenso alto en la necesidad de incorporar la IA en las facultades de Comunicación” (Lopezosa et al., 2023: 7). Esta interpretación choca con la del responsable de eldiario.es, quien cree que el nivel de los periodistas españoles para trabajar con IA es “alto”. Quizás ambas teorías tengan parte de razón, ya que podríamos estar en un escenario en el que los periodistas que trabajan en las redacciones tengan menos destrezas y conocimientos que otros profesionales del sector tecnológico.
Sánchez-García et al. (2021: 9) identificaron perfiles periodísticos integrados en empresas tecnológicas y centros de investigación con base en España que ofrecen soluciones de IA para medios, aunque predominan perfiles técnicos, centrados en ingenierías de telecomunicaciones o informática. En relación con esto, El Mundo y eldiario.es coinciden en que es “bastante importante” incorporar ingenieros y perfiles tecnológicos en las redacciones para la gestión y uso de IA.
La realidad es que el conocimiento sobre IA se halla fuera de los medios, donde existe un “«músculo» tecnológico español que desarrolla servicios o programas informáticos aplicables al periodismo automatizado” (Sánchez-García et al., 2023: 7). Las investigadoras de la Universidad de Valladolid publicaron en 2023 el primer catálogo de empresas tecnológicas y centros de investigación en España que ofrecen herramientas y servicios de IA para su integración y aplicación en medios de comunicación. En total, son 25 desarrolladores de IA con servicios y herramientas disponibles para todo el proceso periodístico, aunque predominan para la recogida de información y distribución de contenido relacionado con la monetización, mientras que la producción automatizada de noticias queda relegada a un segundo plano (SánchezGarcía et al., 2023: 1-2).
Tal y como apuntaron Ufarte-Ruiz y Manfredi-Sánchez (2019) hace unos años, tampoco ahora parece que los periodistas españoles de prensa puedan verse amenazados, de momento, por la IA generativa (ambos medios responden “poco de acuerdo” a si “la IA es una amenaza para el empleo en el periodismo”). Sin embargo, y, aunque en la pregunta “¿cree que la IA ya puede o podrá en un futuro realizar actividades relacionadas con el periodismo sin supervisión humana?” hubo coincidencia en la respuesta (“no”), lo cierto es que ya existen medios que elaboran y distribuyen contenidos informativos a partir de procedimientos ejecutados únicamente por máquinas, en los que no hay intervención de ningún periodista (Ufarte-Ruiz et al., 2023). Donde sí hay discrepancia es sobre si “la IA es una amenaza para la ética periodística” (“poco de acuerdo” / “medianamente de acuerdo”), en línea con el diagnóstico previo de que el uso de IA es beneficioso siempre y cuando se mantengan los criterios éticos y la línea editorial (Beckett, 2019).
Con respecto a lo anterior surge un dilema ético, que es si los medios, como servicio público, deberían ser transparentes en el uso de IA y, por lo tanto, si los usuarios deberían tener derecho a conocer que determinados contenidos, interacciones o resultados del uso de estos medios son fruto de algún tipo de IA. El conocimiento del público debería extenderse a “los diseños éticos explícitos, que describen cómo se integran los principios éticos en la práctica del diseño de software” y que “representan información valiosa que las organizaciones podrían divulgar para respaldar su posición ética” (Turilli y Floridi, 2009: 105).
En la prueba de control previa realizada en el experimento, ChatGPT mostró total fiabilidad (100 % de acierto) en la detección de textos generados por IA, lo que supone la utilidad de este tipo de chatbots como herramientas de autoverificación de sí mismos (OB2). Es cierto que la versión de ChatGPT utilizada tiene limitaciones, la fundamental, su dependencia de datos previos, ya que su conocimiento se basa en los datos con los que fue entrenado hasta septiembre de 2021 (Vaishya et al., 2023), lo que significa que no tiene acceso a información que haya ocurrido después de esa fecha (como los textos analizados A1-A30), a menos que se le proporcionen explícitamente. Pero en nuestro estudio mostró una precisión del 100 % en la identificación, mediante patrones, de textos sintéticos generados antes y después de su entrenamiento, en el caso de Ana Futbot, en 2019, y en el de Gabriele, en 2022. Ufarte-Ruiz y Manfredi-Sánchez (2019) pusieron a prueba a Gabriele mediante valoraciones personales de 145 periodistas. Sus resultados afirman que, aunque esta IA contribuye a incrementar la productividad de contenidos, “no permite todavía generar textos de naturaleza compleja o no predecible, una cualidad humana de entre las muchas de las que adolecen aún los robots” (Ruiz y Manfredi-Sánchez, 2019: 227). Tal vez sea esa carencia la que posibilita que Gabriele sea fácilmente detectable para ChatGPT.
Los resultados son más dudosos o inciertos cuando los textos son, supuestamente, creados por humanos. De los 30 artículos de El Mundo y eldiario.es, ChatGPT devolvió en un 80 % de los casos una respuesta casi segura de que no hubo intervención total o parcial de alguna IA (en el 20 % restante el resultado fue “incierto”), aunque también es destacable que no detectó claramente ningún caso de uso de IA. La puntuación F1 (medida combinada de precisión y exhaustividad) para ChatGPT fue del 88,8 %, un porcentaje considerable y comparable al de detectores de IA sometidos a análisis (He et al., 2023).
Si bien reconocemos las limitaciones de usar muestreos intencionales y por conveniencia, no probabilísticos y limitados en el número de actores mediáticos, así como la imposibilidad de descartar el uso de IA en otros contenidos de los medios analizados, los resultados son útiles para obtener indicios de generación de textos con IA porque las pruebas de control refuerzan este enfoque y sus resultados. La parte experimental resulta útil para considerar y seguir desarrollando este enfoque metodológico en nuevas investigaciones, sobre todo con herramientas más avanzadas y diseñadas exprofeso para la detección de IA, y utilizando un mayor corpus documental de textos encuadrados en cada una de las categorías (humanos y generados con IA).
Esta investigación complementa trabajos previos y simultáneos como los de Sánchez-García et al. (2023), Mondría-Terol (2023), Tejedor et al. (2021), Rojas-Torrijos y Toural-Bran (2019) y Ufarte-Ruiz y Manfredi-Sánchez (2019), y todos apuntan a que la aplicación de IA en los medios digitales generalistas en España está aún en un estadio de desarrollo embrionario y de exploración, particularmente en la generación de contenidos.