IA y LinkedIn ·

La IA generativa incestuosa ya está aquí

¿Conoces a los Whittaker? La pregunta suena rara como punto de partida para hablar de inteligencia artificial, pero su historia ayuda a entender uno de los riesgos más incómodos del momento: qué ocurre cuando un sistema empieza a reproducirse dentro de sus propios límites, alimentándose una y otra vez de la misma materia hasta deformarla.

Te cuento primero la historia de esta familia y luego la conectamos con lo que está pasando ahora mismo en la red.

Por Mario Pérez

Ilustración plana en plano cerrado de un retrato dinástico real al estilo del siglo XVII (tipo Habsburgo): una familia de la realeza con el mismo rostro repetido en todos sus miembros (cara alargada, mandíbula prominente, labio inferior abultado y largas pelucas rizadas), con el rey al centro luciendo una banda azul, entre cortinajes de terracota sobre fondo crema, evocando la endogamia generativa de la IA que se reproduce consigo misma.

Quiénes son los Whittaker

La familia Whittaker se dio a conocer en 2004, cuando el fotógrafo Mark Laita llegó hasta ellos mientras recorría Estados Unidos con Created Equal, un proyecto dedicado a retratar realidades sociales, culturales y humanas muy diversas, incluidas personas situadas en los márgenes de la visibilidad pública. Aquel trabajo lo llevó hasta Odd, una pequeña comunidad rural de Raleigh County, en Virginia Occidental, donde encontró a una familia que llevaba años viviendo en condiciones de aislamiento, pobreza y exposición vecinal.

Según ha contado Laita, al llegar a la zona lo recibieron con insultos y amenazas de vecinos que querían impedir que se acercara. La reacción tenía un motivo claro: la familia ya había sido observada, comentada y ridiculizada por extraños. En un entorno así, cualquiera con una cámara podía convertirse en otra mirada dispuesta a tratarlos como una rareza. La protección de los vecinos no quitaba dureza a la escena, y a la vez explicaba el rechazo inicial hacia alguien que llegaba desde fuera a fotografiar.

La primera impresión fue desconcertante. Antes de ver a la familia, Laita escuchó ladridos y ruidos extraños que lo mantuvieron alerta por si había un perro peligroso cerca. Pronto entendió que aquellos sonidos venían de Ray Whittaker, uno de los miembros más reconocibles. Ray se comunicaba con gruñidos, ladridos y gestos, en una mezcla difícil de clasificar desde fuera. En los vídeos posteriores de Soft White Underbelly su presencia se vuelve casi imposible de olvidar, porque obliga al espectador a enfrentarse a una forma de comunicación que queda fuera de las categorías habituales.

Ray acompañó a Laita hasta la casa, y allí conoció a buena parte del núcleo familiar: Betty, Lorene, Ray, Larry, Kenneth y Timmy, hijo de Lorene y sobrino del resto. Todos presentaban deformidades físicas evidentes, retrasos cognitivos y graves dificultades de comunicación. También compartían una semejanza física inquietante, como si sus rostros fueran variaciones de una misma estructura repetida. Laita había llegado hasta una familia endogámica cuya historia de relaciones entre parientes cercanos se remonta, según las reconstrucciones genealógicas disponibles, al siglo XIX.

El paso de los años, el aislamiento y las relaciones incestuosas habían hecho de los Whittaker una familia atrapada en su propio código genético, condenada a repetir las mismas limitaciones hasta convertir la herencia familiar en una forma visible de deterioro. La imagen es dura, incluso incómoda, y precisamente por eso funciona como metáfora de otro proceso que ya está ocurriendo a escala digital.

El bucle: una IA que se alimenta de IA

La inteligencia artificial se alimenta del contenido publicado en Internet, y a la vez Internet se llena cada día de contenido generado por inteligencia artificial. Cada texto escrito por IA y subido a una web, cada descripción de producto producida en masa, cada artículo SEO fabricado para posicionar sin aportar gran cosa, cada imagen sintética subida a un banco de recursos, cada vídeo con voz artificial, guion artificial, cara artificial y emoción artificial pasa a formar parte del ecosistema digital. Y una parte de ese ecosistema acaba, directa o indirectamente, alimentando a nuevos modelos.

Ahí empieza el bucle. La IA aprende de Internet, Internet se llena de IA y la siguiente generación de modelos vuelve a aprender de ese Internet cada vez más sintético. La famil-IA Whittaker (sí, el juego de palabras era inevitable) habita ahora en una red saturada de autorreferencias, lejos de cualquier montaña de Virginia Occidental. Un sistema que se enreda en sus propios resultados hasta convertir la producción de contenido en una mancha blanca de textos, imágenes, vídeos y canciones que parecen distintos, aunque comparten el mismo ADN estadístico.

Colapso del modelo: cuando el sistema se queda sin rarezas

A este fenómeno se le suele llamar model collapse, o colapso del modelo. Investigadores de Oxford, Cambridge y otras instituciones lo han estudiado en los últimos años, y la idea de fondo es sencilla: cuando los modelos se entrenan de forma indiscriminada con contenido generado por modelos anteriores, empiezan a perder partes de la distribución original de datos. Dicho claramente, el sistema se va quedando sin rarezas. Pierde los bordes, los casos menos frecuentes, las formas menos previsibles de representar la realidad, las voces pequeñas, las estructuras torcidas y los errores humanos que a veces contienen más vida que una frase perfectamente optimizada.

Ese detalle importa, porque la inteligencia también depende de conservar lo improbable. Un modelo entrenado sobre demasiada producción sintética puede volverse más plano, más predecible y más convencido de que el mundo se parece al promedio de sus propios resultados anteriores. La degradación no tiene por qué presentarse como un fallo espectacular. Puede aparecer como una corrección excesiva, como una normalidad sin textura, como una capacidad creciente para producir contenido aceptable acompañada de una capacidad decreciente para producir algo verdaderamente situado, raro o memorable.

Ya lo estamos viendo en textos que suenan igual aunque hablen de la metamorfosis de Kafka o del último corte de pelo de Cristiano. También en imágenes que representan lo mismo de idéntica manera: basta con pedirle a ChatGPT una foto de un astronauta y luego hacer una búsqueda inversa en Google Imágenes. Y en músicas y vídeos que cada día tienen menos de original y más de producto enlatado, por mucho que te esfuerces en promptear y repromptear.

El gran aplanamiento: por qué tu sector entero empieza a sonar igual

El peligro: que todo empiece a parecer correcto

La parte más peligrosa de este proceso es que todo empieza a parecer correcto. Correctamente iluminado, correctamente redactado, correctamente estructurado, correctamente neutro, correctamente optimizado y correctamente muerto. El contenido generado por IA puede producir belleza, utilidad y conocimiento, y lo hace a diario. El riesgo aparece cuando su producción masiva se convierte en el nuevo suelo sobre el que entrenamos, buscamos, escribimos, decidimos y recordamos. En ese momento dejamos de hablar de herramientas sueltas y empezamos a hablar de ecosistema.

Un texto generado por IA puede ayudarte a ordenar ideas. Mil millones de textos generados por IA pueden convertir Internet en una sopa templada de frases funcionales. Una imagen generada por IA puede ser una solución creativa. Millones de imágenes generadas por IA pueden estrechar el imaginario colectivo hasta que todos los astronautas, todos los niños felices, todos los ancianos sabios y todos los futuros posibles parezcan sacados del mismo molde. La repetición se vuelve tan abundante que acabamos llamando realidad a su promedio.

Los modelos generativos funcionan prediciendo patrones. Aprenden qué suele venir después de qué, qué estructura se parece a una respuesta, qué tipo de imagen parece válida y qué combinación de palabras suena razonable. Esa capacidad los hace útiles, y también frágiles cuando el material del que aprenden empieza a estar contaminado por sus propias salidas. Cuando un modelo aprende de humanos recibe contradicción, ruido, estilo, torpeza, acento, error, genialidad, contexto y rareza. Cuando aprende de otros modelos recibe una versión ya digerida de todo eso, con menos borde, menos fricción y menos mundo.

Por qué tu cerebro ya rechaza el contenido que «huele a IA»

Endogamia generativa

Por eso la idea de «endogamia generativa» encaja tan bien. En genética, la endogamia reduce la diversidad y aumenta el riesgo de que ciertas limitaciones se repitan. En IA, el entrenamiento recursivo sobre contenido sintético puede reducir la diversidad informativa y amplificar errores, sesgos, clichés y patrones empobrecidos. La IA empieza a reproducirse con su propia familia, y las deformidades aparecen en otro lugar: en el lenguaje, en la imaginación, en los resultados de búsqueda, en los artículos que nadie ha pensado, en las imágenes que nadie ha visto antes pero que todos reconocemos al instante, y en las respuestas que parecen inteligentes porque han aprendido a la perfección cómo suena una respuesta inteligente.

Ese es el diente único de la IA generativa incestuosa: su sonrisa de producto perfecto, su baba cayendo sobre una pantalla limpia, su capacidad para darnos la bienvenida a un mundo donde todo parece nuevo durante tres segundos y repetido al cuarto.

Qué alimento le estamos dando

La pregunta importante ya ha cambiado. La IA está dentro del proceso creativo, productivo, educativo, empresarial y cultural. El debate útil pasa por saber qué tipo de alimento le estamos dando y qué tipo de mundo queremos que nos devuelva. Si todo el contenido nuevo se produce mirando hacia dentro, la IA acabará comprimiendo la realidad. Si cada empresa publica artículos con la misma estructura, los mismos subtítulos y las mismas frases de autoridad vacía, la red se llenará de embalaje textual. Si cada creador usa los mismos prompts, los mismos estilos, los mismos trucos visuales y las mismas referencias de Midjourney, DALL-E, Runway o Sora, la creatividad se volverá reconocible hasta el aburrimiento.

Conviene evitar también la lectura simplista. Los datos sintéticos resultan útiles en muchos ámbitos: medicina, simulación, robótica, privacidad, entrenamiento específico o escenarios donde falta material real. El problema llega cuando lo sintético sustituye por completo el contacto con datos frescos, humanos, diversos y verificables. La salida pasa por conservar lo real, con la IA dentro del proceso creativo y técnico, como una herramienta más.

Necesitamos conservar lo real

Para que esto no se nos vaya de las manos hacen falta varias cosas. Procedencia, para saber qué contenido viene de humanos, qué contenido viene de máquinas y qué contenido se ha mezclado, editado o sintetizado. Trazabilidad, para que los sistemas no terminen entrenándose a ciegas con sus propios restos. Y, sobre todo, datos situados, contradictorios, imperfectos y diversos: voces que escriban desde un lugar propio, imágenes que respiren fuera del mismo útero estadístico, música que busque algo más que agradar al promedio y vídeos que nazcan de una mirada en lugar de una receta exacta de retención.

Internet se construyó con aportaciones humanas desordenadas: foros absurdos, blogs personales, comentarios larguísimos, tutoriales torpes, fotografías mal encuadradas, canciones grabadas en una habitación, reseñas contradictorias, memes incomprensibles, ensayos obsesivos e hilos de gente rara explicando cosas raras durante años a cambio de nada. Aquello era una selva. Ahora corremos el riesgo de convertirlo en un vivero industrial de contenido sintético: más limpio, más rápido, más abundante y más pobre.

IA para LinkedIn: cómo usarla sin perder tu voz

La IA generativa incestuosa ya está aquí

La familia Whittaker se volvió viral porque había algo brutal en mirar una consecuencia extrema del encierro: un grupo de personas que, durante generaciones, había quedado atrapado en su propio circuito biológico, social y territorial. La IA generativa corre un riesgo parecido, menos corporal y mucho más extendido: quedar atrapada en su propio circuito estadístico. Una inteligencia entrenada por su propia descendencia. Una cultura digital que se mira a sí misma hasta quedarse sin mundo. Una red que ladra porque ha olvidado otras formas de hablar.

La IA generativa incestuosa ya está aquí. Te ladra, te sonríe con un solo diente y, mientras se le cae la baba, te da la bienvenida. La cuestión es si vamos a darle la mano o si todavía estamos a tiempo de enseñarle algo que no venga de sí misma.

Preguntas frecuentes

¿Qué es el colapso del modelo o «model collapse»?

Es la degradación que sufre un modelo de IA cuando se entrena de forma indiscriminada con contenido generado por otros modelos. Al aprender de sus propias salidas va perdiendo las partes menos frecuentes de los datos originales (las rarezas, los bordes, los casos atípicos) y se vuelve más plano y predecible con cada generación.

¿Qué significa «endogamia generativa»?

Es la metáfora que da título al artículo. Igual que la endogamia genética reduce la diversidad y repite ciertas limitaciones, el entrenamiento recursivo de la IA sobre contenido sintético reduce la diversidad informativa y amplifica errores, sesgos y clichés. La IA se reproduce con su propia familia, y el deterioro aparece en el lenguaje, las imágenes y los resultados de búsqueda.

¿Debería dejar de usar IA para crear contenido?

No hace falta. La IA es una herramienta estupenda para ordenar ideas y producir borradores. El problema aparece cuando la red entera se alimenta solo de su producción media. Úsala como apoyo y mete siempre material propio: tu criterio, tu experiencia y tus datos reales.

¿Los datos sintéticos son siempre malos?

En absoluto. Resultan muy útiles en medicina, simulación, robótica o privacidad, y en escenarios donde falta material real. El riesgo llega cuando lo sintético sustituye por completo el contacto con datos frescos, humanos y verificables, en lugar de complementarlos.

¿Cómo evito aportar a esa «sopa» de contenido sintético?

Publica desde un lugar propio. Parte de una idea tuya, añade una experiencia concreta y una opinión que se pueda discutir, y pasa cualquier borrador de IA por tu criterio antes de darle a publicar. Lo que aporta valor a la red, y a los futuros modelos, es lo situado, lo imperfecto y lo diverso.