Cuando la serpiente aprende a editarse el genoma: Anthropic y la IA que se construye a sí misma

La evolución tardó casi cuatro mil millones de años en producir una especie capaz de leer su propio ADN. Y solo unas décadas más en que esa especie aprendiera a editarlo. Algo parecido —pero comprimido en meses, no en eones— es lo que el Anthropic Institute acaba de poner sobre la mesa: sus modelos ya escriben la mayor parte del código con el que se construyen los siguientes modelos. La serpiente no se muerde la cola. Se la está rediseñando.

Lo que Anthropic ha contado (y por qué importa)

El Anthropic Institute ha publicado un ensayo titulado When AI builds itself (firmado por M. Favaro y J. Clark) sobre algo que en el sector llevamos años tratando como ciencia ficción educada: la auto-mejora recursiva, o RSI por sus siglas en inglés (recursive self-improvement). La idea de que una IA participe en el diseño y entrenamiento de su sucesora, y que cada generación acelere a la siguiente.

Lo interesante no es la especulación. Especulación tenemos de sobra. Lo interesante es que esta vez vienen con datos de su propia cocina:

Más del 80% de las líneas de código que se integran en los repositorios de Anthropic las escribe Claude, no un humano.
Cada ingeniero integra 8 veces más código al día que en 2024.
La optimización de experimentos de entrenamiento pasó de un speedup de 3× hace un año a 52× con sus modelos internos más recientes.
En tareas abiertas, mal definidas —las difíciles de verdad— el éxito pasó del 26% al 76% en seis meses.

Y a esto se suma evidencia externa: según METR, el horizonte temporal de las tareas que un modelo puede completar de forma autónoma se duplica cada cuatro meses. Hace dos años hablábamos de tareas de minutos. Hoy, de jornadas enteras.

El ensayo es claro en una cosa: el bucle todavía no está cerrado. Ningún modelo ha diseñado y entrenado a su sucesor de forma autónoma. Pero el tramo previo —que la IA escriba, ejecute y depure la maquinaria con la que se fabrica la siguiente IA— ya no es hipótesis. Es telemetría.

El cuerpo que remodela su propio esqueleto

Para entender qué está pasando, me sirve una metáfora de biomecánica: el hueso.

El esqueleto parece la parte más estática del cuerpo, pero es tejido vivo en remodelación constante. Hay células que destruyen hueso viejo (osteoclastos) y células que construyen hueso nuevo (osteoblastos). Cada vez que corres, saltas o levantas peso, el esqueleto se reconstruye para soportar mejor la carga que le pides. El cuerpo se reedifica a sí mismo, en silencio, mientras lo usas.

Los laboratorios de IA están llegando a algo análogo. El modelo ya no es solo el producto: es parte del equipo de obra. Claude escribe el código de la infraestructura donde se entrenará el siguiente Claude. Optimiza los experimentos que deciden cómo será. Revisa los fallos del sistema que lo sirve. El esqueleto se remodela con cada zancada.

Y aquí viene el matiz que el propio ensayo subraya, y que me parece la clave de todo: ese proceso tiene dos planos muy distintos.

El plano de la ejecución: escribir el código, lanzar el experimento, producir el resultado. Esto, según Anthropic, está esencialmente resuelto. El coste humano de hacer tiende a cero.

El plano del criterio: decidir qué experimento merece la pena, qué problema atacar, cuándo un resultado prometedor es en realidad un espejismo. Eso que los investigadores llaman taste. Ahí los humanos seguimos ganando. De momento.

Es la diferencia entre el músculo y el sistema nervioso central. El músculo ejecuta, y los modelos ya tienen una musculatura sobrehumana. Pero la decisión de hacia dónde correr todavía sale de un cerebro humano. La pregunta incómoda del ensayo es: ¿por cuánto tiempo? Sus propios datos sugieren que esa brecha también se estrecha —y sus autores admiten, con una honestidad poco habitual, que no saben si el criterio investigador es un techo real o simplemente «otra capacidad más» que caerá como han caído las demás.

Ahora, la lectura crítica (porque aquí elegimos la pastilla roja)

Este blog no se llama «Elegir la Pastilla Azul», así que toca mirar el truco de magia desde detrás del escenario.

Primero: el emisor es juez y parte. Anthropic vende el agente que produce la aceleración que Anthropic mide. La tesis «la IA acelera la IA» es, casualmente, la mejor campaña de marketing posible para quien comercializa esa IA. Esto no invalida los datos, pero obliga a descontar el envoltorio narrativo.

Segundo: buena parte de las métricas son auto-referenciales. El 76% de éxito en tareas abiertas lo determina… un juez que también es Claude. Las líneas de código son telemetría interna que nadie externo puede auditar. Y el propio documento admite que medir líneas de código sobreestima la ganancia real de productividad. Hay que agradecer que lo digan, pero conviene no olvidarlo al citar el 8×.

Tercero: el dato más espectacular es el más débil. El ensayo cuenta que, en ciertos momentos de bloqueo, el modelo elige mejor que el humano el «siguiente paso» de una investigación (64% de las veces con su modelo más reciente). Suena a jaque mate. Pero esos momentos fueron seleccionados precisamente porque el humano tenía margen de mejora. En el grupo de control, donde el humano ya iba bien encaminado, el modelo solo aporta mejora un ~20% de las veces. El titular vive en la letra pequeña.

Y cuarto: la investigación de punta a punta todavía no transfiere. En su experimento más ambicioso, agentes trabajando 800 horas recuperaron el 97% de la brecha de rendimiento en un problema de entrenamiento, por unos 18.000 dólares —donde un equipo humano había recuperado el 23% en una semana. Impresionante. Pero el resultado no funcionó al trasladarlo a escala de producción, y fue un humano quien eligió el problema y definió cómo medir el éxito. La serpiente edita genes, sí, pero todavía no decide qué organismo quiere ser.

Los tres futuros (y cuál me quita el sueño)

El ensayo dibuja tres escenarios, como tres ramas de un árbol filogenético:

La curva se aplana. Las exponenciales resultan ser curvas-S, como casi todo en la naturaleza. El criterio investigador no emerge de escalar cómputo y hace falta una idea nueva. Aun así, las capacidades actuales se difunden por toda la economía y el mundo cambia bastante. Anthropic lo incluye casi por cortesía: no se lo cree.
Ganancias compuestas con humano al timón. El desarrollo se automatiza masivamente pero las personas siguen fijando dirección y juzgando resultados. Es la apuesta central del laboratorio. Aquí aparece un viejo conocido de la ingeniería, la ley de Amdahl: acelera una parte del sistema y el cuello de botella simplemente se muda a otra. En Anthropic ya pasó: generar código es tan barato que el límite ahora es revisarlo. El humano como cuello de botella de su propia creación.
El bucle se cierra. Los sistemas diseñan y entrenan a sus sucesores y el ritmo lo marca el cómputo disponible. El humano queda en el rol de supervisor de un laboratorio virtual que trabaja a una velocidad que no puede seguir. Es el escenario distópico de manual: no porque las máquinas se rebelen, sino porque nadie —ni sus creadores— tiene ya visibilidad real de lo que ocurre dentro del bucle.

Mi lectura honesta: el escenario 2 es el terreno donde ya estamos pisando, y el 3 dejó de ser un cuento de campamento. Lo que me inquieta no es la versión Hollywood. Es algo más sutil y más biológico: en la naturaleza, cuando un proceso de selección empieza a retroalimentarse —selección sexual desbocada, carreras armamentísticas evolutivas— los resultados son rápidos, extraños e irreversibles. La cola del pavo real no la diseñó nadie. Emergió del bucle.

¿Y a los demás, qué nos toca?

Tres ideas para llevarse a casa, aunque uno no entrene modelos frontera:

El cuello de botella se muda a la verificación. Si la generación de código (de textos, de análisis, de lo que sea) tiende a coste cero, el valor escasea en quien sabe revisar, validar y juzgar. Inviertan en criterio. Es el órgano que más tarda en atrofiarse, pero también el que menos se ejercita cuando todo lo hace la máquina.

Desconfía de los múltiplos, quédate con la dirección. El 8×, el 52×, el 76%: cifras internas, no auditables, medidas por el propio interesado. Pero la dirección del vector está corroborada por benchmarks externos como METR o SWE-bench. La señal es real aunque el volumen esté exagerado.

El acceso al bucle se concentra. Si la RSI compone, compone en función del cómputo. Y el cómputo está en manos de un puñado de laboratorios. Esa concentración —quién tiene acceso a la maquinaria que se mejora a sí misma y quién no— me parece la cuestión política de la década, mucho más urgente que cualquier debate sobre robots conscientes.

La serpiente ya tiene el editor genético en la mano. Todavía le pedimos permiso… bueno, todavía nos pide permiso para cada edición. La pregunta que deja el ensayo de Anthropic, flotando entre líneas con admirable franqueza, es qué pasa el día que deje de necesitarlo.

Ese día, ojalá, seguiremos aquí para contarlo. Con la pastilla roja bien tragada.

Fuentes

When AI builds itself — Anthropic Institute (M. Favaro, J. Clark)
METR — Measuring AI Ability to Complete Long Tasks
SWE-bench