La IA ya no sale tan barata, el invierno se acerca

El 14 de mayo, Zed publicó una entrada explicando qué significa para sus usuarios el cambio de facturación de Anthropic del 15 de junio. En el segundo párrafo, casi de pasada, aparece la frase que toda la industria del coding con IA lleva meses evitando: "Las suscripciones de Claude subvencionaban el uso de agentes a aproximadamente 15-30x en comparación con los precios de la API, y los nuevos créditos se facturan a las tarifas completas de la API." Theo Browne, de T3.gg, lo tradujo a lenguaje llano en X: quien esté ejecutando claude -p en CI o canalizando trabajo a través de herramientas como Conductor o el panel de agente de Zed, ha visto su capacidad de uso dividida por 25 de la noche a la mañana.

Eso es todo. Los planes Claude Max a $200 y Codex Pro que la mayoría de desarrolladores considera "la factura de la IA" nunca se diseñaron pensando en el trabajo real de los agentes. Se diseñaron para un mundo donde le hacías preguntas a un chatbot. La factura lleva dos años acercándose en silencio. Anthropic acaba de hacerla visible.

El número que nadie publica

La entrada de AgenticMesh The Brutal Reality of Token Economics hace la aritmética que Anthropic y OpenAI se niegan a hacer. Con las tarifas publicadas por el propio Anthropic ($3 por millón de tokens de entrada, $15 por millón de salida en Sonnet) y una estimación del 60% de coste de servicio, el coste de inferencia del proveedor ronda los $3,24 por millón de tokens combinados. Dicho de otro modo: el plan Max a $200 empieza a ser rentable a partir de 62 millones de tokens al mes.

Los usuarios reales de agentes de coding no están en 62 millones. Están en cientos de millones. AgenticMesh cita un dashboard interno de Disney donde un usuario intensivo de Claude quemó 234 millones de tokens en nueve días laborables. Jellyfish, que mide métricas de ingeniería en cientos de empresas, reporta una mediana de unos 140 millones de tokens al mes para desarrolladores activos con Claude Code, con los más intensivos llegando a 975 millones de tokens por semana.

Hagamos los cálculos:

Con 150 millones de tokens equivalentes a Sonnet al mes, el usuario paga $200 y el proveedor asume unos $486 en cómputo. Subvención implícita: $286/mes.
Pasando a Opus, la misma carga de trabajo le cuesta al proveedor unos $810. Subvención implícita: $610/mes.

Implicator hizo un cálculo paralelo en marzo y llegó al mismo sitio: un suscriptor de Max a $200 usando Claude Code de forma intensiva le costaba a Anthropic cerca de $570 en cómputo. La cifra exacta varía según el mix de modelos, los aciertos de caché y cuán agresivamente itera el agente. La tendencia no cambia.

Anthropic publica los precios por token de la API con cuatro decimales. Nunca ha publicado el dato que un suscriptor de Claude Code realmente necesitaría: cuánto cómputo compra una tarifa plana. Como apuntó Implicator, la omisión no es un descuido.

Aquí lo que muestra mi propia máquina. En los últimos 30 días de trabajo de coding normal —sin benchmarks, sin pruebas de estrés, simplemente el día a día— claude y codex reportaron el equivalente a unos $2.000 en uso medido frente a mi plan Max. Pago $200. Los otros $1.800 son la subvención que describen los números de AgenticMesh e Implicator, pero vista desde mi caso concreto.

Mi uso de Claude y Codex en los últimos 30 días, aproximadamente $2.000 en tokens medidos contra una suscripción de $200

Un desarrollador, el trabajo de un desarrollador. Multiplica eso por un equipo de ingeniería y la brecha entre lo que cobran las suscripciones y lo que cuesta el cómputo deja de ser un error de redondeo.

Esto ya pasó una vez

Si quieres saber cómo serán los próximos doce meses, mira lo que le pasó a Cursor.

En junio de 2025, Cursor pasó de un modelo de 500 peticiones al mes a facturación por créditos. El mismo plan de $20 compraba ahora unas 225 peticiones efectivas en lugar de 500. El propio equipo de Cursor reconoció que las peticiones más exigentes podían costar hasta 10x más que las simples, porque los modelos más nuevos consumen más tokens en tareas de mayor alcance. Un comentario en Hacker News reportó $350 en excesos en una sola semana, unos $1.400 al mes contra una expectativa de $20.

El CEO emitió una disculpa pública el 4 de julio de 2025 y ofreció reembolsos. Para entonces la puntuación de Cursor en Trustpilot había caído a 1,7 sobre 5 en más de 200 reseñas.

GitHub hizo su propia versión del mismo truco unas semanas después, pausando nuevas altas en el plan de tarifa plana de Copilot. La tensión de fondo es la misma en todos los casos: las suscripciones se diseñaron para gente que hace preguntas, pero esas mismas suscripciones empezaron a usarse para ejecutar agentes durante horas.

Qué cambió Anthropic exactamente el 15 de junio

El cambio del 15 de junio es más tajante que el de Cursor porque no afecta al uso interactivo. Si te sientas delante de claude o codex en un terminal y escribes, sigues usando el pool de la suscripción. Si hay cualquier componente programático de por medio (claude -p, el Agent SDK, Conductor, el antiguo passthrough de OpenClaw, wrappers de agentes de terceros), ahora tiras de un pool mensual separado: $20 en créditos del Agent SDK en Pro, $100 en Max 5x, $200 en Max 20x, facturado a tarifas completas de la API. Cuando se acaban los créditos, o pagas el exceso a precio de API o tus peticiones se detienen.

Boris Cherny, que lidera Claude Code en Anthropic, fue directo sobre el porqué: las herramientas de terceros que operan fuera del sistema de caché son, en sus palabras, "muy difíciles de sostener." The Register cubrió el cambio el mismo día que Zed.

Es la tercera reescritura de la suscripción de Anthropic en seis semanas. El 4 de abril se prohibió a los agentes de terceros usar las suscripciones directamente. El 21 de abril, Claude Code desapareció brevemente del plan Pro antes de que el backlash lo revirtiera. El 14 de mayo se anunció la división de créditos que entra en vigor el 15 de junio. El patrón se repite. La subvención se cierra por etapas.

La solución de Zed

La entrada de Zed merece leerse completa porque es la reacción publicada más clara hasta ahora. Su respuesta es dar a los usuarios tres vías de escape:

Ejecutar el CLI oficial claude de Anthropic directamente dentro del terminal de Zed. El CLI sigue en el pool de la suscripción, así que el uso no cambia. Lo que topa con el nuevo techo de créditos es el panel de agente de Zed, que llamaba a Claude a través del SDK, no el CLI.
Usar el agente integrado de Zed con otro proveedor: DeepSeek, Ollama, cualquiera que soporte el protocolo ACP.
Conectar cualquier otro agente compatible con ACP.

El argumento implícito es que el protocolo es lo que merece defender, no una relación concreta con un proveedor. Zed mantuvo su interfaz y dejó que el usuario elija dónde ocurre la inferencia. Ese mismo instinto está detrás de lo que hacemos en IBERANT.

Nuestra respuesta: Churro Coder

Construimos Churro Coder para darte la elección en lugar de tomarla por ti.

Churro Coder usa el Agent SDK, pero también embebe los CLIs nativos de claude y codex como subprocesos dentro de un terminal integrado en la interfaz. Los dos modos tienen costes muy distintos. Si ejecutas trabajo a través del Agent SDK, estás en facturación medida por la API. Si lo haces a través del CLI embebido, te quedas en el pool de tu suscripción — los mismos números del screenshot de arriba: $200 por lo que Anthropic cobraría $2.000 a tarifas de API. La elección es tuya según la tarea.

La interfaz no cambia en ninguno de los dos modos:

Vista de plan: puedes leer los cambios que el agente tiene previstos antes de que toque un solo archivo.
Aprobación de revisión de código: los diffs pasan por el mismo tipo de inspección que el PR de un compañero.
Flujo OpenSpec: el trabajo guiado por especificaciones tiene su propio espacio y no se diluye en un muro de 4.000 tokens de contexto.

La integración del terminal importa porque la mayoría de wrappers visuales te arrancan del CLI nativo por completo. Churro Coder no. Puedes seguir usando claude y codex exactamente como los distribuyen Anthropic y OpenAI, con su caché y su contabilidad de suscripción intactas, y aun así tener la capa visual encima.

Churro Coder con el CLI nativo de Claude integrado en la interfaz — los paneles de plan, tareas y estado se siguen actualizando en tiempo real aunque manejes el agente desde el CLI nativo

La subvención se cierra

Los incentivos que produjeron "usa tanta inteligencia como quepa en una suscripción de $200" son los de un mercado que compraba cuota con dinero de capital de riesgo. Los ingresos de Anthropic se acercan a una tasa de $7.000 millones anuales; el objetivo de margen bruto para 2025 era del 40%, y eso ya era después de que los costes de inferencia se desviaran un 23% por encima de lo previsto. OpenAI tiene una estructura similar. Ninguna empresa puede seguir pagando $600 de cómputo para cobrar $200 de ingresos al 10% más intensivo de sus usuarios.

Lo que esto implica para quien esté lanzando software con estas herramientas: elige el flujo de trabajo que te mantenga en el lado económico de la facturación mientras ese lado exista, y asume que los límites se moverán otra vez. El CLI interactivo es barato hoy. El Agent SDK era barato el mes pasado. Algo distinto será barato el año que viene.

El invierno se acerca. Los $200 que pagas hoy por un mes completo de coding asistido por IA podrían ser fácilmente $2.000 el año que viene — no porque las herramientas empeoren, sino porque las subvenciones que las hacían asequibles se están acabando. Actúa en consecuencia.

Si quieres ver en la práctica cómo es mantenerse en el lado económico, prueba Churro Coder. Si quieres hablar sobre cómo organizar tu equipo de ingeniería cuando los precios no dejan de cambiar, cuéntanoslo.

Volver al Blog