Saltar al contenido principal

Del vibe coding al agentic engineering: por qué el techo de calidad sigue siendo tuyo

· 6 min de lectura
Código Sin Siesta
Equipo de desarrollo

En 2025, "vibe coding" era la etiqueta para casi todo: desde el estudiante que genera código sin entender lo que hace hasta el senior que usa Claude para multiplicar su output 10×. En abril de 2026, Andrej Karpathy fue a Sequoia AI Ascent y separó las dos cosas de una vez por todas. Y lo que dijo importa más de lo que parece.

El corte que faltaba

Karpathy lleva tiempo hablando de vibe coding. Pero este año añadió el complemento: agentic engineering. La distinción es quirúrgica:

Vibe codingAgentic engineering
ObjetivoElevar el suelo — que cualquiera pueda construir algoPreservar el techo — calidad profesional cuando delegas a agentes
AudienciaTodo el mundoIngenieros de software
Métrica"¿Funciona?""¿Funciona, es seguro, es mantenible y voy más rápido?"
ResponsabilidadImplícitaExplícita: vulnerabilidades, diseño, criterio arquitectónico

"You're not allowed to introduce vulnerabilities due to vibe coding. You are still responsible for your software just as before, but can you go faster? And spoiler is you can — but how do you do that properly?"

Vibe coding elevó el suelo. Estupendo. Pero alguien tiene que preservar el techo. Y ese alguien eres tú — no tu agente.

El mapa completo: tres capas, no una

Lo que Karpathy describió en Sequoia encaja perfectamente con un mapa que la industria lleva meses construyendo por separado:

Negocio     →  Agents-as-a-Service
Disciplina → Agentic Engineering
Sustrato → Harness Engineering

No son sinónimos. No son etapas. Son capas con responsabilidades distintas.

Capa 1 — Harness Engineering: el sustrato técnico

El harness es la arquitectura que envuelve al LLM: tools tipadas, permisos declarativos, contexto gestionado, verificación, observabilidad. Es dónde trabaja el agente.

La evidencia empírica es contundente. El paper NLAH de Tsinghua (marzo 2026) demostró +16.8 puntos de accuracy cambiando solo la representación del harness — sin tocar el modelo. Stanford publicó meta-harness ese mismo mes: 6× más varianza en el output explicada por la arquitectura que por el modelo elegido. Y Factory construyó un clon de Slack en 16.5 horas con 89% de test coverage — no porque el modelo sea mágico, sino porque el harness estaba bien diseñado.

La arquitectura que envuelve al modelo explica más varianza que el modelo. Eso no es una opinión — es el resultado empírico que tres equipos independientes han replicado en los últimos seis meses.

Capa 2 — Agentic Engineering: la disciplina del ingeniero

El harness es infraestructura. La disciplina es lo que hace el humano que la dirige. Karpathy lo describe como un reparto de responsabilidades muy concreto:

El humano poneEl agente pone
Aesthetics, taste, oversightDetalles de API (keep_dims vs keep_dim)
Decisiones arquitectónicasFill-in-the-blanks del código
Spec detallada y criterioInvestigación, codegen, refactor

El agente hace el trabajo pesado. Tú haces el trabajo que requiere entendimiento.

Karpathy cuenta que en uno de sus proyectos el agente intentó cruzar la cuenta de Stripe con la de Google por email, sin entender que pueden ser distintos. "This is the kind of thing where you have to be in charge of the spec." Nadie más puede estar a cargo de eso.

Y añade algo más duro: el código generado a veces es bloaty, con copy-paste, abstracciones frágiles. "It works but it's just gross." Los labs aún no tienen un reward de aesthetics en el RL. Entretanto, revisar y refactorizar sigue siendo tu trabajo.

Capa 3 — Agents-as-a-Service: el modelo de producto

Cuando el sustrato está bien diseñado y hay disciplina para dirigirlo, el modelo de producto cambia. Ya no vendes una herramienta — vendes el resultado de un agente trabajando.

SaaS clásicoAgents-as-a-Service
Qué vendesUna herramientaUn resultado
Quién trabajaEl clienteTu agente
Disposición a pagarLimitadaMayor — la delegación efectiva tiene más valor que la capacidad

No porque sea un buzzword nuevo. Sino porque cuando construir software se vuelve commodity, las apps simples dejan de diferenciarse. La palanca es ejecutar más trabajo por el cliente, no añadir más funcionalidades.

Las tres capas se necesitan mutuamente

El harness sin disciplina es infraestructura inerte — tienes las tools, pero nadie sabe dónde meter los approval gates ni cómo descomponer el spec. La disciplina sin harness es intención sin ejecución — sabes qué quieres construir pero el agente opera en caos. Y el AaaS sin las dos capas debajo es humo de marketing — prometes resultados y entregas un wrapper de GPT que falla en producción.

Lo que Karpathy, Bascuñana y los equipos de investigación de Tsinghua y Stanford están describiendo de formas distintas es lo mismo: los multiplicadores de productividad que traen los agentes solo se materializan si hay ingeniería seria debajo.

El 10× del que lleva años hablándose en Silicon Valley se queda corto, según Karpathy:

"I think this is magnified a lot more. 10× is not the speed-up you gain. People who are very good at this peak a lot more than 10× from my perspective right now."

Pero ese "más de 10×" no es gratis. Depende de lo bien que ejerces de director: con qué criterio eliges tools, dónde metes gates de revisión, qué dejas en el spec, qué esperas revisar a posteriori.

Lo que no se puede delegar

La frase con la que Karpathy cerró su charla en Sequoia es la que más nos resuena en Código Sin Siesta:

"You can outsource your thinking but you can't outsource your understanding."

Puedes delegarle la implementación. No puedes delegarle el entendimiento de qué construir ni por qué merece la pena. No puedes delegarle el criterio para detectar cuando el agente está haciendo algo incorrecto. No puedes delegarle la responsabilidad sobre las vulnerabilidades que introduce.

El entendimiento no es delegable. Y por eso aprender en profundidad — arquitectura, patrones, fundamentos — sigue mereciendo la pena aunque la inteligencia se abarate.

Es exactamente la razón por la que esta comunidad existe.


Lo que viene en Código Sin Siesta

Hemos actualizado nuestras presentaciones con este material:

Y si quieres explorar las fuentes primarias: