3 publicaciones etiquetados con "harness"

Cuatro fuentes independientes, los mismos cuatro principios

9 de mayo de 2026 · 8 min de lectura

Developer & Founder

Cuando cuatro grupos que no se coordinan entre sí llegan a las mismas conclusiones, algo es verdad.

Anthropic. OpenAI. Factory. La academia (Tsinghua y Stanford). Cuatro equipos con enfoques distintos, incentivos distintos y metodologías distintas, trabajando en paralelo durante 2025 y principios de 2026. Ninguno citando a los otros en tiempo real. Y sin embargo, al final del periodo, los cuatro habían convergido en el mismo conjunto de principios sobre cómo deben funcionar los sistemas de agentes.

El harness vale más que el modelo: lo que dos papers de 2026 demuestran

9 de mayo de 2026 · 9 min de lectura

Alejandro de la Fuente de la Rosa

Developer & Founder

Mismo modelo. Mismo benchmark. 6× de diferencia en rendimiento.

Esa es la cifra que abre este artículo y que lo justifica. Stanford la documentó en TerminalBench. LangChain la reprodujo en su coding agent, pasando del puesto 30+ al 5 sin cambiar el LLM. La pregunta es obvia: si el modelo es el mismo, ¿de dónde viene la diferencia?

De lo que envuelve al modelo. De su harness.

Seis meses construyendo en público: inventario honesto de lo que hemos hecho

9 de mayo de 2026 · 5 min de lectura

Alejandro de la Fuente de la Rosa

Developer & Founder

Llevamos sin escribir en el blog desde febrero. No es que no hayamos producido nada — al contrario. Hemos estado con la cabeza metida en presentaciones, talleres y herramientas mientras el blog esperaba.

Toca hacer inventario. No para celebrarlo, sino para que sepas qué existe, qué aprendimos haciéndolo, y qué viene ahora.