Saltar al contenido principal

3 publicaciones etiquetados con "harness"

Ver Todas las Etiquetas

Cuatro fuentes independientes, los mismos cuatro principios

· 8 min de lectura

Cuando cuatro grupos que no se coordinan entre sí llegan a las mismas conclusiones, algo es verdad.

Anthropic. OpenAI. Factory. La academia (Tsinghua y Stanford). Cuatro equipos con enfoques distintos, incentivos distintos y metodologías distintas, trabajando en paralelo durante 2025 y principios de 2026. Ninguno citando a los otros en tiempo real. Y sin embargo, al final del periodo, los cuatro habían convergido en el mismo conjunto de principios sobre cómo deben funcionar los sistemas de agentes.

El harness vale más que el modelo: lo que dos papers de 2026 demuestran

· 9 min de lectura

Mismo modelo. Mismo benchmark. 6× de diferencia en rendimiento.

Esa es la cifra que abre este artículo y que lo justifica. Stanford la documentó en TerminalBench. LangChain la reprodujo en su coding agent, pasando del puesto 30+ al 5 sin cambiar el LLM. La pregunta es obvia: si el modelo es el mismo, ¿de dónde viene la diferencia?

De lo que envuelve al modelo. De su harness.

Seis meses construyendo en público: inventario honesto de lo que hemos hecho

· 5 min de lectura

Llevamos sin escribir en el blog desde febrero. No es que no hayamos producido nada — al contrario. Hemos estado con la cabeza metida en presentaciones, talleres y herramientas mientras el blog esperaba.

Toca hacer inventario. No para celebrarlo, sino para que sepas qué existe, qué aprendimos haciéndolo, y qué viene ahora.