Agente de Tareas

Tutorial paso a paso para construir tu primer agente de IA funcional. Aprenderás los conceptos fundamentales de agentes, el patrón Tool Use, y crearás un agente que puede ejecutar tareas usando herramientas personalizadas.

¿Qué es un Agente de IA?

Un agente de IA es un sistema que puede:

Percibir su entorno (leer datos, recibir inputs)
Razonar sobre qué hacer (procesar información con un LLM)
Actuar en el mundo (ejecutar herramientas, llamar APIs)
Aprender de sus acciones (mejorar con feedback)

A diferencia de un chatbot que solo responde, un agente toma decisiones y ejecuta acciones.

Comparativa: Chatbot vs Agente

Aspecto	Chatbot	Agente
Entrada	Pregunta del usuario	Tarea a completar
Proceso	Genera respuesta directa	Planifica y ejecuta pasos
Herramientas	Ninguna (solo contexto)	Múltiples (APIs, BD, etc.)
Decisiones	Ninguna (solo respuesta)	Decide qué tool usar y parámetros
Salida	Texto	Acción + Resultado
Ejemplo	"¿Cuál es la capital de Francia?"	"Añade 3 tareas a mi lista"

El Ciclo Básico de un Agente

┌─────────────────────────────────────────┐
│  Usuario: "Añade una tarea importante"  │
└────────────┬────────────────────────────┘
             ↓
┌─────────────────────────────────────────┐
│  Agente recibe y envía al LLM           │
│  + contexto: tareas existentes          │
│  + tools disponibles: add_task, list... │
└────────────┬────────────────────────────┘
             ↓
┌─────────────────────────────────────────┐
│  LLM razona:                            │
│  "Usuario quiere añadir tarea"          │
│  "Uso tool 'add_task' con parámetros"   │
└────────────┬────────────────────────────┘
             ↓
┌─────────────────────────────────────────┐
│  Agente ejecuta: add_task({             │
│    title: "Tarea importante"            │
│  })                                     │
└────────────┬────────────────────────────┘
             ↓
┌─────────────────────────────────────────┐
│  Resultado: Task{id: '123', ...}        │
│  Agente envía resultado de vuelta       │
│  al LLM para sintetizar respuesta       │
└────────────┬────────────────────────────┘
             ↓
┌─────────────────────────────────────────┐
│  Respuesta final al usuario:            │
│  "✓ Añadí tu tarea importante (ID:123)" │
└─────────────────────────────────────────┘

Este ciclo se repite hasta completar la tarea. Es el patrón fundamental de todos los agentes modernos.

Patrón Tool Use

El patrón Tool Use permite que el LLM "extienda sus capacidades" llamando a funciones externas. El flujo es:

Definir herramientas: Describe qué pueden hacer tus tools en JSON Schema
Enviar al LLM: Incluye las tool definitions en el prompt
LLM decide: El modelo elige qué tool usar y con qué parámetros
Ejecutar: Tu código ejecuta la tool con los parámetros del LLM
Continuar: Envía el resultado de vuelta al LLM para el siguiente paso

Ejemplo Conceptual

// 1. Definir una herramienta
const tools = [
  {
    name: "read_file",
    description: "Lee el contenido de un archivo",
    parameters: {
      type: "object",
      properties: {
        path: { type: "string", description: "Ruta del archivo" }
      },
      required: ["path"]
    }
  }
];

// 2. LLM decide usarla
// Respuesta del LLM: { "tool": "read_file", "parameters": { "path": "./tareas.txt" } }

// 3. Tu código ejecuta
const result = await readFile("./tareas.txt");

// 4. Envía resultado de vuelta al LLM
// Continúa el ciclo...

Construcción Paso a Paso

Vamos a construir un agente que gestione tareas pendientes. El agente podrá:

Leer tareas de un archivo
Añadir nuevas tareas
Marcar tareas como completadas
Listar tareas pendientes

Paso 1: Tipos y Interfaces

Primero definamos los tipos TypeScript:

export interface Task {
  id: string;
  title: string;
  description?: string;
  completed: boolean;
  createdAt: Date;
  completedAt?: Date;
}

export interface TaskManager {
  getTasks(): Promise<Task[]>;
  addTask(title: string, description?: string): Promise<Task>;
  completeTask(id: string): Promise<Task>;
  getPendingTasks(): Promise<Task[]>;
}

export interface ToolCall {
  id: string;
  tool: string;
  parameters: Record<string, any>;
}

export interface AgentResponse {
  message: string;
  toolCalls?: ToolCall[];
  final?: boolean;
}

Paso 2: Implementar el Task Manager

Crea una clase que gestione las tareas (simulando una base de datos):

import { Task, TaskManager } from '../types/tasks';
import { writeFile, readFile } from 'fs/promises';
import { v4 as uuidv4 } from 'uuid';

export class FileTaskManager implements TaskManager {
  private filePath: string;

  constructor(filePath: string = './tasks.json') {
    this.filePath = filePath;
  }

  // Cargar tareas del archivo
  private async loadTasks(): Promise<Task[]> {
    try {
      const data = await readFile(this.filePath, 'utf-8');
      const tasks = JSON.parse(data);
      // Convertir strings de fecha a objetos Date
      return tasks.map((task: any) => ({
        ...task,
        createdAt: new Date(task.createdAt),
        completedAt: task.completedAt ? new Date(task.completedAt) : undefined
      }));
    } catch {
      return []; // Si no existe el archivo, retornar lista vacía
    }
  }

  // Guardar tareas al archivo
  private async saveTasks(tasks: Task[]): Promise<void> {
    await writeFile(this.filePath, JSON.stringify(tasks, null, 2));
  }

  // Obtener todas las tareas
  async getTasks(): Promise<Task[]> {
    return this.loadTasks();
  }

  // Añadir nueva tarea
  async addTask(title: string, description?: string): Promise<Task> {
    const tasks = await this.loadTasks();
    const newTask: Task = {
      id: uuidv4(),
      title,
      description,
      completed: false,
      createdAt: new Date()
    };

    tasks.push(newTask);
    await this.saveTasks(tasks);
    return newTask;
  }

  // Marcar tarea como completada
  async completeTask(id: string): Promise<Task> {
    const tasks = await this.loadTasks();
    const task = tasks.find(t => t.id === id);

    if (!task) {
      throw new Error(`Task with id ${id} not found`);
    }

    if (task.completed) {
      throw new Error(`Task ${id} is already completed`);
    }

    task.completed = true;
    task.completedAt = new Date();
    await this.saveTasks(tasks);
    return task;
  }

  // Obtener solo tareas pendientes
  async getPendingTasks(): Promise<Task[]> {
    const tasks = await this.loadTasks();
    return tasks.filter(task => !task.completed);
  }
}

Paso 3: Definir las Tools

Ahora definamos las herramientas que el LLM puede usar:

import { z } from 'zod';

// Esquemas de validación con Zod
export const AddTaskSchema = z.object({
  title: z.string().min(1).max(100),
  description: z.string().max(500).optional()
});

export const CompleteTaskSchema = z.object({
  id: z.string().uuid()
});

export const ListTasksSchema = z.object({
  filter: z.enum(['all', 'pending', 'completed']).optional().default('all')
});

// Definiciones de tools para el LLM
export const taskTools = [
  {
    name: 'add_task',
    description: 'Añade una nueva tarea a la lista. Usa esto cuando el usuario quiera crear una tarea.',
    inputSchema: {
      type: 'object',
      properties: {
        title: {
          type: 'string',
          description: 'Título de la tarea (máximo 100 caracteres)'
        },
        description: {
          type: 'string',
          description: 'Descripción opcional de la tarea (máximo 500 caracteres)'
        }
      },
      required: ['title']
    }
  },
  {
    name: 'complete_task',
    description: 'Marca una tarea como completada. Necesitas el ID de la tarea.',
    inputSchema: {
      type: 'object',
      properties: {
        id: {
          type: 'string',
          description: 'ID único de la tarea a completar'
        }
      },
      required: ['id']
    }
  },
  {
    name: 'list_tasks',
    description: 'Lista las tareas según el filtro especificado.',
    inputSchema: {
      type: 'object',
      properties: {
        filter: {
          type: 'string',
          enum: ['all', 'pending', 'completed'],
          description: 'Filtro para las tareas: all (todas), pending (pendientes), completed (completadas)',
          default: 'all'
        }
      }
    }
  }
];

Paso 4: Crear el Agente Principal

Ahora el agente que coordina todo. Este es el núcleo que ejecuta el ciclo:

import { Anthropic } from '@anthropic-ai/sdk';
import { TaskManager } from '../types/tasks';
import { taskTools, AddTaskSchema, CompleteTaskSchema, ListTasksSchema } from '../tools/definitions';
import { FileTaskManager } from '../tools/task-manager';

export class TaskAgent {
  private client: Anthropic;
  private taskManager: TaskManager;
  private maxIterations = 5; // Evitar loops infinitos

  constructor(apiKey: string, taskManager?: TaskManager) {
    this.client = new Anthropic({ apiKey });
    this.taskManager = taskManager || new FileTaskManager();
  }

  /**
   * Ejecuta el ciclo principal del agente
   * 1. Envía el mensaje al LLM
   * 2. Si el LLM quiere usar tools, las ejecuta
   * 3. Vuelve a enviar al LLM con los resultados
   * 4. Repite hasta que el LLM devuelva una respuesta final
   */
  async execute(userMessage: string): Promise<string> {
    const messages = [
      {
        role: 'user' as const,
        content: userMessage
      }
    ];

    let response = await this.callLLM(messages);
    let iterations = 0;

    // Loop principal del agente
    while (iterations < this.maxIterations) {
      // Si el LLM quiere usar tools
      if (response.toolCalls && response.toolCalls.length > 0) {
        // Ejecutar las tools y obtener resultados
        const toolResults = await this.executeTools(response.toolCalls);

        // Añadir respuesta del LLM al historial
        messages.push({
          role: 'assistant',
          content: response.message
        });

        // Añadir resultados de cada tool
        for (const result of toolResults) {
          messages.push({
            role: 'user',
            content: `Tool result for ${result.tool}: ${result.result}`
          });
        }

        // Siguiente iteración: enviar de vuelta al LLM
        response = await this.callLLM(messages);
        iterations++;
      } else {
        // El LLM dio una respuesta final (sin tools)
        return response.message;
      }
    }

    // Fallback si se alcanza max iteraciones
    return 'Lo siento, el agente alcanzó el límite máximo de iteraciones. ¿Puedes reformular tu solicitud?';
  }

  /**
   * Llama al LLM con el contexto actual y tools disponibles
   */
  private async callLLM(messages: any[]): Promise<any> {
    try {
      const response = await this.client.messages.create({
        model: 'claude-3-5-haiku-20241022',
        max_tokens: 1000,
        messages,
        tools: taskTools
      });

      const content = response.content[0];

      // Respuesta de texto (sin tools)
      if (content.type === 'text') {
        return { message: content.text };
      }
      // Respuesta con tool use
      else if (content.type === 'tool_use') {
        return {
          message: content.text || '',
          toolCalls: [{
            id: content.id,
            tool: content.name,
            parameters: content.input
          }]
        };
      }
    } catch (error) {
      console.error('Error calling LLM:', error);
      return { message: 'Lo siento, hubo un error procesando tu solicitud.' };
    }
  }

  /**
   * Ejecuta las tools que el LLM indicó
   * Mapea cada tool a su función correspondiente y valida parámetros
   */
  private async executeTools(toolCalls: any[]): Promise<any[]> {
    const results = [];

    for (const call of toolCalls) {
      try {
        let result;

        switch (call.tool) {
          case 'add_task':
            const addParams = AddTaskSchema.parse(call.parameters);
            result = await this.taskManager.addTask(
              addParams.title,
              addParams.description
            );
            break;

          case 'complete_task':
            const completeParams = CompleteTaskSchema.parse(call.parameters);
            result = await this.taskManager.completeTask(completeParams.id);
            break;

          case 'list_tasks':
            const listParams = ListTasksSchema.parse(call.parameters);
            result = await this.filterTasks(listParams.filter);
            break;

          default:
            throw new Error(`Tool ${call.tool} not found`);
        }

        results.push({
          tool: call.tool,
          result: JSON.stringify(result, null, 2)
        });

      } catch (error: any) {
        // Capturar errores de validación o ejecución
        results.push({
          tool: call.tool,
          result: `Error: ${error.message}`
        });
      }
    }

    return results;
  }

  /**
   * Helper para filtrar tareas por estado
   */
  private async filterTasks(filter: 'all' | 'pending' | 'completed'): Promise<any> {
    switch (filter) {
      case 'pending':
        return await this.taskManager.getPendingTasks();
      case 'completed':
        const allTasks = await this.taskManager.getTasks();
        return allTasks.filter(t => t.completed);
      default:
        return await this.taskManager.getTasks();
    }
  }
}

Paso 5: Punto de Entrada

Crea un script para probar el agente:

import { config } from 'dotenv';
import { TaskAgent } from './agents/task-agent';

// Cargar variables de entorno
config();

async function main() {
  const agent = new TaskAgent(process.env.ANTHROPIC_API_KEY!);

  console.log('🤖 Task Agent iniciado. Escribe tus comandos:\n');

  // Ejemplos de uso
  const examples = [
    'Añade una tarea para "Comprar leche"',
    'Lista todas las tareas',
    'Añade una tarea para "Hacer ejercicio" con descripción "Ir al gimnasio 3 veces por semana"',
    'Lista las tareas pendientes',
    'Completa la tarea con ID xxx' // Reemplaza con ID real
  ];

  console.log('Ejemplos de comandos:');
  examples.forEach(example => console.log(`  • "${example}"`));
  console.log('\nEscribe "exit" para salir.\n');

  // Bucle interactivo
  const readline = require('readline');
  const rl = readline.createInterface({
    input: process.stdin,
    output: process.stdout
  });

  const askQuestion = () => {
    rl.question('Tú: ', async (input: string) => {
      if (input.toLowerCase() === 'exit') {
        console.log('👋 ¡Hasta luego!');
        rl.close();
        return;
      }

      try {
        console.log('🤔 Pensando...');
        const response = await agent.execute(input);
        console.log(`🤖 ${response}\n`);
      } catch (error) {
        console.error('❌ Error:', error.message);
      }

      askQuestion();
    });
  };

  askQuestion();
}

main().catch(console.error);

Manejo de Errores

El agente debe manejar errores gracefully:

export class AgentError extends Error {
  constructor(
    message: string,
    public code: string,
    public tool?: string
  ) {
    super(message);
    this.name = 'AgentError';
  }
}

export function handleToolError(toolName: string, error: any): string {
  if (error instanceof AgentError) {
    return `Error en ${toolName}: ${error.message}`;
  }

  if (error.code === 'VALIDATION_ERROR') {
    return `Parámetros inválidos para ${toolName}: ${error.message}`;
  }

  if (error.code === 'NOT_FOUND') {
    return `Recurso no encontrado en ${toolName}: ${error.message}`;
  }

  // Error genérico
  return `Error inesperado en ${toolName}: ${error.message}`;
}

Testing del Agente

Crea tests para verificar que el agente funciona:

import { describe, it, expect, beforeEach, vi } from 'vitest';
import { TaskAgent } from '../agents/task-agent';
import { TaskManager } from '../types/tasks';

// Mock del TaskManager
const mockTaskManager: TaskManager = {
  getTasks: vi.fn(),
  addTask: vi.fn(),
  completeTask: vi.fn(),
  getPendingTasks: vi.fn()
};

// Mock de Anthropic
vi.mock('@anthropic-ai/sdk', () => ({
  Anthropic: vi.fn().mockImplementation(() => ({
    messages: {
      create: vi.fn()
    }
  }))
}));

describe('TaskAgent', () => {
  let agent: TaskAgent;

  beforeEach(() => {
    agent = new TaskAgent('fake-key', mockTaskManager);
    vi.clearAllMocks();
  });

  it('should handle add task requests', async () => {
    mockTaskManager.addTask.mockResolvedValue({
      id: '123',
      title: 'Test task',
      completed: false,
      createdAt: new Date()
    });

    // Aquí irían las pruebas específicas
    expect(true).toBe(true); // Placeholder
  });

  it('should validate tool parameters', () => {
    // Pruebas de validación con Zod
    expect(true).toBe(true); // Placeholder
  });
});

Ejecutando el Agente

Para probar tu agente:

# Compilar
pnpm run build

# Ejecutar
pnpm run dev

# En otra terminal, ejecutar tests
pnpm run test

Ejemplo de Interacción

Tú: Añade una tarea para comprar leche
🤔 Pensando...
🤖 He añadido la tarea "comprar leche" con ID: abc-123-def

Tú: Lista todas las tareas
🤔 Pensando...
🤖 Aquí están todas tus tareas:
- comprar leche (ID: abc-123-def) - Pendiente

Tú: Completa la tarea abc-123-def
🤔 Pensando...
🤖 He marcado como completada la tarea "comprar leche"

Conceptos Avanzados

Una vez que entiendes lo básico, puedes explorar:

Agentes con memoria: Recordar conversaciones anteriores
Agentes multi-paso: Planificar antes de ejecutar
Agentes paralelos: Ejecutar múltiples tools simultáneamente
Agentes con estado: Mantener contexto entre sesiones

Troubleshooting

El agente no responde

Verifica tu API key de Anthropic
Revisa los logs de errores
Asegúrate de que las tools están bien definidas

Error de validación

Los parámetros no coinciden con el schema
Usa Zod para validar inputs antes de enviar

Loop infinito

Implementa límite de iteraciones
Añade timeout para cada tool call

Próximos Pasos

Ahora que tienes un agente básico funcionando, tienes varios caminos:

Camino 1: Profundizar en Agentes (Recomendado)

Agente Investigador — Patrón Plan-Execute-Synthesize
- Aprende a construir agentes que planifican antes de actuar
- Cómo manejar contexto y memoria
- Agentes que se comunican con otros agentes

Camino 2: Explorar MCP (Model Context Protocol)

MCP Servers — Construir servidores que el LLM puede usar
- Diferencia entre Tool Use y MCP
- Integración con Claude Desktop
- Distribuir funcionalidad como MCP Server

Camino 3: Validar tu Conocimiento (Recomendado después)

Ejercicios Prácticos — Desafíos sin soluciones
- Nivel 1: Fundamentals
- Nivel 2: Intermediate
- Nivel 3: Advanced

Camino 4: Mejorar Calidad de Código

4R Framework — Ingeniería responsable con IA
- Risk, Readability, Reliability, Resilience
- Aplicar estos principios a tu agente

Experimentación Local

Antes de seguir adelante, prueba estas variaciones con tu agente:

# 1. Añade una nueva tool
# Ejemplo: delete_task, edit_task

# 2. Modifica el modelo (usa claude-3-5-sonnet para más potencia)
# ANTHROPIC_MODEL=claude-3-5-sonnet-20241022

# 3. Aumenta max_tokens para respuestas más detalladas
# max_tokens: 2000

# 4. Añade persistencia entre sesiones
# Guarda el historial de tareas en BD

# 5. Añade logging para ver qué hace el LLM
# Inspecciona qué tools elige y por qué

¿Tu primer agente funciona? ¡Felicitaciones! Has dado el primer paso hacia sistemas de IA más sofisticados. 🚀

¿Qué es un Agente de IA?​

Comparativa: Chatbot vs Agente​

El Ciclo Básico de un Agente​

Patrón Tool Use​

Ejemplo Conceptual​

Construcción Paso a Paso​

Paso 1: Tipos y Interfaces​

Paso 2: Implementar el Task Manager​

Paso 3: Definir las Tools​

Paso 4: Crear el Agente Principal​

Paso 5: Punto de Entrada​

Manejo de Errores​

Testing del Agente​

Ejecutando el Agente​

Ejemplo de Interacción​

Conceptos Avanzados​

Troubleshooting​

El agente no responde​

Error de validación​

Loop infinito​

Próximos Pasos​

Camino 1: Profundizar en Agentes (Recomendado)​

Camino 2: Explorar MCP (Model Context Protocol)​

Camino 3: Validar tu Conocimiento (Recomendado después)​

Camino 4: Mejorar Calidad de Código​

Experimentación Local​