Skip to content
Todos los proyectos

Summarization for Pydantic AI

Resumen automático de conversaciones para contexto ilimitado

Tres estrategias de gestión de contexto: resumen inteligente LLM, ventana deslizante sin costo y context manager en tiempo real con seguimiento de tokens.

Instalación

Terminal
pip install summarization-pydantic-ai

Dos estrategias para mantener las conversaciones de agentes dentro de los límites de contexto. El resumen basado en LLM comprime inteligentemente mensajes antiguos preservando información clave — activado por cantidad de mensajes, tokens o fracción de contexto. El recorte por ventana deslizante sin costo simplemente elimina los mensajes más antiguos con un corte seguro que nunca rompe pares de llamada/respuesta de herramientas. Un context manager en tiempo real rastrea el uso de tokens en vivo, trunca salidas largas de herramientas y auto-detecta ventanas de contexto de modelos.

Características

Resumen LLM
Ventana Deslizante
Context Manager Real-time
Seguimiento de Tokens

Inicio Rápido

summarization_example.py
from pydantic_ai import Agent
from pydantic_ai_summarization import create_summarization_processor
processor = create_summarization_processor(
trigger=("tokens", 100000),
keep=("messages", 20),
)
agent = Agent(
"openai:gpt-4o",
history_processors=[processor],
)
result = await agent.run("Hello!")

Casos de Uso

Conversaciones Largas

Mantén agentes ejecutándose por horas sin alcanzar límites de contexto — los mensajes antiguos se resumen automáticamente.

Bots de Soporte al Cliente

Preserva datos clave del cliente (nombre, problema, ID de pedido) mientras descartas intercambios rutinarios.

Asistentes de Investigación

Mantén el contexto de investigación en sesiones profundas donde los hallazgos acumulados excederían la ventana de contexto.

Apps Sensibles al Costo

Elige ventana deslizante sin costo para máximo rendimiento, o resumen LLM cuando la calidad importa más que la velocidad.

¿Listo para construir tu primer agente IA en producción?

Herramientas open-source, patrones probados en batalla, cero boilerplate. Configura tu stack y despliega en minutos — no meses.