DelCast Network es nuestra plataforma interna de operaciones: un sistema de monitoreo y telemetría que nos permite supervisar la salud, performance y seguridad de todos los sistemas que desplegamos para nuestros clientes.
Desafío Técnico
Con múltiples proyectos en producción simultáneamente, necesitábamos visibilidad centralizada sobre uptime, errores, consumo de recursos y trending de performance sin depender de herramientas cloud costosas (Datadog, New Relic).
Solución Arquitectónica
- Agentes ligeros: Scripts de telemetría en cada servidor que reportan métricas via HTTP cada 30 segundos
- Dashboard centralizado: Interfaz Node.js con gráficos de series temporales y alertas configurables
- Alertas inteligentes: Sistema de umbrales con escalamiento automático por Telegram y WhatsApp
- Logs consolidados: Agregación de logs de error de todos los proyectos en una vista única con búsqueda full-text
Resultados
Detectamos el 100% de las incidencias antes de que los clientes las reporten. El MTTR (Mean Time To Resolve) promedio bajó de 4 horas a 22 minutos.