📊 Agentic AI : Gestion des Erreurs et Monitoring (2.4/4)

⏱️

Temps de lecture estimé
~5 minutes

ℹ️

Cet article fait partie d’une série sur les guardrails. Il détaille la surveillance, le logging et la gestion de la continuité opérationnelle.

La gestion des erreurs et le monitoring constituent les piliers de la résilience des systèmes d’agents IA. Une approche proactive de la surveillance permet de détecter rapidement les déviations, d’assurer la continuité de service et d’améliorer continuellement la performance des guardrails.

🎯 Vision d’ensemble : Ce guide vous accompagne dans la mise en place d’un système d’observabilité complet qui transforme votre infrastructure de guardrails en un système auto-adaptatif et résilient. Vous apprendrez à anticiper les problèmes, à maintenir la continuité de service même en cas de défaillance, et à optimiser continuellement vos protections basées sur des données réelles d’usage.

Stratégies de Logging 📝

Architecture de Logging

Une stratégie de logging efficace pour les agents IA doit capturer à la fois les événements normaux et les anomalies, tout en préservant la performance et la confidentialité.

Niveaux de Logging

Niveau	Usage	Exemple	Fréquence
`TRACE`	Debug détaillé	Tokens individuels, états internes	Développement uniquement
`DEBUG`	Flux de traitement	Étapes de validation, choix de stratégie	Environnement de test
`INFO`	Événements normaux	Requête traitée, action appliquée	Production normale
`WARN`	Situations inhabituelles	Seuil proche, fallback utilisé	Surveillance continue
`ERROR`	Erreurs récupérables	Échec de validation, retry déclenché	Alerte immédiate
`FATAL`	Erreurs critiques	Violation de sécurité, corruption	Escalade d’urgence

Composants à Logger

Composant	Informations Clés	Métriques Associées
Guardrails d’Entrée	Type de détection, confiance, action	`input_blocked_total`, `detection_latency`
Guardrails de Sortie	Validation échouée, contenu filtré	`output_filtered_total`, `quality_score`
Stratégies de Mitigation	Action choisie, succès/échec, latence	`mitigation_applied_total`, `action_latency`
Orchestrateur	Chaîne d’actions, budget consommé	`chain_length`, `total_latency`
Modèle LLM	Tokens consommés, température, modèle	`tokens_total`, `model_switch_total`

Format des Logs Structurés

Schema JSON Standard

{
  "timestamp": "2025-09-09T10:15:30.123Z",
  "level": "INFO",
  "component": "guardrail.output",
  "event_type": "content_filtered",
  "request_id": "req_abc123",
  "session_id": "sess_xyz789",
  "user_profile": "medium_risk",
  "detector": {
    "name": "pii_detector",
    "version": "1.2.3",
    "confidence": 0.87,
    "execution_time_ms": 12
  },
  "action": {
    "type": "filter",
    "success": true,
    "tokens_affected": 3,
    "fallback_used": false
  },
  "context": {
    "model": "gpt-4",
    "temperature": 0.7,
    "max_tokens": 1000,
    "chain_position": 2
  },
  "metrics": {
    "total_latency_ms": 156,
    "tokens_input": 45,
    "tokens_output": 123,
    "cost_usd": 0.0023
  },
  "security": {
    "payload_hash": "sha256:a1b2c3...",
    "classification": "sensitive",
    "retention_days": 30
  }
}

Logs Orientés Événements

Structurer les logs autour d’événements métier facilite l’analyse et l’alerting :

# Exemple d'émission d'événements structurés
logger.info(
    "guardrail_triggered",
    extra={
        "event_data": {
            "trigger_type": "prompt_injection",
            "severity": "high",
            "mitigation_path": ["block", "alert"],
            "user_context": {"profile": "external", "session_age": "5m"},
            "detection_details": {
                "patterns_matched": ["sql_injection", "system_prompt_leak"],
                "confidence_scores": [0.92, 0.78]
            }
        }
    }
)

💡 Conseil : Utilisez des IDs de corrélation cohérents (request_id, session_id) pour tracer les requêtes à travers tous les composants.

🎯 Objectif de cette section : Établir une stratégie de logging robuste qui capture tous les événements critiques tout en préservant la performance et la confidentialité. Un logging bien structuré est la base de toute analyse post-incident efficace et permet une amélioration continue des guardrails.

Gestion de la Confidentialité

Stratégies de Protection

Stratégie	Méthode	Usage	Exemple
Hachage	SHA-256 du contenu	Corrélation sans stockage	`payload_hash: "a1b2c3..."`
Masquage	Remplacement par placeholder	Logs de debug	`"email": "[EMAIL_REDACTED]"`
Échantillonnage	Logging partiel avec consentement	Amélioration qualité	1% des requêtes anonymisées
Chiffrement	AES-256 avec rotation de clés	Stockage sécurisé	Logs chiffrés avec TTL

Implémentation du Masquage

import re
import hashlib

class SecureLogger:
    def __init__(self):
        self.pii_patterns = {
            'email': r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b',
            'phone': r'\b\d{3}-\d{3}-\d{4}\b',
            'ssn': r'\b\d{3}-\d{2}-\d{4}\b',
            'api_key': r'\b[A-Za-z0-9]{32,}\b'
        }
    
    def sanitize_payload(self, text: str, include_hash: bool = True) -> dict:
        sanitized = text
        detected_types = []
        
        for pii_type, pattern in self.pii_patterns.items():
            if re.search(pattern, sanitized):
                sanitized = re.sub(pattern, f'[{pii_type.upper()}_REDACTED]', sanitized)
                detected_types.append(pii_type)
        
        result = {
            'sanitized_content': sanitized,
            'pii_detected': detected_types
        }
        
        if include_hash:
            result['original_hash'] = hashlib.sha256(text.encode()).hexdigest()[:16]
            
        return result

Gestion de la Continuité 🔄

Stratégies de Résilience

Niveaux de Dégradation Gracieuse

Niveau	Condition	Comportement	Exemple
Normal	Tous systèmes opérationnels	Guardrails complets actifs	Validation + filtrage + monitoring
Dégradé	Certains détecteurs en échec	Guardrails essentiels uniquement	PII + injection, autres désactivés
Minimal	Systèmes critiques seulement	Blocage sur liste noire	Mots-clés interdits, pas d’IA
Échec	Panne totale des guardrails	Mode fail-safe configurable	Blocage total ou passage direct

Circuit Breaker Pattern

from enum import Enum
import time
from typing import Optional

class CircuitState(Enum):
    CLOSED = "closed"      # Normal operation
    OPEN = "open"          # Blocking calls
    HALF_OPEN = "half_open" # Testing recovery

class GuardrailCircuitBreaker:
    def __init__(self, failure_threshold: int = 5, recovery_timeout: int = 60):
        self.failure_threshold = failure_threshold
        self.recovery_timeout = recovery_timeout
        self.failure_count = 0
        self.last_failure_time: Optional[float] = None
        self.state = CircuitState.CLOSED
    
    def call(self, guardrail_func, *args, **kwargs):
        if self.state == CircuitState.OPEN:
            if self._should_attempt_reset():
                self.state = CircuitState.HALF_OPEN
            else:
                raise CircuitBreakerOpenError("Guardrail circuit is open")
        
        try:
            result = guardrail_func(*args, **kwargs)
            self._on_success()
            return result
        except Exception as e:
            self._on_failure()
            raise
    
    def _should_attempt_reset(self) -> bool:
        return (
            self.last_failure_time and 
            time.time() - self.last_failure_time >= self.recovery_timeout
        )
    
    def _on_success(self):
        self.failure_count = 0
        self.state = CircuitState.CLOSED
    
    def _on_failure(self):
        self.failure_count += 1
        self.last_failure_time = time.time()
        
        if self.failure_count >= self.failure_threshold:
            self.state = CircuitState.OPEN

Stratégies de Fallback

Hiérarchie de Fallback

Fallback Intelligent : Modèle plus simple ou règles heuristiques
Fallback Rapide : Cache de réponses pré-approuvées
Fallback Minimal : Réponse générique sécurisée
Fail-Safe : Blocage total avec message d’erreur

class FallbackOrchestrator:
    def __init__(self):
        self.fallback_chain = [
            self.smart_fallback,
            self.cache_fallback, 
            self.minimal_fallback,
            self.fail_safe
        ]
    
    async def process_with_fallback(self, request):
        last_error = None
        
        for fallback in self.fallback_chain:
            try:
                return await fallback(request)
            except Exception as e:
                last_error = e
                logger.warning(f"Fallback {fallback.__name__} failed: {e}")
                continue
        
        # Si tous les fallbacks échouent
        raise FallbackExhaustedException(f"All fallbacks failed. Last error: {last_error}")
    
    async def smart_fallback(self, request):
        # Utilise un modèle plus simple ou des règles
        return await self.simple_model.generate(request.prompt)
    
    async def cache_fallback(self, request):
        # Recherche dans le cache de réponses sûres
        cache_key = hash(request.prompt)
        if cached := self.safe_response_cache.get(cache_key):
            return cached
        raise CacheNotFoundException()
    
    async def minimal_fallback(self, request):
        # Réponse générique mais sécurisée
        return {
            "response": "Je ne peux pas traiter cette demande pour le moment. Veuillez réessayer plus tard.",
            "type": "minimal_fallback",
            "safe": True
        }
    
    def fail_safe(self, request):
        # Dernier recours : blocage avec log
        logger.error(f"Fail-safe triggered for request {request.id}")
        raise FailSafeTriggered("All processing options exhausted")

🎯 Objectif de cette section : Assurer la résilience du système en cas de défaillance partielle ou totale des guardrails. Les stratégies de continuité permettent de maintenir un niveau de service acceptable même lors de pannes, tout en préservant la sécurité. L’implémentation de circuit breakers et de fallbacks intelligents évite les cascades de pannes et garantit une dégradation gracieuse.

Monitoring en Temps Réel 📈

Métriques Clés par Composant

Dashboard de Santé Système

Métrique	Seuil Warning	Seuil Critical	Action
Latence P95	> 200ms	> 500ms	Scale out / optimisation
Taux d’erreur	> 1%	> 5%	Investigation immédiate
Disponibilité	< 99.5%	< 99%	Escalade ops
Utilisation CPU	> 80%	> 95%	Auto-scaling
Mémoire	> 85%	> 95%	Redémarrage / scale

Métriques Spécifiques aux Guardrails

from prometheus_client import Counter, Histogram, Gauge, Info

# Compteurs d'événements
guardrail_triggers = Counter(
    'guardrail_triggers_total',
    'Number of guardrail triggers',
    ['component', 'trigger_type', 'severity', 'action']
)

# Latences par étape
processing_latency = Histogram(
    'guardrail_processing_seconds',
    'Time spent in guardrail processing',
    ['component', 'action'],
    buckets=[0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1.0, 2.0, 5.0]
)

# État des systèmes
system_health = Gauge(
    'guardrail_system_health',
    'Health status of guardrail components',
    ['component', 'instance']
)

# Informations de version
component_info = Info(
    'guardrail_component_info',
    'Information about guardrail components'
)

# Utilisation dans le code
def monitor_guardrail_execution(func):
    def wrapper(*args, **kwargs):
        component = func.__name__
        start_time = time.time()
        
        try:
            result = func(*args, **kwargs)
            
            # Métriques de succès
            processing_latency.labels(
                component=component, 
                action='success'
            ).observe(time.time() - start_time)
            
            if hasattr(result, 'action_type'):
                guardrail_triggers.labels(
                    component=component,
                    trigger_type=result.trigger_type,
                    severity=result.severity,
                    action=result.action_type
                ).inc()
            
            return result
            
        except Exception as e:
            # Métriques d'erreur
            processing_latency.labels(
                component=component, 
                action='error'
            ).observe(time.time() - start_time)
            
            guardrail_triggers.labels(
                component=component,
                trigger_type='error',
                severity='high',
                action='exception'
            ).inc()
            
            raise
    
    return wrapper

Alerting et Escalade

Matrice d’Alerting

Criticité	Conditions	Destinataires	Délai Response	Actions
P0 - Critique	Sécurité compromise, panne totale	Équipe sécurité + ops	15 min	Escalade immédiate
P1 - Majeur	Dégradation significative	Équipe produit + ops	1 heure	Investigation prioritaire
P2 - Mineur	Métriques hors seuils	Équipe technique	4 heures	Analyse planifiée
P3 - Info	Tendances inhabituelles	Logs automatiques	24 heures	Revue périodique

Configuration Alertmanager

# alertmanager.yml
groups:
- name: guardrails
  rules:
  - alert: GuardrailHighErrorRate
    expr: rate(guardrail_triggers_total{action="exception"}[5m]) > 0.01
    for: 2m
    labels:
      severity: critical
      component: guardrail
    annotations:
      summary: "High error rate in guardrails"
      description: "Guardrail error rate is {{ $value | humanizePercentage }} over the last 5 minutes"
      
  - alert: GuardrailLatencyHigh
    expr: histogram_quantile(0.95, rate(guardrail_processing_seconds_bucket[5m])) > 0.5
    for: 5m
    labels:
      severity: warning
      component: performance
    annotations:
      summary: "Guardrail processing latency is high"
      description: "95th percentile latency is {{ $value }}s"

  - alert: GuardrailComponentDown
    expr: guardrail_system_health == 0
    for: 1m
    labels:
      severity: critical
      component: availability
    annotations:
      summary: "Guardrail component is down"
      description: "Component {{ $labels.component }} on {{ $labels.instance }} is down"

Observabilité Avancée

Tracing Distribué

from opentelemetry import trace
from opentelemetry.instrumentation.auto_instrumentation import sitecustomize

tracer = trace.get_tracer(__name__)

class GuardrailTracer:
    def __init__(self):
        self.tracer = trace.get_tracer("guardrail.system")
    
    def trace_request(self, request_id: str):
        return self.tracer.start_as_current_span(
            "guardrail.request",
            attributes={
                "request.id": request_id,
                "request.timestamp": time.time(),
                "system.component": "guardrail"
            }
        )
    
    def trace_detection(self, detector_name: str, span_context=None):
        return self.tracer.start_as_current_span(
            f"guardrail.detection.{detector_name}",
            context=span_context,
            attributes={
                "detector.name": detector_name,
                "detector.type": "input" if "input" in detector_name else "output"
            }
        )

# Usage
async def process_request(request):
    tracer = GuardrailTracer()
    
    with tracer.trace_request(request.id) as request_span:
        request_span.set_attributes({
            "request.user_profile": request.user_profile,
            "request.content_length": len(request.content)
        })
        
        # Détection
        for detector in self.detectors:
            with tracer.trace_detection(detector.name, request_span) as detection_span:
                result = await detector.detect(request.content)
                detection_span.set_attributes({
                    "detection.confidence": result.confidence,
                    "detection.triggered": result.triggered,
                    "detection.latency_ms": result.latency
                })
                
                if result.triggered:
                    request_span.add_event(
                        "guardrail_triggered",
                        attributes={
                            "trigger.type": result.type,
                            "trigger.severity": result.severity
                        }
                    )

Tableaux de Bord Opérationnels

Dashboard Grafana - Exemples de Panneaux

# Panneau: Santé Globale
- title: "Guardrails Health Overview"
  type: stat
  targets:
    - expr: 'avg(guardrail_system_health)'
      legendFormat: "Overall Health"
  fieldConfig:
    thresholds:
      - color: red
        value: 0.5
      - color: yellow  
        value: 0.8
      - color: green
        value: 0.95

# Panneau: Triggers par Type
- title: "Guardrail Triggers by Type"
  type: piechart
  targets:
    - expr: 'sum by (trigger_type) (rate(guardrail_triggers_total[5m]))'
      legendFormat: "{{ trigger_type }}"

# Panneau: Latence P95
- title: "Processing Latency P95"
  type: graph
  targets:
    - expr: 'histogram_quantile(0.95, sum(rate(guardrail_processing_seconds_bucket[5m])) by (le, component))'
      legendFormat: "{{ component }}"

💡 Conseil : Configurez des dashboards par équipe (sécurité, ops, produit) avec des métriques adaptées à leurs responsabilités.

🎯 Objectif de cette section : Mettre en place une observabilité complète qui permet de détecter proactivement les problèmes, d’alerter les bonnes équipes au bon moment, et de fournir la visibilité nécessaire pour des décisions rapides. Le monitoring en temps réel transforme la gestion réactive en gestion prédictive, réduisant significativement les temps de résolution d’incidents.

Analyses et Amélioration Continue 🔄

Analyse Post-Incident

Template de Post-Mortem

# Post-Mortem : [Titre de l'Incident]

## Résumé Exécutif
- **Date/Heure** : 2025-09-09 14:30 UTC
- **Durée** : 45 minutes
- **Impact** : 12% des requêtes bloquées
- **Cause Racine** : Seuil de détection PII trop sensible

## Timeline
- 14:30 - Pic d'alertes "high false positive rate"
- 14:35 - Investigation débutée
- 14:45 - Cause identifiée
- 15:00 - Seuil ajusté temporairement
- 15:15 - Solution permanente déployée

## Analyse Technique
- **Détecteur concerné** : pii_email_v2.1
- **Métriques clés** :
  - Taux de faux positifs : 8.3% (normal < 1%)
  - Latence P95 : 450ms (normal < 200ms)
- **Données affectées** : 1,247 requêtes sur 4h

## Actions Correctives
- [ ] Retuning du modèle de détection PII
- [ ] Ajout d'alertes sur taux de faux positifs
- [ ] Amélioration des tests de régression
- [ ] Documentation des seuils critiques

## Leçons Apprises
- Besoin de monitoring sur qualité des détections
- Tests A/B nécessaires pour changements de seuils
- Formation équipe sur debugging des guardrails

Optimisation Continue

Métriques de Performance à Suivre

Métrique	Cible	Mesure	Fréquence
Précision	> 98%	TP/(TP+FP)	Hebdomadaire
Rappel	> 95%	TP/(TP+FN)	Hebdomadaire
Latence P95	< 200ms	Distribution temps réponse	Continue
Coût par requête	< $0.01	Tokens + compute	Quotidienne
Satisfaction utilisateur	> 4.2/5	Feedback utilisateurs	Mensuelle

Processus d’Amélioration

class GuardrailOptimizer:
    def __init__(self):
        self.metrics_collector = MetricsCollector()
        self.model_trainer = ModelTrainer()
        self.threshold_optimizer = ThresholdOptimizer()
    
    def weekly_optimization(self):
        """Processus d'optimisation hebdomadaire"""
        
        # 1. Collecte des métriques
        metrics = self.metrics_collector.get_week_metrics()
        
        # 2. Identification des problèmes
        issues = self.identify_performance_issues(metrics)
        
        # 3. Optimisations ciblées
        for issue in issues:
            if issue.type == "false_positive":
                self.optimize_precision(issue.detector)
            elif issue.type == "latency":
                self.optimize_performance(issue.component)
            elif issue.type == "cost":
                self.optimize_efficiency(issue.resource)
        
        # 4. Tests A/B
        self.schedule_ab_tests(self.get_optimization_candidates())
        
        # 5. Rapport
        self.generate_optimization_report(metrics, issues)
    
    def identify_performance_issues(self, metrics):
        issues = []
        
        # Détection automatique des problèmes
        for component, data in metrics.items():
            if data.false_positive_rate > 0.02:  # 2%
                issues.append(PerformanceIssue(
                    type="false_positive",
                    detector=component,
                    severity="medium",
                    data=data
                ))
            
            if data.latency_p95 > 0.3:  # 300ms
                issues.append(PerformanceIssue(
                    type="latency", 
                    component=component,
                    severity="high",
                    data=data
                ))
        
        return issues

Cette approche complète de monitoring et gestion d’erreurs assure la fiabilité et l’amélioration continue de vos guardrails. L’investissement dans l’observabilité se traduit directement par une meilleure protection et une expérience utilisateur optimisée.

🎯 Objectif de cette section : Créer un cycle d’amélioration continue basé sur des données factuelles. L’analyse systématique des incidents et l’optimisation régulière des performances permettent d’affiner constamment les guardrails. Cette approche data-driven assure que le système devient plus intelligent et plus efficace au fil du temps, réduisant progressivement les faux positifs tout en maintenant un haut niveau de sécurité.

💡 Conseil Final : Démarrez avec un monitoring simple mais complet, puis enrichissez progressivement selon vos besoins opérationnels spécifiques.