Tag: Testing for Evasion Attacks
Techniques de test pour évaluer la résilience des systèmes d’IA contre les attaques par évasion, où un adversaire manipule les entrées pour contourner la détection, la classification ou les contrôles de sécurité. Inclut des exemples adverses, des perturbations imperceptibles, l’injection de prompts, le jailbreak et d’autres stratégies pour contourner les défenses du modèle sans en altérer la structure interne.