AgentThreatBench: Neuer Benchmark misst Sicherheitsrisiken von KI-Agenten
Klassische Sicherheitsbenchmarks reichen nicht aus, um autonome KI-Agenten zu testen. Der neue Benchmark AgentThreatBench deckt erstmals gezielt OWASP-Top-10-Risiken für Agenten ab – mit realistischen Angriffsszenarien wie Speichervergiftung oder Datenlecks.