Open-Source Terminal-Agent übertrifft Google mit neuem Benchmark-Rekord
Ein neu entwickelter Open-Source-Agent erreicht auf TerminalBench 2.0 eine beeindruckende Genauigkeit von 65,2 % – und übertrifft damit die Leistung von Googles offizieller Lösung sowie geschlossener Konkurrenzmodelle. Doch was steckt hinter diesem Erfolg?