Wie sich Spitzen-KI-Modelle über die Zeit entwickelt haben – Live-Tracking der ELO-Werte
Ein neues Open-Source-Dashboard visualisiert, wie sich die Leistung führender KI-Modelle seit ihrer Veröffentlichung verändert hat. Die Daten zeigen überraschende Trends und werfen Fragen zur Genauigkeit von API-Benchmarks auf.