Neues Open-Dataset von GitHub fördert mehrsprachige KI-Forschung
GitHub veröffentlicht ein neues Open-Dataset, das über 40 Millionen öffentliche Repositories auf nicht-englische Inhalte untersucht. Die Daten helfen, KI-Modelle für Entwickler:innen in verschiedenen Sprachen zu verbessern und Sprachlücken zu schließen.