Schlagwort: Testset-Leckage

Testset-Leckagen und Dekontamination in der Bewertung von Large Language Models
Nikki Schröder 1 7 Juli 2025

Testset-Leckagen und Dekontamination in der Bewertung von Large Language Models

Testset-Leckagen verfälschen die Leistungsmessung von LLMs, indem Trainingsdaten Benchmark-Fragen enthalten. Decontamination ist der einzige Weg, echte Fähigkeiten zu messen - nicht Auswendiglernen.