Benchmarks
Klinische Tasks zur Evaluation generativer Fähigkeiten
ICD-10-GM Kodierung
Haupt- und Nebendiagnosen aus klinischem Freitext kodieren
50 Fälle
Arztbrief-Zusammenfassung
Strukturierte Kurzfassung von Entlassbriefen erstellen
50 Fälle
Klinisches Reasoning
Differentialdiagnostik mit klinischer Begründung aus Fallvignetten
50 Fälle
Medikamentenextraktion
Wirkstoff, Dosis und Frequenz aus klinischem Freitext extrahieren
50 Fälle
Medizinisches Wissen
Multiple-Choice-Fragen im IMPP-Stil zu klinischem Fachwissen beantworten
49 Fälle
Patientenverständliche Erklärung
Komplexe medizinische Befunde für Patienten verständlich erklären
50 Fälle
Alle Datensätze, Prompts und Evaluations-Ergebnisse sind Open Source und als JSONL verfügbar: github.com/thalamiq/germedbench