Benchmarks

Klinische Tasks zur Evaluation generativer Fähigkeiten

ICD-10-GM Kodierung

Haupt- und Nebendiagnosen aus klinischem Freitext kodieren

50 Fälle

Arztbrief-Zusammenfassung

Strukturierte Kurzfassung von Entlassbriefen erstellen

50 Fälle

Klinisches Reasoning

Differentialdiagnostik mit klinischer Begründung aus Fallvignetten

50 Fälle

Medikamentenextraktion

Wirkstoff, Dosis und Frequenz aus klinischem Freitext extrahieren

50 Fälle

Medizinisches Wissen

Multiple-Choice-Fragen im IMPP-Stil zu klinischem Fachwissen beantworten

49 Fälle

Patientenverständliche Erklärung

Komplexe medizinische Befunde für Patienten verständlich erklären

50 Fälle

Alle Datensätze, Prompts und Evaluations-Ergebnisse sind Open Source und als JSONL verfügbar: github.com/thalamiq/germedbench

Benchmarks | GerMedBench