GerMedBench

Benchmarks

Klinische Tasks zur Evaluation generativer Fähigkeiten

Alle Datensätze, Prompts und Evaluations-Ergebnisse sind Open Source und als JSONL verfügbar: github.com/thalamiq/germedbench

Benchmarks | GerMedBench