Kuenstliche Intelligenz / reality check / 3 MIN LESEN

GPT-5: Was die Benchmarks wirklich zeigen

Marketing redet von 90%, unabhaengige Tests sehen 62%. Wir trennen Beweis von Behauptung.

AKTUALISIERT 2026-04-28 / ZEITHORIZONT · now / ID · 1DB50557

Reality 62 /100

Hype 78 /100

Impact 70 /100

Erklaerung

Die naechste Generation grosser Sprachmodelle wird hoch gehandelt. Tests zeigen schoenere Ergebnisse als der Alltag liefert. Dieser Artikel ordnet die Zahlen ein.

Reality Meter

Kuenstliche Intelligenz Zeithorizont · now

Reality Score 62 / 100

Hype-Risiko 78 / 100

Impact 70 / 100

Quellen-Qualitaet 80 / 100

Community-Confidence 55 / 100

Zeithorizont

Erwartet in now

Community-Einschaetzung

Community-Live-AggregatIdle

Reality (Artikel)62/ 100

Hype78/ 100

Impact70/ 100

Confidence55/ 100

Prediction Ja0%noch keine

Prediction-Stimmen0∑

Glossar

MMLU-Pro: Erweiterter Multi-Task-Benchmark fuer Sprachmodelle.
Daten-Kontamination: Trainingsdaten enthalten bereits den Test.

Quellen

Tier 1 Independent Replication of GPT-5 Benchmark Claims arxiv.org 90
Tier 1 MIT CSAIL: A Closer Look at GPT-5 news.mit.edu 85

Prediction

Wird GPT-5 in 12 Monaten 90% der angegebenen Benchmarks erreichen?

Abstimmung

Schnellbewertung

Sterne (1–5)

Wie real ist das? Reality Ø 62

Mehr oder weniger davon?