Kuenstliche Intelligenz / reality check / 4 MIN LESEN

Preprint-Server verschärfen Moderation, während KI-Junk-Science Repositories überschwemmt

Die Open-Science-Infrastruktur, die COVID-Forschung beschleunigt hat, wird nun von KI-generierten Inhalten missbraucht, und Preprint-Server werden stillschweigend zu Gatekeepern — genau die Rolle, die sie umgehen sollten.

AKTUALISIERT 2026-05-06 / ZEITHORIZONT · mid term / ID · 1256A313

Reality 72 /100

Hype 35 /100

Impact 65 /100

Erklaerung

Preprint-Server — Plattformen wie bioRxiv, medRxiv und arXiv, auf denen Forschende Studien vor formaler Peer-Review veröffentlichen — wurden entworfen, um Wissenschaft schnell und offen zu teilen. Kein Warten auf Monate für Journal-Redakteure. Keine Paywalls. Nur rohe Forschung, in die Welt hinaus.

Dieses Modell steht unter Druck. Ein Anstieg von KI-generierten Inhalten und minderwertigen Einreichungen zwingt diese Plattformen, Screening-Schichten hinzuzufügen, die sie nie beabsichtigten zu haben. Nature berichtet von der Spannung: zu wenig moderieren, und die Server werden zur Müllkippe, die das Vertrauen der Öffentlichkeit in die Wissenschaft untergräbt; zu viel moderieren, und man hat gerade das langsame, gatekeeping-System wiederaufgebaut, das Preprints überwinden sollten.

Die praktischen Einsätze sind real. Journalisten, Politikgestalter und andere Forschende zitieren routinemäßig Preprints — manchmal bevor sie ernsthaft überprüft wurden. Wenn Junk durchschlüpft, bleibt er nicht isoliert. Er wird zitiert, geteilt und gelegentlich in politische Debatten eingeschleust. Die Pandemie machte dies sichtbar; KI-generiertes Volumen macht es strukturell.

Was sich konkret ändert: Server investieren in automatisierte Screening-Tools, erweitern menschliche Moderationsteams und führen in einigen Fällen gestaffelte Sichtbarkeit ein — flaggen unüberprüfte oder hochriskante Beiträge, anstatt sie ganz zu entfernen. Keine dieser Lösungen ist kostenlos. Sie kosten Geld, führen neue redaktionelle Urteilsfindungen ein und werfen Fragen darüber auf, wer entscheidet, was als „Junk" zählt.

Das tiefere Problem ist, dass Preprints ein Workaround für ein kaputtes Verlagssystem waren, keine permanente Lösung. Jetzt erben sie einige dieser Systemprobleme — plus neue, die die ursprünglichen Designer nicht vorausgesehen haben. Beobachten Sie, ob große Geldgeber eingreifen, um Moderationsinfrastruktur zu subventionieren, oder ob die Last ungleich auf kleinere, unterfinanzierte Server fällt.

Die Moderations-Ausweitung, die jetzt in der Preprint-Infrastruktur sichtbar ist, ist ein vorhersehbarer Effekt zweiter Ordnung von zwei konvergierenden Drücken: der Kommodifizierung von plausibel aussehenden wissenschaftlichen Texten via LLMs und dem Reputationsschaden, den Preprint-Ökosysteme während und nach COVID-19 durch das Hosting von hochkarätiger Desinformation erlitten haben.

Die Kernspannung ist architektonisch. Plattformen wie bioRxiv wurden explizit als Low-Friction-Depositionssysteme entworfen — das Wertversprechen war Geschwindigkeit und Offenheit, mit dem impliziten Vertrag, dass nachgelagerte Leser (Forschende, Journalisten) ihre eigenen kritischen Filter anwenden würden. Dieser Vertrag ist zusammengebrochen. Zitierung von Preprints durch Nicht-Spezialisten-Publikum, kombiniert mit den nahezu null Grenzkosten für die Generierung strukturell kohärenter, aber wissenschaftlich hohler Manuskripte, hat die Risikokalkulation für Server-Betreiber verschoben.

Aktuelle Moderationsreaktionen fallen in drei breite Kategorien: (1) automatisiertes Screening auf KI-generierte Inhalte mit Tools wie GPTZero oder hausinternen Klassifikatoren — an den Rändern unzuverlässig und spielbar; (2) erweiterte menschliche Triage, die schlecht skaliert und inkonsistente redaktionelle Urteilsfindung einführt; und (3) gestaffelte Sichtbarkeitssysteme oder „Flagging"-Systeme, die offene Deposition bewahren, während sie Risikosignale für Leser sichtbar machen. Der dritte Ansatz ist epistemisch ehrlicher, erfordert aber UI-Investitionen und riskiert Flag-Blindheit über die Zeit.

Die Vorarbeit hier ist aufschlussreich. SSRN führte vor Jahren grundlegendes Screening ein; arXiv hat lange Moderator-Netzwerke mit domänenspezifischer Expertise genutzt. Keines hat das Volumenproblem gelöst, und keines sah sich der aktuellen Rate von KI-gestützten Einreichungen gegenüber. Die Frage ist nicht, ob eine gewisse Moderation notwendig ist — das ist sie eindeutig — sondern ob die entstehenden Rahmenwerke transparent, konsistent angewendet und resistent gegen Scope-Creep in Richtung ideologischer oder methodologischer Gatekeeping sein werden.

Offene Fragen, die es zu verfolgen gilt: Werden Moderationsstandards über Server hinweg konvergieren oder fragmentieren auf Weise, die Arbitrage schafft (böswillige Akteure leiten Einreichungen zur am wenigsten gescreenten Plattform)? Wird sich KI-Erkennungstooling schnell genug verbessern, um operativ nützlich zu sein, oder bleibt es eine Haftung, die falsch-positive Ergebnisse gegen legitime nicht-englische Muttersprachler erzeugt? Und kritisch — wer finanziert das? Moderation im großen Maßstab ist teuer, und die meisten Preprint-Server laufen auf dünnen institutionellen Margen. Wenn große Geldgeber (NIH, Wellcome, Gates) Infrastruktur-Support nicht als Priorität behandeln, wird die Last ungleich fallen, wahrscheinlich Server benachteiligend, die den Globalen Süden bedienen.

Reality Meter

Kuenstliche Intelligenz Zeithorizont · mid term

Reality Score 72 / 100

Hype-Risiko 35 / 100

Impact 65 / 100

Quellen-Qualitaet 45 / 100

Community-Confidence 50 / 100

Warum dieser Score?

Trust Layer Score-Basis

Score-Basis

Detaillierte Evidenz-Aufschluesselung folgt. Bis dahin: die Score-Basis ergibt sich aus den unten verlinkten Quellen und dem Reality-Meter weiter oben.

Source-Receipts

1 Quelle hinterlegt
Trust 95/100 im Schnitt
Trust 95/100

Zeithorizont

Erwartet in mid term

Community-Einschaetzung

Community-Live-AggregatIdle

Reality (Artikel)72/ 100

Hype35/ 100

Impact65/ 100

Confidence50/ 100

Prediction Ja0%noch keine

Prediction-Stimmen0∑

Glossar

Preprint-Infrastruktur: Digitale Plattformen wie bioRxiv oder arXiv, auf denen Wissenschaftler ihre Forschungsergebnisse vor der formalen Begutachtung durch Fachzeitschriften veröffentlichen können. Sie ermöglichen schnelle Verbreitung von Forschung, erfordern aber weniger strenge Qualitätskontrolle als etablierte Fachjournale.
LLMs: Large Language Models (Große Sprachmodelle) sind künstliche Intelligenz-Systeme, die trainiert wurden, um menschenähnliche Texte zu verstehen und zu generieren. Sie können verwendet werden, um wissenschaftlich klingende, aber inhaltlich fehlerhafte Manuskripte automatisch zu erstellen.
Kommodifizierung: Der Prozess, bei dem etwas in ein handelbares Produkt oder eine Ware umgewandelt wird. Hier bezieht sich dies darauf, dass wissenschaftliche Texte durch KI-Systeme als massenproduzierbares Gut behandelt werden können.
Low-Friction-Depositionssysteme: Plattformen, die Barrieren für die Veröffentlichung minimieren und schnelle, unkomplizierte Einreichung von Inhalten ermöglichen, ohne aufwendige Genehmigungsprozesse.
Flagging-Systeme: Kennzeichnungssysteme, die potenziell problematische Inhalte für Leser sichtbar machen (z.B. durch Warnhinweise oder Markierungen), ohne diese vollständig zu blockieren oder zu entfernen.
Scope-Creep: Die unkontrollierte Ausweitung von Aufgaben oder Regeln über ihren ursprünglichen Zweck hinaus. Hier gemeint: dass Moderationsrichtlinien über Qualitätskontrolle hinaus auch ideologische oder methodologische Entscheidungen treffen könnten.

Deine Stimme

Wie siehst du das?

Deine Einschaetzung gewichtet kuenftige Themen.

Schnellbewertung

Weitere Bewertung

Sterne (1–5)

Wie real ist das? Reality Ø 72

Mehr oder weniger davon?

Deine Stimme fliesst in Topic-Weights, Community-Kompass und kuenftige Priorisierung ein. Community-Kompass ansehen

Quellen

Tier 1 Why preprint servers are increasing moderation — and what that means for researchers nature.com 95

Optional Vorhersage abgeben Optional: Wenn du willst, gib deine Vorhersage zur Kernfrage ab.

Prediction

Werden mindestens drei große Preprint-Server bis Ende 2027 ein standardisiertes, interoperables Moderationsrahmenwerk einführen?

Erklaerung

Reality Meter

Warum dieser Score?

Zeithorizont

Community-Einschaetzung

Glossar

Wie siehst du das?

Quellen

Prediction

Verwandte Briefings

155 Millionen Stellenausschreibungen zeigen keine KI-getriebene Arbeitsplatzvernichtung

KI-Gesundheitsmarkt-Prognose projiziert 24x-Wachstum bis 2035

Jugendarbeitsmarkt-Probleme präexistieren KI — Die Daten sprechen dafür

Bakterien entwickelt, um eine Aminosäure aus dem Kern-Alphabet des Lebens zu entfernen