Zum Hauptmenü springenZum Inhalt springen

Mission Qualität

Ein Beitrag aus ALBERT Nr. 11 "Gesundheitsforschung"

Nur wenn biomedizinische Studien belastbar sind, kann Medizin Leben retten. Doch viele Studien stehen auf einem wackligen Fundament. Die Forschung muss sich auf eine ihrer größten Stärken besinnen: sich ständig zu hinterfragen.

Ein Plädoyer von Jess Rohmann und Ulrich Dirnagl

Im Herbst 2006 verlor das Pharmaunternehmen Astra-Zeneca innerhalb weniger Wochen rund fünf Milliarden Euro an Marktwert. Was war geschehen? Durch die Veröffentlichung von Studienergebnissen im renommierten New England Journal of Medicine erfuhren die Aktionäre, dass die klinische Prüfung einer Therapie gegen akuten Schlaganfall, die in präklinischen Experimenten in Zellkulturen und an Tieren vielversprechend gewesen war, am Menschen kein besseres Ergebnis erzielte als ein Placebo. Der Aktienkurs brauchte Jahre, bis er sich erholt hatte – und auch die Entwicklungskosten von über einer halben Milliarde Euro waren verloren.

Gemeinsam mit einer Gruppe internationaler Wissenschaftler:innen begaben wir uns damals auf die Suche nach den Ursachen für diesen Fehlschlag – und wurden fündig. Wir untersuchten die Qualität der präklinischen Studien, auf deren Grundlage die Entwicklung des Schlaganfallmedikaments erfolgte. Dabei stießen wir auf gravierende Mängel. So waren Tierstudien mit negativen Ergebnissen in der präklinischen Phase häufig nicht veröffentlicht worden, sodass die Daten übermäßig positiv wirkten und ein verzerrtes Bild entstand. Außerdem wurden zentrale Prinzipien des Versuchsdesigns wie eine zufällige Gruppenzuteilung der Versuchstiere (Randomisierung) oder die Anonymisierung bei der Datenauswertung (Verblindung) oft nicht eingehalten. Diese Entwicklung ist kein Einzelfall. Laborergebnisse werden oftmals zu positiv bewertet. Darauf aufbauende klinische Studien haben somit kein belastbares Fundament und scheitern.

Vom Labor zum Menschen – mit Hindernissen

Trotz bahnbrechender Erfolge – etwa der Krebstherapie mit gentechnisch veränderten T-Zellen (CAR-TZelltherapie) oder der mRNA-Technologie, die nicht nur die Impfstoffentwicklung während der Pandemie revolutioniert hat, sondern künftig auch bei Krebs und seltenen Erkrankungen eingesetzt werden könnte – verläuft der klinische Fortschritt zu langsam. Wir beobachten viele Durchbrüche im Labor, doch zu wenige erreichen tatsächlich die Patient:innen. 

Neue Therapien zu entwickeln ist ein langwieriger und äußerst kostspieliger Prozess. Die translationale Kette – von der theoretischen Idee über erste Laborexperimente bis hin zum erfolgreichen Einsatz eines Medikaments zum Nutzen der Patient:innen – ist lang und kann an jedem ihrer Glieder reißen. Selbst nach erfolgreicher Prüfung in einer für die Zulassung entscheidenden und viele Patient:innen umfassenden Phase-III-Studie bleibt die Frage offen, ob die Therapie auch im Alltag wirkt – also außerhalb der kontrollierten Bedingungen akademischer Studienzentren.

Wirkt ein Medikament bei allen gleich?

Um fundierte Aussagen über die Wirksamkeit und Sicherheit neuer Therapien in der breiten Bevölkerung treffen zu können, braucht es Erkenntnisse aus der realen Versorgungspraxis (Real-World Data), etwa aus Registern, Routinedaten oder Beobachtungsstudien. Denn viele Personengruppen werden in klinischen Studien oft gar nicht berücksichtigt, darunter ältere Menschen, Schwangere oder Patient:innen mit mehreren Vorerkrankungen. Dabei kann die Wirkung eines Medikaments je nach Personengruppe unterschiedlich ausfallen. Es ist wichtig zu wissen, ob ein Medikament beispielsweise bei älteren Frauen genauso wirksam ist wie bei jüngeren Männern.

Zudem können seltene Nebenwirkungen unentdeckt bleiben. Kommt eine Nebenwirkung nur bei einer von 10.000 Personen vor, ist es sehr wahrscheinlich, dass sie in einer typischen Zulassungsstudie gar nicht auftritt, weil weniger Menschen teilnehmen. Deshalb sind große Beobachtungsstudien mit vielfältigen Patientenkollektiven sowie Phase-IV-Untersuchungen – also Studien nach der Zulassung eines Medikaments – wichtig, um Nutzen, Risiken und Nebenwirkungen zuverlässig zu überwachen.

Nur scheinbar rasante Fortschritte

Trotz all dieser Unsicherheiten und offenen Fragen entsteht in der öffentlichen Wahrnehmung oft das Bild eines rasanten wissenschaftlichen Fortschritts mit unmittelbar bevorstehenden Durchbrüchen. So wurde das Ende von Krebs oder der Alzheimer-Krankheit schon mehrfach zu Unrecht angekündigt. Dafür gibt es viele Gründe, die über die enorme biologische Komplexität von Krankheiten hinausgehen. 

Dank der sogenannten Metaforschung – also der Forschung über Forschung – kennen wir mittlerweile eine Reihe von Ursachen, die mit der mangelnden Qualität wissenschaftlicher Studien zusammenhängen, und können diese gezielt verbessern. Zu den häufigsten Problemen präklinischer Studien zählen das bereits erwähnte Fehlen von Verblindung und Randomisierung, unzureichende Fallzahlen, methodische und statistische Fehler sowie die selektive Auswahl von Daten ohne vorher festgelegte Kriterien und ohne Hinweis auf diese Selektion.

Doch selbst in klinischen Studien, in denen die Qualitätsstandards deutlich strenger sind, kann die translationale Kette reißen. Gründe hierfür können sein, dass Fragestellungen untersucht wurden, die für Patient:innen wenig relevant sind, dass die Planung der Patientenzahl unrealistisch war oder Studienergebnisse gar nicht veröffentlicht werden. Das passiert zum Beispiel, wenn sie keine klaren oder „positiven” (also die gewünschten) Ergebnisse zeigen. Das liegt oft weniger an den Forschenden selbst als vielmehr an den Anreizen im Wissenschaftssystem: Studien mit bahnbrechenden Ergebnissen lassen sich leichter veröffentlichen, werden häufiger zitiert und tragen eher zum beruflichen Aufstieg bei. Durch diesen „Schubladeneffekt” entsteht ein Publikationsbias, der das Gesamtbild der Forschung verzerren kann.

Transparente Studiendesigns und Begutachtung

Ein erfolgreiches Medikament kann nur dann entstehen, wenn in allen Phasen des Forschungsprozesses eine ausreichend hohe Qualität gewährleistet ist – wenn die erhobene Evidenz sowohl valide als auch klinisch bedeutsam ist und von allen Akteur:innen präzise und umfassend kommuniziert wird. Dabei sollten Wissenschaftler:innen ihr Vorgehen transparent darlegen – idealerweise bereits vor Beginn jeder Studie in Form einer sogenannten Präregistrierung. Hier wird das Studienprotokoll – einschließlich Fragestellung, Endpunkte und Auswertungsplan – öffentlich festgelegt und registriert. So kann verhindert werden, dass Fragestellungen oder Analysen nachträglich unangemessen angepasst werden.

Ein zentraler Schritt zur Qualitätssicherung ist die Begutachtung der Studienergebnisse sowie der Methoden, mit denen sie gewonnen wurden, durch Fachleute im Rahmen des sogenannten Peer Reviews. Allerdings ist auch dieser Prozess nicht frei von Mängeln: Schlechte Studien gelangen mitunter in renommierte Fachzeitschriften, während qualitativ hochwertige Arbeiten – insbesondere solche mit „negativen“ Ergebnissen, also Studien, die keine oder keine erwarteten Wirkungen zeigen – oft abgelehnt oder weniger beachtet werden. Zudem kann es vorkommen, dass Herausgeber:innen und Redakteur:innen zurückhaltend gegenüber neuen Ideen sind, insbesondere wenn sie Paradigmen infrage stellen. Auch dadurch kann qualitätvolle Forschung unter den Tisch fallen.

Das zeigt: Nicht nur die Qualität des Forschungsprozesses ist von zentraler Bedeutung, sondern auch die Qualität des Begutachtungsprozesses. Auch hier braucht es mehr Transparenz – etwa durch offene Reviews und Plattformen, auf denen Kommentare und Kritik selbst nach der Veröffentlichung möglich sind. Ebenso wichtig sind eine fundierte Schulung in guter Peer-Review-Praxis sowie eine angemessene Anerkennung der Peer-Review-Tätigkeit, die häufig als zusätzliches Engagement Einzelner vorausgesetzt, aber nicht honoriert wird.

Karriere- und Leistungsbewertung in Schieflage

Könnte eines der Qualitätsprobleme bei den Wissenschaftler:innen und Kliniker:innen selbst liegen? In den meisten Fällen wohl nicht, denn sie sind in der Regel sehr versiert im Umgang mit den von ihnen verwendeten Methoden und Modellen. Entscheidend für ihre wissenschaftliche Karriere sind jedoch Publikationen – idealerweise mit spektakulären Ergebnissen in renommierten Fachzeitschriften. Dabei rückt die Qualität des Studiendesigns schnell in den Hintergrund, während Neuartigkeit und deutliche Effekte stärker gewichtet werden.

Dass sich das Karriere- und Leistungsbewertungssystem in vielen Wissenschaftsbereichen – insbesondere in der Biomedizin – in den letzten Jahrzehnten problematisch entwickelt hat, ist inzwischen bekannt. Bei Berufungen oder der Vergabe von Fördermitteln spielen jedoch quantitative Aspekte wie die Anzahl von Publikationen, Journal-Impact-Faktoren sowie die Höhe eingeworbener Drittmittel häufig eine größere Rolle als Fragen der Forschungsrelevanz, der methodischen Qualität und der Robustheit der Ergebnisse. 

Doch es kommt zunehmend Bewegung in die Sache: National wie international wird daran gearbeitet, die Messlatte in Richtung inhaltlicher und qualitativer Bewertung zu verschieben. Die Coalition for Advancing Research Assessment (CoARA) beispielsweise vereint eine Vielzahl wichtiger akademischer Institutionen und Wissenschaftsförderer weltweit, die gemeinsam daran arbeiten, „die vielfältigen Ergebnisse, Praktiken und Aktivitäten anzuerkennen, die die Qualität und Wirkung von Forschung maximieren”.

Auch der Einstein Foundation Award for Promoting Quality in Research ist eine solche Initiative. Gemeinsam mit dem QUEST Center for Responsible Research am Berlin Institute of Health der Charité – Universitätsmedizin Berlin würdigt die Einstein Stiftung Berlin damit Arbeiten, die Transparenz, Nachvollziehbarkeit und Verlässlichkeit in der Forschung voranbringen, mit jährlich insgesamt 350.000 Euro. Ausgezeichnet wurde etwa der Kanadier Gordon Guyatt für sein Engagement für eine Medizin, bei der Therapieentscheidungen auf geprüften Studien und Evidenz beruhen – statt auf Erfahrung oder Tradition. Ebenfalls gewürdigt wurden Pionierleistungen, die das Fundament der Forschung stärken, darunter das Center for Open Science, das Forschung weltweit transparenter und nachvollziehbarer macht.

Wissenschaftliche Forschung gehört unter die Lupe – nicht nur im übertragenen Sinn. Nur wenn wir die Qualität einzelner Studien konsequent prüfen, Verzerrungen vermeiden und Fehler minimieren, können verlässliche Erkenntnisse entstehen. Diese bilden die Grundlage für Übersichtsarbeiten, Leitlinien und Therapieentscheidungen. Die Stärke der gesamten medizinischen Forschung hängt dabei immer von der Qualität der Einzelstudien ab. Dass sich Wissenschaft ständig selbst hinterfragt und überprüft, ist keine Schwäche – im Gegenteil, es ist ihr größtes Kapital. Nur so entsteht Vertrauen in medizinische Entscheidungen, die auf einem soliden Fundament stehen.