traqx
Newsletter Diese Analysen per Mail
KI in GMP & GxP

KI in GxP einsetzen — ohne die Kontrolle abzugeben

Lesezeit ~12 Min · Daniel Herrmann

AI IN GXP · CONTROL ARCHITECTURE SOURCE Quellen CONTROLLED AI DRAFT Ghost CITED HUMAN Freigabe ✓ NAME CHECK Prüfung PASS/FAIL TRAIL Lückenlos TRACEABLE GENERATE VERIFY MONITOR JEDE AUSSAGE MIT QUELLE · JEDE FREIGABE MIT NAMEN

Ja, KI darf in GxP-Umgebungen eingesetzt werden — die Frage ist nicht mehr ob, sondern wie kontrolliert. Der regulatorische Rahmen steht: EU GMP Annex 22 (Entwurf, Konsultation 2025) definiert erstmals Anforderungen an KI in GMP-Umgebungen, GAMP 5 Second Edition adressiert KI/ML ausdrücklich, die FDA verfolgt mit CSA einen risikobasierten Ansatz. Entscheidend ist die Kontrollarchitektur: Jede KI-Aussage braucht eine Quelle, jeder Entwurf bleibt Vorschlag bis zur menschlichen Freigabe, und der Audit-Trail dokumentiert den gesamten Weg.

Darf KI in GxP-Umgebungen überhaupt arbeiten?

Die Frage wird in QA-Runden noch oft gestellt — die Regulatoren haben sie längst beantwortet. Keine der maßgeblichen Behörden verbietet den Einsatz von KI in regulierten Umgebungen. Was sie stattdessen tun: Sie definieren, unter welchen Bedingungen KI-Arbeit akzeptabel ist. Die Bedingungen ähneln sich über alle Rahmenwerke hinweg — risikobasiert, nachvollziehbar, mit menschlicher Verantwortung.

Das verschiebt die eigentliche Aufgabe: Nicht die Grundsatzdiskussion entscheidet, ob Ihr Unternehmen KI einsetzen kann, sondern die Frage, ob Ihre Arbeitsumgebung die geforderten Kontrollen strukturell hergibt — Quellenbindung, attributierbare Freigaben, lückenlose Dokumentation. Eine generische Chat-Oberfläche gibt das nicht her. Eine kontrollierte Arbeitsumgebung schon.

Der regulatorische Rahmen 2026 — vier Anker

Vier Dokumente bestimmen derzeit, wie KI-Einsatz in GxP-Umgebungen bewertet wird:

  • EU GMP Annex 22 (Entwurf): Der erste GMP-Annex, der sich ausschließlich mit künstlicher Intelligenz befasst — im Juli 2025 zur Konsultation veröffentlicht, gemeinsam mit der Revision von Annex 11. Kernpunkte: Intended Use, Validierung statischer Modelle, Human Oversight, Erklärbarkeit. Generative KI liegt außerhalb des kritischen Geltungsbereichs — in nicht-kritischen, unterstützenden Anwendungen bleibt sie möglich, mit dokumentierter menschlicher Prüfung. Die Details: unsere Annex-22-Analyse.
  • GAMP 5 Second Edition (2022): Der Branchenleitfaden erkennt KI/ML als Teil computergestützter Systeme an und stellt Critical Thinking über schematische Dokumentation — was sich dadurch ändert, steht in unserem GAMP-5-Beitrag.
  • FDA Computer Software Assurance: final seit September 2025, im Februar 2026 aktualisiert (QMSR-Terminologie). CSA schreibt kein Werkzeug vor, sondern verlangt risikobasierte Prüftiefe — CSA vs. CSV im Vergleich.
  • 21 CFR Part 11 / ALCOA+: Die Konstante: elektronische Aufzeichnungen, Signaturen und manipulationssichere Audit-Trails. Jede KI-gestützte Arbeit muss am Ende diese Anforderungen erfüllen — unabhängig davon, welches Werkzeug den Entwurf geschrieben hat.

Bemerkenswert ist die Konvergenz: Vier Rahmenwerke, eine Richtung — risikobasiert, quellengebunden, menschlich verantwortet. Wer seine KI-Arbeit an diesen drei Prinzipien ausrichtet, ist gegenüber allen vier Ankern auskunftsfähig.

Wo KI heute sinnvoll arbeitet — und wo nicht

Die ehrliche Landkarte, Stand 2026:

Sinnvoll heute — unterstützende, dokumentennahe Arbeit, bei der ein Mensch prüft und freigibt:

  • Dokumentenerstellung: Entwürfe für URS, Spezifikationen, Testdokumentation, SOPs — aus kontrollierten Quellen, mit Zitaten. Der größte Zeitfresser in der Computer System Validation ist selten das Prüfen, sondern das Schreiben und Zusammenhalten.
  • Review-Vorbereitung: Inkonsistenzen, Lücken und Widersprüche über Dokumentbestände finden, bevor der menschliche Review beginnt.
  • Audit-Vorbereitung: Nachweise konsolidieren, Lückenlisten erstellen, Antwortentwürfe mit Quellenbindung — die Bewertung bleibt bei QA (Audit-Readiness).
  • Wissenszugriff: Fragen gegen den eigenen, kontrollierten Quellenraum beantworten — statt gegen das offene Internet.

Nicht heute — und auf absehbare Zeit:

  • Generative KI in kritischen GMP-Anwendungen — der Annex-22-Entwurf sieht ihren Einsatz dort nicht vor.
  • Autonome Freigaben: Kein Rahmenwerk akzeptiert eine KI als freigebende Instanz. Die Unterschrift bleibt menschlich — mit Namen und Begründung.
  • Dynamisch weiterlernende Modelle in validierten Prozessen: Ein Zustand, der sich laufend ändert, ist nicht stabil nachweisbar.

Diese Grenze ist keine Schwäche der Technologie, sondern die Voraussetzung dafür, dass der sinnvolle Teil inspektionsfest ist.

Fünf Kontrollprinzipien, die KI-Arbeit belegbar machen

Ob ein KI-Einsatz in einer Inspektion standhält, entscheidet sich an der Kontrollarchitektur. Fünf Prinzipien haben sich als tragend erwiesen — sie sind zugleich das Fundament der traqx Trust-Architektur:

  • Quellenbindung (Citation): Jede regulatorische Aussage endet auf einer klickbaren Quelle aus dem kontrollierten Quellenraum. Was keine Quelle hat, ist als unbelegt markiert — nicht stillschweigend plausibel.
  • Ghost Values: Ein KI-Vorschlag bleibt sichtbar ein Vorschlag, bis ein Mensch ihn übernimmt. Entwurf und freigegebener Zustand sind nie verwechselbar.
  • Human-in-the-Loop: Jede Freigabe trägt einen Namen und eine Begründung. Verantwortung lässt sich nicht an ein Modell delegieren — und soll es auch nicht.
  • Deterministische Prüfung: Ob Zitate existieren und Aussagen ihre Quelle treffen, prüft kein zweites Sprachmodell, sondern eine deterministische Kontrolle: bestanden oder nicht bestanden.
  • Lückenloser Audit-Trail: Wer hat was wann auf welcher Grundlage entschieden — über den gesamten Lebenszyklus, manipulationssicher (21 CFR Part 11, ALCOA+).

Der Test für jedes Werkzeug — auch für unseres: Lassen sich diese fünf Prinzipien strukturell nachweisen, oder hängen sie an der Disziplin einzelner Nutzer?

Einführung in der Praxis: mit einem Prozess beginnen

Die erfolgreichen KI-Einführungen in regulierten Umgebungen, die wir sehen, folgen demselben Muster — und es ist das Gegenteil eines IT-Großprojekts:

  • Ein Team, ein realer Prozess: Nicht die ganze Organisation, sondern ein abgegrenzter GxP-Prozess mit echtem Schmerz — eine SOP-Überarbeitung, ein Validierungspaket, eine Audit-Vorbereitung.
  • Quellenraum zuerst: Vor dem ersten Prompt steht die Frage, aus welchen kontrollierten Dokumenten die KI arbeiten darf. Der Quellenraum ist die Risikogrenze.
  • Stop/Go-Kriterien vorab: Woran erkennen Sie nach vier bis sechs Wochen, ob es trägt? Review-Aufwand, Korrekturgründe, Nachweisqualität — vorher definiert, nicht nachher interpretiert.
  • QA von Anfang an am Tisch: Nicht als Genehmigungsinstanz am Ende, sondern als Mitgestalter der Kontrollen. Das verändert die Akzeptanz grundlegend.

Was sich nicht bewährt: der Big-Bang-Rollout („KI für alle, ab Montag“), Schatten-Nutzung ohne Quellenraum — und der umgekehrte Fehler, zwei Jahre auf die finale Fassung jeder Guidance zu warten, während das eigene Team längst ungesteuert mit öffentlichen Chat-Tools arbeitet.

Die häufigsten Einwände — und was dahintersteckt

„KI halluziniert — das können wir uns nicht leisten.“ Richtig, und deshalb ist Halluzination ein Architekturproblem, kein Modellproblem: Mit Quellenbindung und deterministischer Prüfung wird eine erfundene Referenz als unbelegt sichtbar, bevor sie einen Review erreicht. Gefährlich ist nicht das Modell, sondern der unkontrollierte Umgang damit.

„Unsere Daten dürfen kein Modell trainieren.“ Berechtigte Anforderung — und vertraglich wie technisch lösbar: EU-Hosting, kein Modelltraining auf Kundendaten, klarer Quellenraum. Das gehört in jede Lieferantenbewertung eines KI-Anbieters.

„Müssen wir das KI-Tool selbst validieren?“ Das Werkzeug wird risikobasiert qualifiziert wie andere Software auch (GAMP-5-Logik); entscheidend ist, dass die Arbeitsergebnisse belegbar bleiben — Quelle, Prüfung, Freigabe, Audit-Trail. Die Verantwortung für den Inhalt bleibt beim regulierten Unternehmen.

„Was sagt ein Auditor dazu?“ Auditoren fragen dieselben Fragen wie bei jeder Arbeit: Woher kommt die Aussage, wer hat freigegeben, wo ist der Trail? Eine kontrollierte KI-Umgebung beantwortet diese Fragen schneller als manuelle Arbeit — weil die Verbindung nie abreißt.

Was das für Ihre Roadmap bedeutet

Der regulatorische Rahmen konvergiert, die Kontrollprinzipien sind bekannt, und der Einstieg ist klein möglich. Die Reihenfolge, die wir empfehlen: einen Prozess wählen, den Quellenraum definieren, Stop/Go-Kriterien festlegen, QA einbinden — und nach sechs Wochen ehrlich bewerten.

Genau für diesen Einstieg ist traqx gebaut: KI entwirft, Ihr Team prüft und gibt frei — Quellen, Versionen und Audit-Trail bleiben verbunden. Ob an Ihrem Prozess, sehen Sie am schnellsten in der 30-minütigen Live-Demo.

Kernbotschaften

  • Kein Rahmenwerk verbietet KI in GxP — alle vier Anker (Annex-22-Entwurf, GAMP 5 2nd Ed, FDA CSA, Part 11) definieren das Wie: risikobasiert, quellengebunden, menschlich verantwortet.
  • Generative KI gehört heute in unterstützende, dokumentennahe Arbeit mit menschlicher Freigabe — nicht in kritische GMP-Anwendungen und nicht in autonome Entscheidungen.
  • Belegbarkeit ist Architektur, nicht Disziplin: Quellenbindung, Ghost Values, Human-in-the-Loop, deterministische Prüfung und Audit-Trail müssen strukturell im Werkzeug stecken.
  • Der bewährte Einstieg: ein Team, ein realer Prozess, definierter Quellenraum, Stop/Go-Kriterien vorab — QA von Anfang an am Tisch.
  • Warten ist die riskanteste Option: Ohne kontrollierte Umgebung entsteht Schatten-KI-Nutzung — ungesteuert und unbelegbar.

Quellen

Autor

Daniel Herrmann

Daniel Herrmann hat über 15 Jahre Computer System Validation in der Pharmaindustrie verantwortet, bevor er traqx mitgegründet hat. Dieser Leitfaden fasst zusammen, was er QA- und Validierungs-Teams heute zur Einführung von KI rät — inklusive der Stellen, an denen er zur Zurückhaltung rät.

Newsletter

Diese Analysen monatlich per Mail

Praxis-Tiefe zu CSV, CSA, Audit-Readiness und KI-Governance — kein Spam, Abmeldung mit einem Klick.

Live-Demo

Sehen Sie traqx live an Ihrem Prozess.

30 Minuten an Ihrem realen GxP-Kontext — Quellen zuerst, KI als Vorschlag, Mensch entscheidet. Kein Sales-Pitch, ein konkretes Arbeitsbeispiel.