traqx
Newsletter Diese Analysen per Mail
KI in GMP & GxP

EU GMP Annex 22: Was der erste KI-Annex für Ihre GxP-Praxis bedeutet

Lesezeit ~10 Min · Daniel Herrmann

EU GMP · ANNEX 22 (DRAFT) · ARTIFICIAL INTELLIGENCE AI MODEL Statisch DETERMINISTISCH FROZEN · TESTED HUMAN OVERSIGHT Mensch gibt frei ATTRIBUTIERT · BEGRÜNDET ✓ REVIEW GATE GMP RECORD Belegt & versioniert AUDIT-TRAIL TRACEABLE INTENDED USE TEST SPLIT EXPLAINABILITY MONITORING KRITISCHE ANWENDUNGEN · GENERATIVE AI NUR MIT MENSCHLICHER PRÜFUNG

EU GMP Annex 22 ist der erste Annex des EU-GMP-Leitfadens, der sich ausschließlich mit künstlicher Intelligenz befasst. Der Entwurf wurde im Juli 2025 zur Konsultation veröffentlicht — zusammen mit einer Entwurfs-Revision von Annex 11. Er adressiert KI-Modelle in kritischen GMP-Anwendungen und fordert unter anderem: definierte Intended Use, kontrollierte Daten, unabhängige Testdaten, Erklärbarkeit, Performance-Monitoring — und durchgängige menschliche Aufsicht. Generative KI darf kritische Entscheidungen nicht ohne menschliche Prüfung tragen.

Worum es geht: Der erste GMP-Annex speziell für KI

Bis 2025 gab es im EU-GMP-Leitfaden keinen Ort, an dem der Einsatz von künstlicher Intelligenz eigenständig geregelt war. KI-gestützte Systeme liefen unter Annex 11 (Computerised Systems) mit — einem Rahmen, der lange vor Machine-Learning-Modellen geschrieben wurde. Das ändert sich: Am 7. Juli 2025 hat die Europäische Kommission den Entwurf eines neuen Annex 22 „Artificial Intelligence“ zur gezielten Konsultation veröffentlicht — zusammen mit einer Entwurfs-Revision von Annex 11. Die Konsultationsfrist endete Anfang Oktober 2025.

Damit bekommt KI im GMP-Umfeld erstmals einen eigenen, expliziten Erwartungsrahmen. Das ist eine gute Nachricht für alle, die KI kontrolliert einsetzen wollen: Statt Unsicherheit („Darf man das überhaupt?“) gibt es jetzt benannte Anforderungen, gegen die sich ein Einsatz prüfbar gestalten lässt.

Wichtig zur Einordnung: Bei Redaktionsschluss dieses Beitrags lag Annex 22 als Entwurf vor; die finale Fassung kann sich in Details ändern. Die Stoßrichtung — risikobasiert, datendiszipliniert, menschlich beaufsichtigt — gilt aber als gesetzt und deckt sich mit GAMP 5 (2nd Edition) und der FDA-CSA-Guidance. Prüfen Sie für Entscheidungen immer den aktuellen Stand des Dokuments.

Geltungsbereich: Welche KI Annex 22 meint — und welche nicht

Der Entwurf zieht den Geltungsbereich bewusst eng. Er adressiert KI/ML-Modelle in kritischen Anwendungen der GMP-regulierten Herstellung — also dort, wo Modell-Output Produktqualität, Patientensicherheit oder Datenintegrität direkt berühren kann.

Drei Abgrenzungen sind besonders relevant:

  • Statische Modelle: Für kritische Anwendungen erwartet der Entwurf Modelle mit deterministischem Verhalten — gleicher Input führt zu gleichem Output. Das Modell wird trainiert, eingefroren, getestet und dann in einem definierten Zustand betrieben.
  • Dynamische Modelle: Systeme, die im Betrieb weiterlernen und ihr Verhalten laufend ändern, sieht der Entwurf für kritische Anwendungen nicht vor — ihr validierter Zustand wäre nicht stabil nachweisbar.
  • Generative KI und LLMs: Wegen ihres probabilistischen Verhaltens liegen sie außerhalb des kritischen Annex-22-Geltungsbereichs — für kritische GMP-Anwendungen sieht der Entwurf ihren Einsatz nicht vor. In nicht-kritischen, unterstützenden Anwendungen bleiben sie möglich — dann mit qualifizierter, dokumentierter menschlicher Prüfung, bevor ein Output regulatorisch wirksam wird.
Annex 22 verbietet generative KI nicht — er macht die menschliche Prüfung zur Bedingung, unter der ihr Einsatz tragfähig wird.

Die Kernanforderungen im Überblick

Die Anforderungen des Entwurfs lassen sich zu sieben Disziplinen verdichten — jede einzelne kennt ein Validierungsteam dem Sinn nach bereits, neu ist die konsequente Anwendung auf Modelle:

  • Intended Use: Der Einsatzzweck des Modells ist präzise beschrieben — Aufgabe, Grenzen, Eingabedaten, betroffene Prozesse.
  • Datenqualität & -governance: Trainings-, Validierungs- und Testdaten sind kontrolliert, repräsentativ und nachvollziehbar verwaltet.
  • Unabhängige Testdaten: Die Leistungsbewertung läuft auf Daten, die nicht im Training verwendet wurden — Trennung nachweisbar.
  • Performance & Akzeptanzkriterien: Metriken und Schwellen sind vor dem Test festgelegt und am Intended Use ausgerichtet.
  • Erklärbarkeit & Konfidenz: Soweit möglich wird sichtbar, welche Merkmale ein Ergebnis treiben und wie sicher das Modell ist.
  • Human Oversight: Menschliche Aufsicht ist in den Prozess eingebaut — mit definierten Rollen und dokumentierten Entscheidungen.
  • Monitoring & Change Control: Die Modellleistung wird im Betrieb überwacht (Stichwort Drift); Änderungen laufen kontrolliert.

Das Muster dahinter

Alle sieben Disziplinen folgen einem Prinzip, das GxP-Teams kennen: Behaupte nichts, was du nicht belegen kannst. Annex 22 überträgt die Beweisdisziplin der Validierung auf Modelle — Daten, Verhalten und Entscheidungen müssen nachvollziehbar bleiben.

Was das für QA- und Validierungsteams konkret bedeutet

Auch wenn die finale Fassung noch aussteht: Wer heute KI in GxP-Prozessen einsetzt oder plant, kann vier Dinge sofort tun.

Erstens: Inventarisieren. Welche KI läuft heute in Ihren Prozessen — auch inoffiziell? Ein Copilot im Dokumentenentwurf ist KI-Einsatz, auch wenn er in keinem Systemverzeichnis steht. Ohne Inventar keine Risikobewertung.

Zweitens: Kritikalität einstufen. Trennt eine Anwendung kritische Entscheidungen (Freigabe, Spezifikation, Bewertung) von unterstützender Arbeit (Entwurf, Recherche, Strukturierung)? Genau entlang dieser Linie wird Annex 22 unterscheiden.

Drittens: Human Oversight als Prozess bauen, nicht als Behauptung. „Ein Mensch schaut drüber“ genügt nicht. Belastbar ist: definierte Prüfschritte, attributierte Freigaben mit Begründung, ein Audit-Trail, der KI-Vorschlag und menschliche Entscheidung unterscheidbar macht.

Viertens: Quellenbindung herstellen. Wenn KI-Output in regulierte Dokumente fließt, muss nachvollziehbar sein, worauf sich jede Aussage stützt. Ein Entwurf ohne belegbare Quellen ist im Review teurer als gar kein Entwurf.

Niedrigschwellig starten

Der sauberste Einstieg ist ein eng abgegrenzter, nicht-kritischer Prozess mit vollständiger menschlicher Prüfung — dort sammeln Sie die Nachweise und Arbeitsmuster, die Annex 22 für größere Schritte ohnehin verlangen wird.

Annex 22, GAMP 5 2nd Edition, FDA CSA: ein gemeinsames Bild

Annex 22 steht nicht allein. Drei Rahmenwerke aus unterschiedlichen Richtungen sind in den letzten Jahren auf dieselben Prinzipien eingeschwenkt:

  • GAMP 5 2nd Edition (2022) akzeptiert KI-gestützte Arbeit im risikobasierten Lifecycle und verlangt Critical Thinking statt Schema-Dokumentation.
  • FDA CSA (Final Guidance 2025) verschiebt den Aufwand vom Dokumentieren zum belastbaren Begründen — Testtiefe folgt dem Risiko.
  • EU GMP Annex 22 (Entwurf 2025) formuliert dieselbe Logik erstmals KI-spezifisch: kontrollierte Daten, nachweisbares Modellverhalten, menschliche Aufsicht.

Für Ihre Strategie heißt das: Sie müssen nicht auf drei Regelwerke einzeln reagieren. Wer seine KI-Arbeit auf Quellenbindung, attributierte menschliche Freigabe und lückenlosen Audit-Trail baut, bedient alle drei Rahmen mit derselben Architektur — und ist gegenüber der finalen Annex-22-Fassung robust, weil diese Prinzipien der gemeinsame Kern sind, nicht das Verhandlungsdetail.

Wie Sie sich heute vorbereiten — ohne auf die finale Fassung zu warten

Ein realistischer Vorbereitungs-Pfad in vier Schritten:

  • 01 · KI-Inventar und Kritikalitäts-Map — alle KI-Berührungspunkte erfassen und je Anwendung einstufen: kritisch / unterstützend.
  • 02 · Review-Gate definieren — für jeden KI-gestützten Workflow festlegen, wer prüft, was geprüft wird und wie die Entscheidung dokumentiert ist.
  • 03 · Quellen- und Datenraum kontrollieren — festlegen, aus welchen freigegebenen Quellen KI-Entwürfe entstehen dürfen, und die Trennung von Arbeits- und Trainingsdaten vertraglich wie technisch absichern.
  • 04 · Nachweise von Anfang an mitführen — Versionen, Freigaben und Begründungen entstehen im Arbeitsfluss, nicht in einer Nachdokumentations-Schleife vor dem Audit.

Genau auf dieses Muster ist traqx gebaut: Entwürfe entstehen ausschließlich aus freigegebenen Quellen, jede regulatorische Aussage endet auf einer klickbaren Citation, eine deterministische Prüfung markiert Unbelegtes als unverified, und jede Freigabe ist eine attributierte menschliche Entscheidung mit Audit-Trail. Das ist kein Annex-22-Zertifikat — eine solche Zertifizierung existiert nicht. Es ist eine Arbeitsweise, die die Prinzipien des Entwurfs heute schon praktisch umsetzt.

Kernbotschaften

  • Annex 22 (Entwurf Juli 2025) ist der erste EU-GMP-Annex speziell für KI — veröffentlicht zusammen mit der Entwurfs-Revision von Annex 11.
  • Kritische Anwendungen: nur statische, deterministisch betriebene Modelle — dynamisch weiterlernende Systeme sind dafür nicht vorgesehen.
  • Generative KI und LLMs dürfen kritische Entscheidungen nicht autonom tragen — ihr Output braucht eine dokumentierte menschliche Prüfung.
  • Die Kerndisziplinen — Intended Use, Datenqualität, unabhängige Testdaten, Erklärbarkeit, Human Oversight, Monitoring — folgen derselben Logik wie GAMP 5 2nd Edition und FDA CSA.
  • Wer heute Quellenbindung, attributierte Freigaben und Audit-Trail etabliert, ist gegenüber der finalen Fassung robust — Status des Dokuments vor Entscheidungen stets aktuell prüfen.

Quellen

Autor

Daniel Herrmann

Daniel Herrmann ist Gründer von traqx und arbeitet seit über 15 Jahren in GxP-Validierung und Qualitätssicherung. Dieser Beitrag fasst öffentlich zugängliche Regulatorik (Entwurf EU GMP Annex 22, Annex-11-Revision, GAMP 5 2nd Edition, FDA CSA) in eigener Einordnung zusammen — auf Basis des Konsultations-Stands; die finale Fassung kann abweichen. Er ist Orientierung, keine Rechts- oder Compliance-Beratung und ersetzt keine Bewertung für Ihren konkreten Geltungsbereich. Wo traqx erwähnt wird, beschreibt der Text die belegbare Arbeitsweise — Quellen zuerst, KI als Vorschlag, Mensch entscheidet, Audit-Trail bleibt — und keine darüber hinausgehende Wirkungszusage.

Newsletter

Diese Analysen monatlich per Mail

Praxis-Tiefe zu CSV, CSA, Audit-Readiness und KI-Governance — kein Spam, Abmeldung mit einem Klick.

Live-Demo

Sehen Sie traqx live an Ihrem Prozess.

30 Minuten an Ihrem realen GxP-Kontext — Quellen zuerst, KI als Vorschlag, Mensch entscheidet. Kein Sales-Pitch, ein konkretes Arbeitsbeispiel.