EU GMP Annex 22: Was der erste KI-Annex für Ihre GxP-Praxis bedeutet
EU GMP Annex 22 ist der erste Annex des EU-GMP-Leitfadens, der sich ausschließlich mit künstlicher Intelligenz befasst. Der Entwurf wurde im Juli 2025 zur Konsultation veröffentlicht — zusammen mit einer Entwurfs-Revision von Annex 11. Er adressiert KI-Modelle in kritischen GMP-Anwendungen und fordert unter anderem: definierte Intended Use, kontrollierte Daten, unabhängige Testdaten, Erklärbarkeit, Performance-Monitoring — und durchgängige menschliche Aufsicht. Generative KI darf kritische Entscheidungen nicht ohne menschliche Prüfung tragen.
Worum es geht: Der erste GMP-Annex speziell für KI
Bis 2025 gab es im EU-GMP-Leitfaden keinen Ort, an dem der Einsatz von künstlicher Intelligenz eigenständig geregelt war. KI-gestützte Systeme liefen unter Annex 11 (Computerised Systems) mit — einem Rahmen, der lange vor Machine-Learning-Modellen geschrieben wurde. Das ändert sich: Am 7. Juli 2025 hat die Europäische Kommission den Entwurf eines neuen Annex 22 „Artificial Intelligence“ zur gezielten Konsultation veröffentlicht — zusammen mit einer Entwurfs-Revision von Annex 11. Die Konsultationsfrist endete Anfang Oktober 2025.
Damit bekommt KI im GMP-Umfeld erstmals einen eigenen, expliziten Erwartungsrahmen. Das ist eine gute Nachricht für alle, die KI kontrolliert einsetzen wollen: Statt Unsicherheit („Darf man das überhaupt?“) gibt es jetzt benannte Anforderungen, gegen die sich ein Einsatz prüfbar gestalten lässt.
Wichtig zur Einordnung: Bei Redaktionsschluss dieses Beitrags lag Annex 22 als Entwurf vor; die finale Fassung kann sich in Details ändern. Die Stoßrichtung — risikobasiert, datendiszipliniert, menschlich beaufsichtigt — gilt aber als gesetzt und deckt sich mit GAMP 5 (2nd Edition) und der FDA-CSA-Guidance. Prüfen Sie für Entscheidungen immer den aktuellen Stand des Dokuments.
Geltungsbereich: Welche KI Annex 22 meint — und welche nicht
Der Entwurf zieht den Geltungsbereich bewusst eng. Er adressiert KI/ML-Modelle in kritischen Anwendungen der GMP-regulierten Herstellung — also dort, wo Modell-Output Produktqualität, Patientensicherheit oder Datenintegrität direkt berühren kann.
Drei Abgrenzungen sind besonders relevant:
- Statische Modelle: Für kritische Anwendungen erwartet der Entwurf Modelle mit deterministischem Verhalten — gleicher Input führt zu gleichem Output. Das Modell wird trainiert, eingefroren, getestet und dann in einem definierten Zustand betrieben.
- Dynamische Modelle: Systeme, die im Betrieb weiterlernen und ihr Verhalten laufend ändern, sieht der Entwurf für kritische Anwendungen nicht vor — ihr validierter Zustand wäre nicht stabil nachweisbar.
- Generative KI und LLMs: Wegen ihres probabilistischen Verhaltens liegen sie außerhalb des kritischen Annex-22-Geltungsbereichs — für kritische GMP-Anwendungen sieht der Entwurf ihren Einsatz nicht vor. In nicht-kritischen, unterstützenden Anwendungen bleiben sie möglich — dann mit qualifizierter, dokumentierter menschlicher Prüfung, bevor ein Output regulatorisch wirksam wird.
Annex 22 verbietet generative KI nicht — er macht die menschliche Prüfung zur Bedingung, unter der ihr Einsatz tragfähig wird.
Die Kernanforderungen im Überblick
Die Anforderungen des Entwurfs lassen sich zu sieben Disziplinen verdichten — jede einzelne kennt ein Validierungsteam dem Sinn nach bereits, neu ist die konsequente Anwendung auf Modelle:
- Intended Use: Der Einsatzzweck des Modells ist präzise beschrieben — Aufgabe, Grenzen, Eingabedaten, betroffene Prozesse.
- Datenqualität & -governance: Trainings-, Validierungs- und Testdaten sind kontrolliert, repräsentativ und nachvollziehbar verwaltet.
- Unabhängige Testdaten: Die Leistungsbewertung läuft auf Daten, die nicht im Training verwendet wurden — Trennung nachweisbar.
- Performance & Akzeptanzkriterien: Metriken und Schwellen sind vor dem Test festgelegt und am Intended Use ausgerichtet.
- Erklärbarkeit & Konfidenz: Soweit möglich wird sichtbar, welche Merkmale ein Ergebnis treiben und wie sicher das Modell ist.
- Human Oversight: Menschliche Aufsicht ist in den Prozess eingebaut — mit definierten Rollen und dokumentierten Entscheidungen.
- Monitoring & Change Control: Die Modellleistung wird im Betrieb überwacht (Stichwort Drift); Änderungen laufen kontrolliert.
Das Muster dahinter
Alle sieben Disziplinen folgen einem Prinzip, das GxP-Teams kennen: Behaupte nichts, was du nicht belegen kannst. Annex 22 überträgt die Beweisdisziplin der Validierung auf Modelle — Daten, Verhalten und Entscheidungen müssen nachvollziehbar bleiben.
Was das für QA- und Validierungsteams konkret bedeutet
Auch wenn die finale Fassung noch aussteht: Wer heute KI in GxP-Prozessen einsetzt oder plant, kann vier Dinge sofort tun.
Erstens: Inventarisieren. Welche KI läuft heute in Ihren Prozessen — auch inoffiziell? Ein Copilot im Dokumentenentwurf ist KI-Einsatz, auch wenn er in keinem Systemverzeichnis steht. Ohne Inventar keine Risikobewertung.
Zweitens: Kritikalität einstufen. Trennt eine Anwendung kritische Entscheidungen (Freigabe, Spezifikation, Bewertung) von unterstützender Arbeit (Entwurf, Recherche, Strukturierung)? Genau entlang dieser Linie wird Annex 22 unterscheiden.
Drittens: Human Oversight als Prozess bauen, nicht als Behauptung. „Ein Mensch schaut drüber“ genügt nicht. Belastbar ist: definierte Prüfschritte, attributierte Freigaben mit Begründung, ein Audit-Trail, der KI-Vorschlag und menschliche Entscheidung unterscheidbar macht.
Viertens: Quellenbindung herstellen. Wenn KI-Output in regulierte Dokumente fließt, muss nachvollziehbar sein, worauf sich jede Aussage stützt. Ein Entwurf ohne belegbare Quellen ist im Review teurer als gar kein Entwurf.
Niedrigschwellig starten
Der sauberste Einstieg ist ein eng abgegrenzter, nicht-kritischer Prozess mit vollständiger menschlicher Prüfung — dort sammeln Sie die Nachweise und Arbeitsmuster, die Annex 22 für größere Schritte ohnehin verlangen wird.
Annex 22, GAMP 5 2nd Edition, FDA CSA: ein gemeinsames Bild
Annex 22 steht nicht allein. Drei Rahmenwerke aus unterschiedlichen Richtungen sind in den letzten Jahren auf dieselben Prinzipien eingeschwenkt:
- GAMP 5 2nd Edition (2022) akzeptiert KI-gestützte Arbeit im risikobasierten Lifecycle und verlangt Critical Thinking statt Schema-Dokumentation.
- FDA CSA (Final Guidance 2025) verschiebt den Aufwand vom Dokumentieren zum belastbaren Begründen — Testtiefe folgt dem Risiko.
- EU GMP Annex 22 (Entwurf 2025) formuliert dieselbe Logik erstmals KI-spezifisch: kontrollierte Daten, nachweisbares Modellverhalten, menschliche Aufsicht.
Für Ihre Strategie heißt das: Sie müssen nicht auf drei Regelwerke einzeln reagieren. Wer seine KI-Arbeit auf Quellenbindung, attributierte menschliche Freigabe und lückenlosen Audit-Trail baut, bedient alle drei Rahmen mit derselben Architektur — und ist gegenüber der finalen Annex-22-Fassung robust, weil diese Prinzipien der gemeinsame Kern sind, nicht das Verhandlungsdetail.
Wie Sie sich heute vorbereiten — ohne auf die finale Fassung zu warten
Ein realistischer Vorbereitungs-Pfad in vier Schritten:
- 01 · KI-Inventar und Kritikalitäts-Map — alle KI-Berührungspunkte erfassen und je Anwendung einstufen: kritisch / unterstützend.
- 02 · Review-Gate definieren — für jeden KI-gestützten Workflow festlegen, wer prüft, was geprüft wird und wie die Entscheidung dokumentiert ist.
- 03 · Quellen- und Datenraum kontrollieren — festlegen, aus welchen freigegebenen Quellen KI-Entwürfe entstehen dürfen, und die Trennung von Arbeits- und Trainingsdaten vertraglich wie technisch absichern.
- 04 · Nachweise von Anfang an mitführen — Versionen, Freigaben und Begründungen entstehen im Arbeitsfluss, nicht in einer Nachdokumentations-Schleife vor dem Audit.
Genau auf dieses Muster ist traqx gebaut: Entwürfe entstehen ausschließlich aus freigegebenen Quellen, jede regulatorische Aussage endet auf einer klickbaren Citation, eine deterministische Prüfung markiert Unbelegtes als unverified, und jede Freigabe ist eine attributierte menschliche Entscheidung mit Audit-Trail. Das ist kein Annex-22-Zertifikat — eine solche Zertifizierung existiert nicht. Es ist eine Arbeitsweise, die die Prinzipien des Entwurfs heute schon praktisch umsetzt.
Kernbotschaften
- Annex 22 (Entwurf Juli 2025) ist der erste EU-GMP-Annex speziell für KI — veröffentlicht zusammen mit der Entwurfs-Revision von Annex 11.
- Kritische Anwendungen: nur statische, deterministisch betriebene Modelle — dynamisch weiterlernende Systeme sind dafür nicht vorgesehen.
- Generative KI und LLMs dürfen kritische Entscheidungen nicht autonom tragen — ihr Output braucht eine dokumentierte menschliche Prüfung.
- Die Kerndisziplinen — Intended Use, Datenqualität, unabhängige Testdaten, Erklärbarkeit, Human Oversight, Monitoring — folgen derselben Logik wie GAMP 5 2nd Edition und FDA CSA.
- Wer heute Quellenbindung, attributierte Freigaben und Audit-Trail etabliert, ist gegenüber der finalen Fassung robust — Status des Dokuments vor Entscheidungen stets aktuell prüfen.
Quellen
- Europäische Kommission — EudraLex Vol. 4, Entwurf Annex 22 „Artificial Intelligence“ (Konsultation ab 7. Juli 2025) — das maßgebliche Dokument: Geltungsbereich, statische Modelle, Human Oversight, Testdaten, Erklärbarkeit.
- Europäische Kommission — Entwurf der Revision von EU GMP Annex 11 (Computerised Systems, 2025) — parallel konsultiert; der allgemeine Rahmen für computergestützte Systeme, in den Annex 22 eingebettet ist.
- ISPE — GAMP 5: A Risk-Based Approach to Compliant GxP Computerized Systems, 2nd Edition (2022) — Branchenleitfaden mit identischer Stoßrichtung: risikobasiert, Critical Thinking, KI-bewusst.
- FDA — Computer Software Assurance for Production and Quality Management System Software (Final Guidance, 2025; aktualisiert Februar 2026) — die US-Perspektive derselben Bewegung: Aufwand folgt dem Risiko, Begründung schlägt Schema.
- 21 CFR Part 11 (Electronic Records / Signatures) — elektronische Aufzeichnungen, Signaturen und manipulationssichere Audit-Trails — die Basis, auf der attributierte Freigaben stehen.
Diese Analysen monatlich per Mail
Praxis-Tiefe zu CSV, CSA, Audit-Readiness und KI-Governance — kein Spam, Abmeldung mit einem Klick.