ai-systems-architecture.com

AI Systems
Architecture.

KI verlässt das Chatfenster.
Jetzt wird sie Teil der Produktlogik.

Agentische KI liest Dokumente, versteht Fälle, beschafft Kontext, ruft Werkzeuge auf und stößt Aktionen an. Damit entstehen neue Chancen für Software, aber auch neue Anforderungen an Architektur.

AI Systems Architecture ist die Disziplin für diesen Übergang: von plausiblen Modellantworten zu AI-Features, die messbar, begrenzt und betreibbar sind.

Eine Disziplin für Software, in der KI nicht nur antwortet, sondern handelt.

Software konnte lange nur das verarbeiten, was vorher sauber strukturiert war.

Agentische KI verschiebt diese Grenze. Sie kann Freitext, PDFs, Transkripte, Bilder und unklare Fälle aufnehmen. Sie kann Informationen suchen, Fälle einordnen, Vorschläge machen und Systeme bedienen.

Das ist die Chance: Prozesse, die heute zwischen Postfach, Fachwissen und Fachsystemen stecken, werden plötzlich automatisierbar.

Aber genau hier entsteht der Bruch. Wenn ein Chatbot falsch antwortet, liest ein Mensch die Antwort und kann sie verwerfen. Wenn ein Agent falsch handelt, steht das Ergebnis in den Systemen: der falsch eingeordnete Fall, der falsche Eintrag in der Kundenakte, die Freigabe, die nie hätte vorbereitet werden dürfen.

Dann reicht es nicht mehr, ein gutes Modell auszuwählen.
Dann braucht es Architektur.

Plausibel ist nicht genug

Aus Modelloutput wird Produktverhalten.

Ein KI-Modell kann eine Antwort erzeugen, die formal korrekt ist und trotzdem fachlich falsch. Ob die Form der Antwort stimmt, lässt sich automatisch prüfen. Ob ihr Inhalt fachlich stimmt, nicht. Ein Tool-Aufruf läuft technisch erfolgreich durch, hätte aber nie ausgelöst werden dürfen. Und früher reichte ein Blick ins Monitoring, um zu sehen, ob der Server noch läuft. Dass sich Modellverhalten schleichend verändert, sieht man dort nicht.

Diese Fehlerklasse ist neu genug, dass klassische Softwarepraktiken allein nicht ausreichen. Sie müssen ergänzt werden.

AI Systems Architecture fragt deshalb nicht nur „Was kann das Modell?“, sondern:

  1. Was darf es tun?
  2. Woran messen wir richtiges Verhalten?
  3. Wer entscheidet bei Unsicherheit?
  4. Wie merken wir, dass es schlechter wird?
  5. Wie stoppen wir es, wenn es schadet?
Einzeln bekannt, zusammen Pflicht

Sechs Praktiken für den verlässlichen Einsatz agentischer KI.

1Verhalten wird explizit gemacht

AI-Features entstehen nicht aus einem Prompt allein. Verhalten entsteht aus Prompt, Schema, Kontext, Tools, Modellwahl und Evals. Wer eines davon ändert, verändert das Ganze.

Darum braucht ein AI-Feature ein Artefakt, das dieses Verhalten zusammenhält.

2Der Agent Contract wird zum Kernartefakt

Der Agent Contract beschreibt, was ein AI-Feature darf, erwartet, nutzt und beweisen muss. Er bündelt fünf Bestandteile zu einem Paket.

  • 1 Output-Schema
  • 2 Prompt
  • 3 erlaubte Tools
  • 4 Modell und Provider
  • 5 Eval-Set

Eine neue Contract-Version bedeutet: Das Verhalten des Features hat sich geändert. Also wird sie versioniert, reviewt und gegen Evals geprüft. Engineering liefert die Form. Der Fachbereich liefert die Maßstäbe.

3Kontext ersetzt Bauchgefühl

Ein Modell kennt Sprache und Weltwissen. Es kennt nicht automatisch die aktuelle Kundenakte, die interne Richtlinie oder die fachliche Auslegung im Unternehmen.

Grounding bringt den richtigen Kontext zur Anfrage. Damit verschiebt sich die Architekturfrage: Nicht nur das Modell muss gut sein. Auch Suche, Quellen, Aktualität und Berechtigungen entscheiden über Qualität.

Gute AI-Systeme fragen nicht nur „Was könnte plausibel sein?“. Sie fragen: „Welche belegten Informationen darf das Modell für diesen Fall nutzen?“

4Evals machen Qualität messbar

Ausprobieren zeigt nur, dass es einmal funktioniert hat.

Produktionsreife braucht Evals: echte Fälle, erwartete Ergebnisse, fachliche Labels und wiederholbare Messung. Bei jeder Änderung an Prompt, Schema, Modell oder Tools läuft das Feature gegen diese Beispiele.

So wird Qualität nicht behauptet, sondern verfolgt. Nicht perfekt, aber sichtbar, vergleichbar, verbesserbar.

5Aktionen bekommen Grenzen

Sobald ein Modell Werkzeuge nutzt, bekommt es Wirkung. Lesen kann Daten offenlegen. Schreiben kann Schäden erzeugen. Und entscheidet es selbst, ist plötzlich unklar, wer dafür geradesteht.

Darum brauchen Tools klare Grenzen: Owner, Rechte, Risikoklasse, Audit-Trail, Abschaltweg. Manche Aktionen laufen autonom. Manche brauchen Freigabe. Manche gehören gar nicht in die Hände eines Modells.

Das ist keine Bremse. Es ist die Voraussetzung dafür, dass AI-Features mehr dürfen.

6Betrieb wird Teil des Designs

Ein AI-Feature kann schlechter werden, ohne dass jemand Code geändert hat. Eingaben verändern sich. Modellversionen ändern sich. Datenquellen altern. Tool-Antworten driften.

Deshalb müssen AI-Features im Betrieb sichtbar bleiben.

  • 1 Welche Modellversion läuft?
  • 2 Wie oft passt der Output des KI-Modells nicht zur Software?
  • 3 Wie oft korrigieren Menschen?
  • 4 Wie hoch sind Latenz und Kosten?
  • 5 Welche Fälle eskalieren?

Ohne diese Signale ist Betrieb nur Hoffnung.

Vom Experiment in den Ernstfall

Modelle werden handlungsfähiger.
Unternehmen verschieben KI aus Experimenten in Kernprozesse.

Damit entsteht ein neues Feld zwischen Softwarearchitektur, Produktentwicklung, Fachdomäne, UX, Betrieb und Governance.

Eine eigene Disziplin, kein Anbau an die Softwarearchitektur: Was Softwarearchitektur für die Softwareentwicklung ist, ist AI Systems Architecture für das AI Engineering.

Vier Schreibtische, ein Feature

Vier Rollen tragen die Verantwortung.

1

Fachbereich

Ihr Fachwissen, Ihre Erfahrung und Ihre Maßstäbe werden Teil des Systems: Labels, Grenzen, Eskalationen, Tonalität, fachliche Korrektheit.

2

Engineering

Modellverhalten wird versioniert, getestet, deployed und beobachtet wie anderer produktiver Code.

3

Führung

AI-Features skalieren nur dann, wenn Risiko, Kosten und Wertbeitrag sichtbar werden.

4

Betrieb und Governance

Aus einzelnen Experimenten wird schnell ein Portfolio mit Ownern, Datenflüssen, Risikoklassen und Incident-Pfaden.

Vom Prompt zum Produkt

AI Systems Architecture macht agentische KI produktfähig.

Sie hilft Teams, AI-Features so zu bauen, dass sie:

  1. 1 fachlich gebunden sind,
  2. 2 messbar besser werden,
  3. 3 sichere Grenzen haben,
  4. 4 im Betrieb beobachtbar bleiben,
  5. 5 und in der Organisation verantwortet werden können.

Das Ziel ist, der KI mehr Verantwortung geben zu können, ohne ihr blind zu vertrauen.

Die Disziplin in zwei Sätzen

AI Systems Architecture ist die Disziplin für Software, in der KI nicht nur antwortet, sondern handelt.

Sie verbindet Modell, Kontext, Prompt, Schema, Tools, Evals, Human-in-the-Loop, Observability und Governance zu AI-Features, deren Verhalten nachvollziehbar, messbar und begrenzbar ist.

Was nicht auf eine Seite passt

Vertiefen.

Diese Seite skizziert das Feld. Wer tiefer einsteigen will, findet in den folgenden Texten die einzelnen Praktiken ausführlich diskutiert: mit konkreten Beispielen, offenen Fragen und den Stellen, an denen es schwierig wird.

  1. Michael Seel AI Systems Architecture Warum AI-Features in Produktion mehr brauchen als gute Prompts.
  2. Ruben Vitt AI Systems Architecture beginnt dort, wo Modelloutput Teil der Produktlogik wird Wie aus einem GitHub Issue ein testbarer, beobachtbarer Umsetzungsplan wird.
  3. Michael Seel Qualitätsmerkmale für AI-Systeme Wie klassische Qualitätsmodelle auf AI-Features angewandt werden können.
  4. Ruben Vitt Evals in die CI Wenn AI-Features aufhören, Prompts zu sein, und anfangen, Software zu werden.
  5. Ruben Vitt Vom Incident zum Regressionstest Wie Produktionsfehler in das Eval-Set wandern.
  6. Ruben Vitt Tools sind keine Prompts Warum Agent-Aktionen Idempotenz, Auth und Audit brauchen.
  7. Ruben Vitt Nicht das Modell ist das Risiko Warum die Reichweite eines Agenten über den Schaden entscheidet.
  8. Ruben Vitt Gib der AI die Entscheidung, nicht die Kontrolle Warum freie Agent-Loops oft zu offen sind.
  9. Ruben Vitt Approval ist kein UX-Bug Warum Agent-Systeme wissen müssen, wann sie fragen.
  10. Michael Seel Die Taube sieht besser Human-in-the-Loop ist eine Architektur-Entscheidung, keine Compliance-Aussage.
  11. Michael Seel Agent-First Design Erst der Agent, dann der Mensch: eine neue Art von UX.
  12. Ruben Vitt Observability für AI-Features Welche Spans, Events und IDs ein Team wirklich braucht.
  13. Ruben Vitt Release-Disziplin für AI-Features Canary, Shadow Runs und automatischer Rollback.
  14. Michael Seel Governance für AI-Features Wie Organisationen Shadow AI vermeiden und Verantwortung skalieren.