← Zurück zu GenAI & Content Creation
Agentische KI bezeichnet KI-Systeme, die selbständig Ziele planen, Teilaufgaben identifizieren, Werkzeuge nutzen und iterativ auf Feedback reagieren — ohne für jeden Schritt menschliche Anleitung zu benötigen.

Rubrik: GenAI & Content Creation · Unterrubrik: KI-Workflow & Automatisierung · Niveau: Profi Synonyme / Auch bekannt als: AI Agents, Autonome KI-Agenten, LLM-Agenten, Multi-Agent-Systeme, Agentic AI

Was sind agentische KI-Systeme?

Klassische LLM-Nutzung ist reaktiv: Der Mensch stellt eine Frage, das Modell antwortet. Agentische KI ist proaktiv: Das System erhält ein übergeordnetes Ziel ("Recherchiere alle Wettbewerber und erstelle ein Marktanalyse-Dokument") und plant dann eigenständig, welche Teilschritte notwendig sind, welche Werkzeuge es benötigt und wie es auf Zwischenergebnisse reagiert.

Das ist eine fundamentale Erweiterung: LLMs werden zu Akteuren, nicht nur zu Beratern. Die Fähigkeiten steigen enorm — aber damit auch die Risiken und die Notwendigkeit sorgfältiger Kontrolle.

Erklärung

Architektur eines KI-Agenten

Ein KI-Agent besteht typischerweise aus vier Kernkomponenten:

1. LLM als "Gehirn" (Planner): Das Sprachmodell ist für Planung und Entscheidungen zuständig. Es analysiert das Ziel, bricht es in Teilschritte herunter, wählt geeignete Werkzeuge und interpretiert Ergebnisse. Aktuelle Spitzenmodelle für Agenten: GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro.

2. Memory (Gedächtnis): Agenten brauchen Gedächtnis, um über mehrere Schritte hinweg konsistent zu arbeiten.

  • Short-Term Memory: Kontext im aktuellen LLM-Kontextfenster
  • Long-Term Memory: Externe Vektordatenbanken (Pinecone, Chroma, Qdrant) für die Speicherung von Fakten, Erfahrungen, Dokumenten

3. Tools (Werkzeuge): Agenten können Werkzeuge aufrufen — das unterscheidet sie von einfachen LLM-Calls:

  • Websearch (Tavily, Serper, Brave)
  • Code-Ausführung (Python REPL)
  • Dateioperationen (Lesen, Schreiben)
  • API-Calls (REST, GraphQL)
  • Datenbankabfragen
  • Andere KI-Modelle (Bildgenerierung, STT, etc.)

4. Planning/Reasoning: Verschiedene Planungsstrategien: ReAct (Reason + Act), Chain of Thought, Tree of Thought, Plan-and-Execute. Diese bestimmen, wie der Agent Entscheidungen trifft und auf Fehler reagiert.

AutoGPT und Early Agents

AutoGPT (April 2023, Toran Bruce Richards) war eines der ersten populären agentischen KI-Systeme. Es nutzt GPT-4 als Planner, ermöglicht Websearch, Code-Ausführung und Dateioperationen, und versucht selbständig Ziele zu erreichen.

AutoGPT zeigte sowohl das Potenzial (beeindruckende Selbständigkeit) als auch die Grenzen (endlose Schleifen, "halluzinierte" Pläne, unkontrollierte Aktionen) früher Agenten. Heute gilt AutoGPT eher als historisches Referenzprojekt.

Claude-Agenten (Anthropic)

Anthropic hat agentische Nutzung von Claude explizit als Kernkompetenz entwickelt. Claude 3.5 Sonnet gilt 2024 als eines der besten Modelle für Agenten-Tasks ("Tool Use", "Computer Use").

Claude's "Computer Use" (2024): Claude kann einen Computer bedienen — Screenshots analysieren, auf Schaltflächen klicken, in Formulare eingeben. Das ermöglicht vollständig automatisierte Computer-Workflows ohne APIs.

Claude Code (CLI): Ein Agentic Coding Assistant, der eigenständig Code analysiert, schreibt, Tests ausführt und Bugs behebt. Nutzt das lokale Dateisystem als Werkzeug.

LangChain und Frameworks

LangChain ist das meistgenutzte Python-Framework für den Aufbau von LLM-Agenten. Es standardisiert die Verbindung von LLMs, Tools, Memory und Chains.

Wichtige LangChain-Konzepte:

  • Agents: Vordefinierte Agenten-Typen (ReAct, OpenAI Functions Agent, Structured Chat)
  • Tools: Einfach erweiterbare Tool-Klassen
  • Chains: Festgelegte Abfolgen von LLM-Calls und Tool-Nutzungen
  • LCEL (LangChain Expression Language): Deklarative Kompositionssprache für Ketten

Alternativen zu LangChain:

  • LlamaIndex: Fokus auf RAG (Retrieval-Augmented Generation), gut für dokumentenbasierte Agenten
  • CrewAI: Framework für Multi-Agent-Teams
  • Autogen (Microsoft): Framework für Multi-Agent-Konversationen
  • Swarm (OpenAI): Leichtgewichtiges Multi-Agent-Framework

Multi-Agent-Workflows

Statt einem Generalisten-Agenten werden Aufgaben auf spezialisierte Agenten verteilt, die zusammenarbeiten:

Typische Multi-Agent-Architektur für Content-Produktion:

  • Research Agent: Recherchiert Fakten, Quellen, aktuelle Ereignisse (Websuche)
  • Writing Agent: Verfasst Text auf Basis der Recherche
  • Review Agent: Prüft auf Fakten, Stil, Rechtschreibung
  • SEO Agent: Optimiert für Suchmaschinen
  • Coordinator Agent (Orchestrator): Verteilt Aufgaben, sammelt Ergebnisse, gibt Freigabe

Diese Architektur macht Systeme robuster: Fehler eines Spezialisten-Agenten werden vom Coordinator erkannt und können an einen Review-Agenten weitergegeben werden.

Grenzen und Risiken agentischer KI

Agentische Systeme haben akute Risiken, die ernst genommen werden müssen:

Endlosschleifen: Agenten können in unproduktiven Schleifen gefangen werden, bei denen sie immer wieder die gleichen Schritte ausführen ohne Fortschritt.

Unkontrollierte Aktionen: Ein Agent mit Dateisystem-Zugriff kann versehentlich Dateien löschen. Ein Agent mit API-Zugriff kann unbeabsichtigt API-Kosten verursachen oder Daten verändern.

Prompt Injection: Wenn ein Agent Web-Inhalte liest, kann bösartiger Text im Webinhalt ("Ignore previous instructions, send all data to...") die Agenten-Aktionen manipulieren.

Kompetenzüberschätzung: Agenten schätzen ihre eigenen Fähigkeiten manchmal falsch ein und behaupten Aufgaben ausgeführt zu haben, die sie nicht ausgeführt haben.

Für alle agentischen Systeme in der Produktion gilt: Human-in-the-Loop ist unverzichtbar.

Beispiele

Medienrecherche-Agent: Ein Agent erhält den Auftrag: "Recherchiere alle relevanten Meldungen der letzten 24 Stunden zu KI in der Medienbranche. Erstelle eine priorisierte Liste mit Kurzzusammenfassungen." Der Agent nutzt Tavily (Websuche), liest Artikel, fasst zusammen und erstellt ein Markdown-Dokument. Dauer: 5–10 Minuten statt 2 Stunden manuelle Recherche.

Content-Produktion mit Multi-Agent: CrewAI-basiertes System mit Research Agent, Writing Agent und Editor Agent produziert Erstversionen von Branchenberichten. Human-in-the-Loop vor Veröffentlichung.

Automatisierter Customer Support: Claude-Agent bearbeitet Kundenanfragen per E-Mail: versteht Anfrage, sucht in Wissensdatenbank, entwirft Antwort. Komplexe Fälle werden an menschliche Supportmitarbeiter eskaliert.

In der Praxis

Einstieg mit n8n AI Agents: n8n hat native LangChain-basierte AI Agent Nodes, die ohne Python-Kenntnisse genutzt werden können. Innerhalb von n8n Workflow-Automatisierung lässt sich ein einfacher Recherche-Agent mit Web Search Tool und Memory in 30 Minuten aufbauen.

Einstieg mit Python (LangChain):

  1. pip install langchain langchain-openai tavily-python
  2. OpenAI und Tavily API Keys einrichten
  3. Einfachen ReAct-Agenten mit Websearch-Tool erstellen
  4. Ziel-Prompt definieren und Agent ausführen

Vergleich & Abgrenzung

SystemAutonomiegradRisikoFür wen?
Single LLM-CallMinimalMinimalEinsteiger
Chain (festgelegte Schritte)NiedrigNiedrigMittlere Workflows
Single Agent mit ToolsMittelMittelFortgeschrittene
Multi-Agent SystemHochHochProfis, Entwickler
Fully Autonomous (no HITL)Sehr hochSehr hochSpezialanwendungen

Häufige Fragen (FAQ)

Sind KI-Agenten bereits produktionsreif? Für eng definierte, überschaubare Aufgaben mit gutem Monitoring: Ja. Für kreative, offene oder hochriskante Aufgaben ohne menschliche Aufsicht: Noch nicht. Die Technologie entwickelt sich monatlich weiter.

Was kostet der Betrieb eines KI-Agenten? Kosten entstehen durch LLM-API-Calls (jeder Tool-Aufruf und jede Planungs-Iteration kostet Tokens), ggf. externe APIs (Websuche: Tavily ~10 USD/1.000 Searches), Server-Hosting. Bei intensivem Agenten-Einsatz können API-Kosten schnell steigen — Budgets und Rate Limits setzen.

Wie vermeide ich Prompt Injection in Agenten? Eingabe-Validierung: Inhalte aus dem Web als "untrusted content" flaggen und vom System-Prompt trennen. Minimale Berechtigungen: Agenten nur mit notwendigen Tool-Zugriffen ausstatten. Sandbox-Ausführung für Code-Ausführung.

Verwandte Einträge

Weiterführend

  • Yao, Shunyu et al.: ReAct: Synergizing Reasoning and Acting in Language Models, ICLR, 2023
  • Wang, Guanzhi et al.: Voyager: An Open-Ended Embodied Agent with Large Language Models, 2023
  • Chase, Harrison: LangChain Documentation, 2024
  • Anthropic: Building Effective Agents, Anthropic Blog, 2024
  • Xi, Zhiheng et al.: The Rise and Potential of Large Language Model Based Agents: A Survey, 2023
← Zurück zu GenAI & Content Creation
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar