KI-Revolution in Medien (2022–heute), ChatGPT, Midjourney und generative Medien

Die KI-Revolution in Medien bezeichnet die seit November 2022 durch den Start von ChatGPT ausgelöste tiefgreifende Transformation der Medien- und Kommunikationslandschaft durch generative künstliche Intelligenz, Systeme, die Texte, Bilder, Audio und Video auf Basis von Nutzeranfragen erzeugen können und Produktion, Verteilung und Konsum von Medieninhalten fundamental verändern.

Rubrik: Mediengeschichte & Chronologie · Unterrubrik: Geschichte des Fernsehens & Digitaler Medien · Niveau: Einsteiger Synonyme / Auch bekannt als: GenAI, Generative Künstliche Intelligenz, KI-Wende, Large Language Models (LLMs), Generative AI

Was ist generative KI?

Generative Künstliche Intelligenz (GenAI) bezeichnet KI-Systeme, die in der Lage sind, neue Inhalte zu erzeugen, Texte, Bilder, Audio, Video oder Code, statt nur vorhandene Daten zu analysieren oder zu klassifizieren. Diese Systeme werden auf riesigen Datensätzen trainiert und lernen dabei Muster, Strukturen und Zusammenhänge, die sie dann zur Generierung neuer Inhalte nutzen. Im Medienbereich hat generative KI seit 2022 eine Revolution ausgelöst, die in ihrer gesellschaftlichen Tragweite mit der Erfindung des Buchdrucks oder des Internets verglichen wird.

Erklärung

Die technischen Vorläufer: Transformer und Large Language Models

Die technische Grundlage für die aktuelle KI-Revolution wurde bereits 2017 gelegt: Googles Forschungsteam veröffentlichte das Transformer-Paper „Attention is All You Need", ein neuartiges neuronales Netzwerkarchitektur-Konzept, das es ermöglichte, Sprachmodelle in bisher unvorstellbarer Größe und Qualität zu trainieren.

GPT-1 (OpenAI, 2018), GPT-2 (2019, anfänglich wegen „zu gefährlicher" Fähigkeiten nicht vollständig veröffentlicht) und GPT-3 (2020, 175 Milliarden Parameter) zeigten schrittweise die wachsende Fähigkeit von Sprachmodellen, kohärente und kontextuell relevante Texte zu erzeugen.

Im Bereich Bildgenerierung bahnten sich DALL-E (OpenAI, 2021), Midjourney (beta 2022) und Stable Diffusion (2022, open source) den Weg zur kommerziellen Nutzbarkeit.

ChatGPT (November 2022): Der Katalysator

Am 30. November 2022 veröffentlichte OpenAI ChatGPT, einen chatbot-artigen Zugang zu GPT-3.5, der für die breite Öffentlichkeit kostenlos zugänglich war. Die Reaktion war historisch: Innerhalb von fünf Tagen hatte ChatGPT eine Million Nutzer, nach zwei Monaten 100 Millionen, schneller als jedes andere Produkt zuvor (zum Vergleich: Instagram brauchte 2,5 Monate, TikTok neun Monate).

ChatGPT machte greifbar, was bisher abstrakt war: Ein KI-System, das auf Anweisung Essays schreiben, Code erklären, Gedichte verfassen, Übersetzungen liefern und Fragen beantworten konnte, in natürlicher Sprache, in Sekunden. Die Reaktionen reichten von Faszination über Begeisterung bis zu Erschrecken: In Redaktionen, Schulen, Universitäten und Unternehmen brach eine Debatte los, was generative KI bedeutet.

Die wichtigsten KI-Systeme und ihre Entwickler (2022–2024)

Textgenerierung (Large Language Models):

ChatGPT / GPT-4 (OpenAI): Marktführer; GPT-4 (2023) leistungsfähiger und multimodal (Bild + Text). Hinter OpenAI steht eine Milliarden-Investition von Microsoft.
Claude (Anthropic): Anthropics LLM-Serie, bekannt für Sicherheitsfokus und lange Kontextfenster; Claude 3 (2024) konkurriert auf Augenhöhe mit GPT-4.
Gemini (Google DeepMind): Googles Antwort auf ChatGPT; in Google Search und Google Workspace integriert.
LLaMA (Meta): Open-Source-LLM von Meta; ermöglicht lokalen Betrieb ohne Cloud-Abhängigkeit.
Mistral (Mistral AI, Frankreich): Europäisches LLM mit starker Open-Source-Komponente.

Bildgenerierung:

Midjourney: Über Discord zugänglich; bekannt für ästhetisch hochwertige, fotorealistische Bilder auf Prompt-Basis
DALL-E 3 (OpenAI): In ChatGPT integriert; ausgezeichnete Prompt-Treue
Stable Diffusion: Open-Source-Modell; lokal betreibbar; Grundlage für viele derivative Modelle
Adobe Firefly: In Creative Cloud integriert; Fokus auf kommerziell sichere Nutzung (Training auf lizenzierten Bildern)

Videogenerierung:

Sora (OpenAI, 2024): Erstmals hochrealistische, bis zu 60-sekündige Videos aus Textbeschreibungen
Runway Gen-2/Gen-3: Professionelle KI-Videogenerierung für Content Creator und Filmproduktion
Kling (Kuaishou, China): Chinesisches Konkurrenzprodukt zu Sora

Audiogenerierung:

ElevenLabs: Hochrealistische KI-Stimmensynthese; einzelne Stimmen können geklont werden
Suno, Udio: KI-Musikgenerierung auf Prompt-Basis

Auswirkungen auf den Journalismus

Generative KI hat die journalistische Praxis in kurzer Zeit tiefgreifend verändert:

Effizienzgewinne: Routineaufgaben wie das Erstellen von Zusammenfassungen, Übersetzungen, SEO-Metatexten oder ersten Artikelentwürfen aus Pressemitteilungen können mit KI-Unterstützung erheblich beschleunigt werden. Einige Verlage (Associated Press, Bloomberg) nutzen KI bereits für automatisierte Berichte zu Unternehmensgewinnen und Sportergebnissen.

Desinformationsrisiken: Generative KI ermöglicht es, Desinformation in bisher unbekannter Menge und Qualität zu produzieren: täuschend echte Fotos (Deepfakes), gefälschte Zitate, KI-geschriebene Artikel auf Fake-Newswebsites, gefälschte Audiodateien von Politikern. Die Erkennbarkeit sinkt, während die Produktionskosten für Desinformation rapide fallen.

Urheberrechtsdebatte: Generative KI-Systeme wurden auf urheberrechtlich geschützten Texten und Bildern trainiert, ohne Zustimmung oder Vergütung der Urheber. Verschiedene Klagen von Verlagen (New York Times gegen OpenAI), Fotografen und Künstlern sind anhängig; die rechtliche Klärung wird Jahre dauern.

KI-Transparenz in Redaktionen: Viele Medienhäuser entwickeln Richtlinien für den verantwortungsvollen Einsatz von KI: Kennzeichnungspflichten für KI-generierte Inhalte, Überprüfungspflichten vor Veröffentlichung, Verbot von nicht-verifizierten KI-Inhalten.

Auswirkungen auf die Bildproduktion und kreative Industrien

Midjourney, Stable Diffusion und DALL-E haben die Bildproduktion demokratisiert: Jeder kann mit einem Textprompt hochwertige Bilder in Sekunden generieren. Dies hat weitreichende Folgen für:

Stockfoto-Industrie: Getty Images, Shutterstock und andere kämpfen gegen KI-generierte Bilder, die günstig produziert werden können
Grafik- und Designbranche: KI-Tools beschleunigen Workflows, stellen aber auch die Exklusivität manueller Bildproduktion in Frage
Film und Fernsehen: KI kann Effekte, Hintergründe, virtuelle Sets und sogar Schauspieler-Likenesses erzeugen

Der Hollywooder Streik 2023 (WGA, SAG-AFTRA) war in wesentlichen Teilen eine Reaktion auf die Bedrohung durch KI: Drehbuchautoren forderten Schutz vor KI-Übernahme ihrer Arbeit; Schauspieler forderten Kontrolle über die Nutzung ihrer digitalen Abbild.

KI und die Zukunft der Mediennutzung

Generative KI verändert auch die Nutzungsseite von Medien:

KI-Suchmaschinen: Google AI Overviews, Perplexity und andere Tools liefern direkte KI-generierte Antworten statt Links, was den Traffic zu Nachrichtenwebsites reduziert
Personalisierte Inhalte: KI könnte Nachrichtenartikel, Videos oder Podcast-Episoden individuell auf den jeweiligen Nutzer zugeschnitten generieren
KI-Assistenten als Medienintermedäre: Siri, Alexa, Google Assistant und ChatGPT werden zu Informationsgatekeepern zwischen Inhalten und Nutzern

Wichtige Meilensteine & Fakten

2017: Google veröffentlicht Transformer-Paper „Attention is All You Need"
2020: GPT-3 mit 175 Milliarden Parametern
Juli 2022: Midjourney Beta-Start; Stable Diffusion open source
30. November 2022: ChatGPT-Launch, 1 Million Nutzer in 5 Tagen
März 2023: GPT-4 multimodal; Claude 1 (Anthropic)
2023: Hollywood-Streik (WGA, SAG-AFTRA) wegen KI; New York Times klagt gegen OpenAI
Februar 2024: OpenAI stellt Sora vor, realistische KI-Videogenerierung
2024: Gemini 1.5, Claude 3, GPT-4o; KI-Tools in allen großen Medienprodukten integriert
2025–2026: EU AI Act tritt vollständig in Kraft; erste Regulierungswelle für generative KI

Gesellschaftliche & kulturelle Bedeutung

Die generative KI-Revolution ist die tiefgreifendste Veränderung des Medien- und Kreativbereichs seit der Erfindung des Internets. Sie stellt Grundfragen neu: Was ist menschliche Kreativität? Wer besitzt Inhalte? Wie unterscheidet man echte von gefälschten Medien? Wie reguliert man Technologien, die sich schneller entwickeln als Gesetzgebungsprozesse?

Besonders die Medien- und Kulturbranche ist in ihren Grundlagen herausgefordert: Wenn KI Texte, Bilder, Videos und Musik erzeugen kann, die kaum von menschlich produzierten zu unterscheiden sind, verändert sich der wirtschaftliche Wert menschlicher Kreativarbeit grundlegend.

Vergleich & Abgrenzung

Frühere KI-Entwicklungen im Medienbereich (Empfehlungsalgorithmen, automatische Textzusammenfassungen, Bilderkennung) hatten graduelle Auswirkungen. Generative KI ist qualitativ anders: Sie erzeugt neue Inhalte, statt nur bestehende zu analysieren. Dies schafft neue Möglichkeiten und neue Risiken, die in ihrer Reichweite mit dem Buchdruck oder dem Internet vergleichbar sind.

Häufige Fragen (FAQ)

Was ist der Unterschied zwischen KI und generativer KI? KI (künstliche Intelligenz) ist ein breiter Begriff für Systeme, die menschliche Intelligenzleistungen imitieren (Erkennung, Klassifikation, Planung). Generative KI ist ein Teilbereich, der speziell neue Inhalte erzeugt, Texte, Bilder, Audio, Video. Ältere KI-Systeme (z.B. Spamfilter, Bilderkennungssoftware) sind nicht generativ; ChatGPT, Midjourney und Sora sind es.

Darf ich KI-generierte Texte unter meinem Namen veröffentlichen? Rechtlich ist dies in den meisten Ländern derzeit nicht klar reguliert. Journalistisch und akademisch gelten jedoch Transparenz- und Kennzeichnungspflichten. Viele Redaktionen und Universitäten haben eigene Richtlinien entwickelt. Grundsätzlich gilt: Wer KI-generierte Inhalte als eigene ausgibt, riskiert Reputationsschäden und kann gegen Urheberrecht oder Transparenzpflichten verstoßen.

Weiterführend

Marcus, Gary / Davis, Ernest: Rebooting AI. Building Artificial Intelligence We Can Trust. Pantheon Books, New York 2019.
Karpathy, Andrej: The Unreasonable Effectiveness of Recurrent Neural Networks (Blog),
Bundeszentrale für politische Bildung: Künstliche Intelligenz,

Was ist generative KI?

Erklärung

Die technischen Vorläufer: Transformer und Large Language Models

ChatGPT (November 2022): Der Katalysator

Die wichtigsten KI-Systeme und ihre Entwickler (2022–2024)

Auswirkungen auf den Journalismus

Auswirkungen auf die Bildproduktion und kreative Industrien

KI und die Zukunft der Mediennutzung

Wichtige Meilensteine & Fakten

Gesellschaftliche & kulturelle Bedeutung

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

KI-Revolution in Medien (2022–heute), ChatGPT, Midjourney und generative Medien

Was ist generative KI?

Erklärung

Die technischen Vorläufer: Transformer und Large Language Models

ChatGPT (November 2022): Der Katalysator

Die wichtigsten KI-Systeme und ihre Entwickler (2022–2024)

Auswirkungen auf den Journalismus

Auswirkungen auf die Bildproduktion und kreative Industrien

KI und die Zukunft der Mediennutzung

Wichtige Meilensteine & Fakten

Gesellschaftliche & kulturelle Bedeutung

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.