Google Lyria 3: KI erzeugt komplette Songs in Gemini

Googles KI-Assistent generiert nun 30-Sekunden-Songs mit Gesang, Text und Cover-Art und integriert die Funktion direkt in YouTube Shorts. Das stellt Anbieter wie Suno vor neue Herausforderungen.

Googles KI-Assistent Gemini wird zum Tonstudio. Mit dem neuen Modell Lyria 3 erstellt die App auf Befehl 30-Sekunden-Songs inklusive Gesang, Text und Cover-Art. Der Vorstoß bedroht spezialisierte KI-Musik-Startups.

Die am Mittwoch, 18. Februar 2026, gestartete Funktion ist ein zentraler Teil von Googles „AI Spring“-Offensive. Sie verwandelt Gemini in eine kreative All-in-One-Plattform und stellt Anbieter wie Suno oder Udio in den Schatten. Nutzer ab 18 Jahren in über 150 Ländern können ab sofort per Text, Bild oder Video-Vorlage hochwertige Musiktracks generieren.

Vom Liedtext bis zum Albumcover: So funktioniert Lyria 3

Das Herzstück ist Lyria 3, das bislang ausgefeilteste Musik-KI-Modell von Google DeepMind. Anders als frühere, oft experimentelle Tools erzeugt es strukturierte Songs mit stimmigen Texten und verschiedenen Gesangsstimmen. Der Clou: Die multimodale Eingabe.

Nutzer können ein Foto oder ein Video hochladen und Gemini bitten, einen passenden Soundtrack zu komponieren. Ein Video einer regnerischen Straße mit dem Wunsch nach einem „Lo-Fi-Jazz-Track mit melancholischer Frauenstimme“ genügt. Die KI analysiert die Stimmung der Bilder und generiert synchronen Audio-Content.

Die Steuerung ist granular. Vorgegeben werden können Genre (von „90er-Rap“ bis „Afropop“), Tempo, Instrumentierung und Gesangspräsenz. Fehlen eigene Lyrics, erfindet sie der integrierte Texter passend zum Thema. Den letzten Schliff gibt „Nano Banana“, ein leichtes Bildgenerierungs-Modell, das automatisch ein individuelles Albumcover für jeden Track erstellt. Vom Text bis zur Verpackung – ein komplettes „Taschenstudio“ für Social-Media-Creators.

Globale Verfügbarkeit und Integration in YouTube

Google setzt auf breite Zugänglichkeit. Die Funktion startete am Mittwoch für Desktop-Nutzer und rollt bis zum Wochenende auf mobilen Apps aus. Prompts und Lyric-Erstellung funktionieren in acht Sprachen, darunter Deutsch, Englisch und Französisch. Weitere Sprachen sind in Entwicklung.

Das Angebot ist gestaffelt: Kostenlose Nutzer erhalten ein tägliches Kontingent an Generierungen. Abonnenten der Gemini Advanced-Pläne (AI Plus, Pro, Ultra) profitieren von höheren Limits und schnellerer Verarbeitung.

Besonders brisant ist die Anbindung an Googles Ökosystem. Die Lyria-3-Technologie treibt nun auch „Dream Track“ für YouTube Shorts an. Creator können direkt in der YouTube-Erstellungsoberfläche einzigartige, urheberrechtsichere Soundtracks erzeugen. Das beantwortet eine lange gehegte Forderung nach einfach zugänglicher, origineller Hintergrundmusik ohne Lizenzwirrwarr.

Sicherheit und Urheberrecht: Googles defensiver Ansatz

Angesichts der anhaltenden Debatten um KI-Urheberrecht und Deepfakes hat Google mehrere Sicherheitsvorkehrungen integriert. Jedes Audio-Output enthält SynthID, einen unhörbaren digitalen Wasserstoff von DeepMind. Dieser ermöglicht Plattformen, KI-generierte Inhalte automatisch zu kennzeichnen – ein wichtiger Schritt gegen Desinformation.

Anzeige

Die EU hat mit der KI‑Verordnung strikte Regeln für Kennzeichnung, Risikoklassifizierung und Dokumentation von KI‑Systemen eingeführt. Wer KI-Modelle entwickelt, anbietet oder in Dienste integriert, sollte jetzt wissen, welche Pflichten gelten und welche Fristen anstehen. Ein kostenloser Umsetzungsleitfaden erklärt praxisnah, welche Anforderungen Unternehmen und Entwickler in der EU beachten müssen. Jetzt kostenlosen Leitfaden zur EU‑KI‑Verordnung herunterladen

In puncto Urheberrecht betont Google, Lyria 3 sei für „originellen Ausdruck“ designed, nicht zur Nachahmung spezifischer, geschützter Werke. Strikte Filter verhindern, dass die KI Musik im exakten Stil namentlich genannter Künstler erzeugt. Eine Aufforderung wie „Mach einen Song, der klingt wie Taylor Swift“ wird abgelehnt oder auf ein generisches Genre wie „beschwingter Contemporary Pop“ umgelenkt – ohne Imitation der spezifischen Stimme.

Beobachter werten diesen vorsichtigen Ansatz als Reaktion auf laufende Klagen gegen andere KI-Musikfirmen. Durch Fokus auf Genre-Emulation und Verbot direkter Nachahmung will Google juristische Risiken minimieren, ohne die kreative Kraft des Tools zu beschneiden.

Kampf um die Multimodalität: Bedrohung für Nischen-Player

Der Launch von Lyria 3 heizt den „multimodalen Krieg“ zwischen Tech-Giganten und spezialisierten KI-Startups weiter an. Bislang dominierten agile Player wie Suno das Feld der hochwertigen KI-Songgenerierung. Google versucht nun, diese Fähigkeit im Millionen-starken Gemini-Ökosystem zu vereinnahmen und zur Commodity zu machen.

Die Bequemlichkeit, Text-, Bild- und Audio-Generierung in einer einzigen Oberfläche zu haben, könnte Gelegenheitsnutzer von spezialisierten Apps weglocken. Besonders disruptiv ist die Video-zu-Musik-Funktion für die Social-Media-Landschaft. Creator kämpfen oft damit, passende Musik für Timing und Stimmung ihrer Clips zu finden. Geminis Fähigkeit, ein hochgeladenes Video direkt zu „vertonen“, bietet eine Workflow-Effizienz, die aktuelle Wettbewerber kaum erreichen.

Google verknüpft den Launch zudem mit seiner Hardware: Parallel zum Start des Pixel 10a zeigt das Unternehmen, wie der neue Smartphone-Chip Teile der „Nano Banana“-Cover-Generierung on-device verarbeitet – für geringere Latenz bei mobilen Nutzern.

Was kommt als Nächstes?

Die aktuelle Version ist auf 30-Sekunden-Clips beschränkt. Doch die Technologie legt den Grundstein für längere Kompositionen. Google nennt keinen Zeitplan für vollständige Songs (z.B. 2-3 Minuten), doch Experten halten dies für den nächsten logischen Schritt, sobald Inferenz-Kosten sinken und die Modell-Kohärenz steigt.

Kurzfristig wird die Sprachunterstützung erweitert. Googles Roadmap verspricht zudem regionale Musikstile und Instrumente im Training, um über die initialen, westlich-zentrierten Genres hinaus kulturspezifischere Outputs zu ermöglichen.

Die Musikindustrie beobachtet die Entwicklung mit gemischten Gefühlen. Während einige Produzenten eine Gefahr für ihr Handwerk sehen, begrüßen andere die Tools als ultimatives Sketching-Instrument – eine Möglichkeit, Melodien und Akkordfolgen sofort zu prototypieren, die später von menschlichen Händen verfeinert werden können. Mit Lyria 3 hat Gemini das Studio betreten. Und die Lautstärke wird nur noch zunehmen.