Google, Gemini

Google Gemini Omni: Ein Modell für alles – Leaks enthüllen KI-Revolution

11.05.2026 - 20:19:46 | boerse-global.de

Google plant mit Gemini Omni ein einheitliches KI-System fĂĽr alle Medienformate. Erste Funktionen tauchen im Live-Dienst auf.

Google Gemini Omni: Ein Modell für alles – Leaks enthüllen KI-Revolution - Foto: über boerse-global.de
Google Gemini Omni: Ein Modell für alles – Leaks enthüllen KI-Revolution - Foto: über boerse-global.de

Nur wenige Tage vor der Entwicklerkonferenz I/O zeichnet sich bei Google ein radikaler Strategiewechsel ab. Ein neues KI-Modell namens „Gemini Omni" soll Text, Bilder und Videos in einem System vereinen.

Die Hinweise verdichten sich: Google steht offenbar kurz davor, seine bislang getrennten KI-Modelle für Video, Bild und Text unter einem Dach zu vereinen. Erste Spuren des neuen Systems namens Gemini Omni tauchten Anfang Mai im Live-Interface des Gemini-Dienstes auf – und zwar nicht in versteckten Testumgebungen, sondern direkt in der Produktivversion.

Anzeige

Während Google die technologischen Grenzen der Künstlichen Intelligenz verschiebt, fragen sich viele Anleger, wie sie finanziell von dieser Revolution profitieren können. Dieser kostenlose Report enthüllt die 10 Big-Data-Aktien, die aktuell das größte Potenzial am Markt aufweisen. Top 10 KI-Aktien jetzt gratis herunterladen

„Powered by Omni" – Der Fund im User Interface

Aufmerksame Nutzer entdeckten als erste die neue Bezeichnung. Ein X-User dokumentierte einen Texthinweis in der Video-Generierungsoberfläche von Gemini. Dort hieß es, die Funktion sei „Powered by Omni". Branchendienste wie TestingCatalog bestätigten den Fund wenig später.

Bisher setzte Google auf getrennte Architekturen: Veo 3.1 (Codename „Toucan") für Videos, die Nano-Banana-Reihe für Bilder. Das Omni-Branding deutet nun auf einen grundlegenden Wandel hin. Statt Speziallösungen soll ein einziges multimodales System alle Medienformate nativ beherrschen.

Der „Spaghetti-Test" als Meilenstein

Am 11. Mai berichtete das Tech-Portal 9to5Google von weiteren Durchsickern. Demnach erhalten ausgewählte Gemini-Pro-Abonnenten bereits die Aufforderung, „mit Gemini Omni zu erstellen". Die Funktionen klingen beeindruckend: Videoclips remixen, direkt im Chat bearbeiten und professionelle Vorlagen nutzen.

Besonders aufmerksam beobachtet die Fachwelt einen spezifischen Test: Ein Leak zeigt das Modell bei der Generierung einer Szene mit zwei Männern, die in einem edlen Restaurant Spaghetti essen. Dieser sogenannte „Spaghetti-Test" gilt als harte Benchmark – ein früher, verpixelter Clip eines essenden Schauspielers war zum Symbol für die Schwächen generativer KI geworden. Die Omni-Version zeigt realistische Bewegungen, flüssige Dynamik und stabiles Licht.

Ein weiteres Demo-Video präsentiert einen Professor, der mathematische Beweise an eine Kreidetafel schreibt. Die korrekte Darstellung von Symbolen und Formeln – eine historische Schwachstelle von KI-Videos – meistert das System offenbar.

Rechenhunger bleibt das größte Problem

So beeindruckend die Ergebnisse wirken: Gemini Omni bleibt ein Ressourcenfresser. Ein Nutzer berichtete, dass bereits zwei HD-Video-Prompts rund 86 Prozent seines täglichen Kontingents verbrauchten. Google hat zuletzt verstärkt an expliziten Nutzungslimits für seine KI-Stufen gearbeitet – ein klares Zeichen für die bevorstehende Einführung rechenintensiver Modelle.

Technische Dokumente deuten auf einen massiv vergrößerten Kontextfenster hin – Spekulationen sprechen von bis zu 12 Millionen Tokens. Das wäre nötig, um Kohärenz über lange Videosequenzen hinweg zu gewährleisten.

Anzeige

Ob für kreative Projekte oder die Organisation im Alltag – moderne KI-Tools wie ChatGPT und Gemini bieten enorme Möglichkeiten, wenn man sie richtig bedient. In diesem kostenlosen Ratgeber erfahren Sie mit fertigen Anleitungen und Prompts, wie Sie die Technologie sofort effektiv für sich nutzen. Kostenlosen KI-Alltagshelfer-Report sichern

Wettbewerb verschärft sich

Der Zeitpunkt der Leaks ist kein Zufall. Der Markt für generative KI-Videos befindet sich im Umbruch. Laut aktuellen Daten der Artificial Analysis Video Arena führt derzeit Alibabas HappyHorse-1.0 mit einem ELO-Wert von 1411 die Rangliste an – vor etablierten Modellen wie Seedance 2.0 und Kling 3.0.

In den USA hat OpenAI Ende April die Verbraucher-App seines Sora-Modells eingestellt und die Technologie auf einen API-Dienst für Unternehmen umgestellt. Eine Lücke im High-End-Markt für Endverbraucher, die Google nun schließen könnte.

Vorsicht nach frĂĽheren Kontroversen

Trotz der Euphorie bleiben einige Analysten skeptisch. Ende 2023 hatte Google scharfe Kritik einstecken müssen, als sich herausstellte, dass ein vielbeachtetes Gemini-Demo-Video stark nachbearbeitet und nicht in Echtzeit aufgenommen worden war. Der aktuelle Fall unterscheidet sich jedoch grundlegend: Die Omni-Funktionen tauchten im Live-Interface zahlender Abonnenten auf – echte Tests unter realen Bedingungen, nicht Studio-Inszenierung.

Was die I/O 2026 bringen könnte

Die Google I/O 2026 beginnt am 19. Mai. Die Keynote gilt als offizieller Rahmen fĂĽr die groĂźen KI-AnkĂĽndigungen. Neben Gemini Omni werden Updates zu den Architekturen Gemini 3.2 und 3.5 erwartet, die auf schnellere Reaktionszeiten fĂĽr mobile Anwendungen abzielen.

Gelingt der Start eines einheitlichen Omni-Modells, könnte Google seine zersplitterten KI-Produkte unter einer Marke vereinen. Für Kreative und Unternehmen bedeutete das: Werbekampagnen mit Skript, Bild und Video aus einem einzigen Arbeitsbereich – ohne Spezialwerkzeuge. Ob die Stabilität und Leistung halten, was die geleakten Demos versprechen, wird sich am 19. Mai zeigen.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
FĂĽr. Immer. Kostenlos.
de | wissenschaft | 69307663 |