Gemini 3.5 Flash: Googles Antwort auf explodierende KI-Budgets
30.05.2026 - 22:32:29 | boerse-global.deGoogle-CEO Sundar Pichai schlug auf der Entwicklerkonferenz I/O 2026 Mitte Mai Alarm: Viele Unternehmen hätten ihre jährlichen Token-Kontingente bereits im Mai aufgebraucht. Die Antwort des Konzerns heißt Gemini 3.5 Flash – ein Modell, das Rechenleistung und Kosten in ein neues Gleichgewicht bringen soll.
Während Konzerne wie Google die Effizienz ihrer Modelle steigern, müssen Unternehmen auch die rechtlichen Rahmenbedingungen im Blick behalten. Dieser kostenlose Umsetzungsleitfaden bietet Ihnen einen kompakten Überblick über alle Anforderungen, Pflichten und Fristen der neuen EU-KI-Verordnung. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt
Explodierende Nachfrage nach KI-Kapazitäten
Der Hunger nach KI-Ressourcen ist enorm. Die monatliche Token-Nutzung in Googles KI-Produktpalette ist binnen eines Jahres um das Siebenfache auf 3,2 Billiarden Token gestiegen. Spitzenkunden verarbeiten inzwischen rund eine Billion Token pro Tag. Die Folge: massive BudgetĂĽberschreitungen. Ein besonders drastisches Beispiel liefert der Fahrdienstvermittler Uber, der sein gesamtes KI-Budget fĂĽr 2026 bereits in den ersten vier Monaten des Jahres aufgebraucht haben soll.
Gemini 3.5 Flash soll hier Abhilfe schaffen. Das Modell bietet laut Google Frontend-Leistung zu etwa einem Drittel der Kosten bisheriger Modelle. Würden Unternehmen 80 Prozent ihrer bestehenden KI-Workloads auf eine Kombination aus Flash und anderen Spitzenmodellen umstellen, könnten sie jährlich über eine Milliarde Euro einsparen. Optimiert ist das Modell vor allem für Programmierung, agentische Workflows und interaktive Ausgaben – in bestimmten Benchmarks soll es sogar das leistungsstärkere Gemini 3.1 Pro übertreffen.
Technische Details und VerfĂĽgbarkeit
Gemini 3.5 Flash ist ab sofort fĂĽr Produktionsumgebungen verfĂĽgbar. Es unterstĂĽtzt ein Kontextfenster von einer Million Token und maximal 65.000 Ausgabe-Token. Integriert wurde das Modell in die Gemini App, Google AI Studio, Android Studio und den KI-Modus der Google-Suche.
Zu den technischen Neuerungen gehört eine standardmäßige „mittlere" Denkstufe sowie die Ablösung des Parameters „thinking_budget" durch die neue Einstellung „thinking_level". Analysten von William Blair sehen Google hier klar im Vorteil: Dank der hauseigenen TPU-Chip-Infrastruktur lägen die KI-Rechenkosten um 50 bis 75 Prozent unter denen der Wettbewerber.
Das Gemini-Ökosystem wächst
Der rasante technologische Fortschritt durch Modelle wie Gemini bringt nicht nur Chancen, sondern auch neue regulatorische Verantwortungen fĂĽr IT- und Rechtsabteilungen mit sich. Erfahren Sie in diesem kostenlosen Report, welche KI-Systeme als Hochrisiko gelten und was Unternehmen jetzt konkret zur Risikodokumentation tun mĂĽssen. Kostenlosen Umsetzungsleitfaden zum EU AI Act anfordern
Parallel zum kosteneffizienten Flash-Modell präsentierte Google mit Gemini Omni ein multimodales „Weltmodell", das per Sprachbefehl Videos, Audio und Bilder generieren und bearbeiten kann. Gestartet ist Omni am 28. Mai 2026 zunächst in Indien – Nutzer können dort kurze Videos bearbeiten, Szenen verändern und Effekte hinzufügen.
Für ambitionierte Einzelnutzer gibt es Gemini Spark: einen persönlichen KI-Agenten, der rund um die Uhr auf Googles Cloud-VMs läuft. Spark befindet sich derzeit in der Beta-Phase für AI-Ultra-Abonnenten in den USA und kann komplexe Arbeitsabläufe wie Terminplanung und Dokumentenverwaltung ausführen – selbst wenn das lokale Gerät des Nutzers ausgeschaltet ist.
Milliarden-Investitionen in die Zukunft
Die Produktvorstellungen folgen auf ein starkes erstes Quartal 2026. Alphabet meldete einen Quartalsumsatz von 109,9 Milliarden Euro – ein Plus von 20 Prozent. Besonders die Google Cloud legte um 63 Prozent auf 20 Milliarden Euro zu. Die gesamte Gemini-Nutzerbasis hat sich auf rund 900 Millionen aktive Nutzer pro Monat in 230 Ländern verdoppelt.
Um dieses Wachstum zu stemmen, erhöht Google seine Investitionen massiv. Die Kapitalausgaben für 2026 sollen zwischen 180 und 190 Milliarden Euro liegen – ein gewaltiger Sprung von den 31 Milliarden Euro im Jahr 2022. Gleichzeitig senkte Google im Mai die Preise: Das AI-Ultra-Abo kostet nun 200 statt 250 Euro pro Monat, und es gibt ein neues 100-Euro-Tarif speziell für Entwickler.
Auch im weiteren KI-Ökosystem investiert Alphabet kräftig. Die Konzerntochter CapitalG führte eine Finanzierungsrunde über 113 Millionen Euro für OpenRouter an – einen Marktplatz mit Zugang zu über 400 verschiedenen KI-Modellen. OpenRouter, inzwischen mit rund 1,3 Milliarden Euro bewertet, hilft Unternehmen dabei, Kosten zu managen und Abhängigkeiten von einzelnen Anbietern zu vermeiden.
So schätzen die Börsenprofis Aktien ein!
FĂĽr. Immer. Kostenlos.
