Gemini 3.5 Flash: Google spart Kunden eine Milliarde Euro pro Jahr
30.05.2026 - 10:39:10 | boerse-global.de5 Flash ist seit dem 29. Mai 2026 allgemein verfügbar. Google reagiert damit auf den steigenden Kostendruck, dem Unternehmen durch den massiven Einsatz von KI-Sprachmodellen ausgesetzt sind. Der Konzern positioniert die neue Version als schnellere und günstigere Alternative für rechenintensive Aufgaben – insbesondere in der Softwareentwicklung und bei automatisierten Agentenprozessen.
Während Google die Kosten für KI-Modelle senkt, stellen die neuen EU-Vorgaben Unternehmen vor neue Herausforderungen. Dieser kostenlose Download verschafft Ihnen den Überblick über Fristen, Pflichten und Risikoklassen, den Ihre Rechts- und IT-Abteilung jetzt dringend braucht. EU AI Act in 5 Schritten verstehen
Milliardenersparnis durch Modellwechsel
Viele Firmen stoßen laut Google-CEO Sundar Pichai bereits im Mai an ihre Jahresbudgets für KI-Token. Das bringt selbst Großkunden in Bedrängnis. Googles Lösung: Durch die Verlagerung von rund 80 Prozent der KI-Workloads auf Gemini 3.5 Flash könnten Cloud-Kunden gemeinsam über eine Milliarde Euro pro Jahr einsparen.
Das wirtschaftliche Modell dahinter ist Googles vertikale Integration. Analysten von William Blair schätzen, dass die hauseigenen TPU-Chips (Tensor Processing Units) dem Konzern einen Kosten-vorteil von 50 bis 75 Prozent gegenüber Wettbewerbern verschaffen, die auf Drittanbieter-Hardware angewiesen sind. Die schiere Größenordnung des Betriebs ist beeindruckend: Monatlich verarbeitet Googles KI-Infrastruktur 3,2 Billiarden Token – ein Anstieg um das Siebenfache im Vergleich zum Vorjahr.
Die Kehrseite dieser Expansion sind die Investitionen. Für 2026 plant Google Kapitalausgaben zwischen 180 und 190 Milliarden Euro. Das ist fast eine Versechsfachung gegenüber den 31 Milliarden Euro aus dem Jahr 2022.
Leistung und Preisgestaltung im Vergleich
Gemini 3.5 Flash ersetzt Gemini 3.1 Pro als Standardmodell in der Gemini-App mit über 900 Millionen monatlich aktiven Nutzern. Auch im KI-Modus der Google-Suche, die mehr als eine Milliarde User zählt, kommt die neue Version zum Einsatz.
Doch der Effizienzgewinn hat seinen Preis: Die Kosten pro Million Token liegen bei 1,50 Euro für die Eingabe und 9,00 Euro für die Ausgabe. Das bedeutet eine Verdreifachung gegenüber dem Vorgänger Gemini 3 Flash.
In Tests zeigt Gemini 3.5 Flash Stärken in spezifischen Bereichen. Bei der Agenten-Benchmark APEX-Agents-AA erreichte das Modell 47,1 Prozent Genauigkeit, im multimodalen Test MMMU-Pro 84 Prozent. Auch bei Terminal-Bench 2.1 und MCP Atlas übertraf es Gemini 3.1 Pro. Allerdings hinkt es in allgemeiner Intelligenz, Tiefenwissen und komplexen Programmieraufgaben noch den führenden Hochleistungsmodellen hinterher.
Der verstärkte Einsatz von KI-Systemen wie Gemini bringt nicht nur Effizienz, sondern auch neue Dokumentationspflichten mit sich. Welche KI-Systeme konkret als Hochrisiko gelten und was Unternehmen jetzt tun müssen, klärt dieser kostenlose Praxis-Report auf. Kostenlosen Umsetzungsleitfaden zum EU AI Act anfordern
Neue Funktionen und Nutzerfreundlichkeit
Parallel zum Modell-Launch hat Google am 29. Mai die Nutzungsbedingungen angepasst. Nach Beschwerden über zu schnell erreichte Kontingente werden Gemini 3.1 Flash-Lite-Prompts nun kostenlos angeboten. Technische Fehler belasten das Nutzerkontingent nicht mehr.
Für professionelle Anwender in den USA startete am selben Tag Gemini Spark. Das Tool fungiert als rund um die Uhr verfügbarer persönlicher Assistent für Google AI Ultra-Abonnenten. Es automatisiert komplexe Arbeitsabläufe in Google Workspace – also Drive, Gmail und Docs. Bis zu 15 Aufgaben gleichzeitig sind möglich, inklusive Fernzugriff auf Browser und Computer.
Zukunftspläne: Weltmodelle und lernende Agenten
Am 30. Mai 2026 präsentierten Googles KI-Chefs Jeff Dean und Noam Shazeer die langfristige Strategie für das Gemini-Ökosystem. Der Fokus verschiebt sich hin zu sogenannten „Weltmodellen" und langlebigen Agenten, die kontinuierlich lernen und sich selbst verbessern können.
Die Co-Leiter betonten das Ziel einer einheitlichen Modellarchitektur für alle Google-Produkte. Aktuell sei das Training großer Sprachmodelle noch deutlich ineffizienter als menschliches Lernen. Künftige Versionen sollen diese Lücke schließen – durch bessere Bewertungsmethoden und ausgefeiltere Denkfähigkeiten. Konkrete Halluzinationsraten für Gemini 3.5 Flash hat Google noch nicht veröffentlicht. Neue Sicherheitsbewertungen sollen im Juni 2026 folgen.
So schätzen die Börsenprofis Aktien ein!
Für. Immer. Kostenlos.
