Gemini 3: Google startet neue API für autonome KI-Agenten

23.06.2026 - 00:06:53 | boerse-global.de

Google macht die Interactions API zum Standard für Gemini-Entwickler und kündigt mit Gemini 3 ein neues Flaggschiff-Modell an.

Google DeepMind: Neue Interactions API für KI-Agenten gestartet — Gemini - Abstract digital interface with glowing lines connecting various AI and tool icons, representing Google Gemini's new Interactions API. 23.06.2026 - Bild: über boerse-global.de

Die Schnittstelle wird damit zum primären Werkzeug für Entwickler, die mit Gemini-Modellen und autonomen KI-Agenten arbeiten. Die Ankündigung vom heutigen Montag beendet die Beta-Phase, die im Dezember 2025 begann.

Die Interactions API ersetzt die bisherige generateContent-API als Standardzugang im Gemini-Ökosystem. In Google AI Studio und der offiziellen Dokumentation ist sie nun der voreingestellt Weg. Google betont, dass die alte Version zwar weiterhin unterstützt wird, alle künftigen Agenten-Funktionen jedoch exklusiv der neuen API vorbehalten bleiben.

Während Google die technische Infrastruktur für KI-Agenten massiv ausbaut, schafft die EU mit dem AI Act den verbindlichen rechtlichen Rahmen für deren Einsatz. Dieser kostenlose Umsetzungsleitfaden bietet Unternehmen einen kompakten Überblick über alle neuen Anforderungen, Pflichten und Fristen. EU AI Act in 5 Schritten verstehen

Neue Fähigkeiten für autonome KI-Agenten

Der Schritt zur allgemeinen Verfügbarkeit bringt mehrere technische Neuerungen mit sich, die komplexere, mehrstufige Arbeitsabläufe ermöglichen. Eine wesentliche Änderung betrifft die Vereinfachung des API-Schemas: Traditionelle „Rollen" wurden durch „typisierte Schritte" ersetzt, um die Ausführung agentischer Aufgaben klarer zu strukturieren.

Zu den neuen Funktionen zählen:

Managed Agents: Diese Agenten arbeiten in einer gesicherten Linux-Sandbox-Umgebung.
Hintergrundausführung: Prozesse können nun asynchron laufen, sodass Agenten Aufgaben erledigen, ohne ständig überwacht zu werden.
Werkzeugintegration: Entwickler können mehrere Tools wie Google Search und Google Maps in einer einzigen Anfrage verketten.
Medienerstellung: Die API unterstützt die neuesten Versionen von Googles Kreativmodellen, darunter Nano Banana 2 für Bilder und Lyria 3 für Musik und Audio.

Um die Rechenkosten dieser anspruchsvollen Aufgaben zu managen, führte Google ein Flex-Tarifmodell ein. Dieses bietet eine Kostenersparnis von 50 Prozent gegenüber den Standardtarifen. Für Entwickler, die Wert auf Leistung legen, gibt es einen separaten Priority-Modus, der die Antwortgeschwindigkeiten optimiert.

Gemini 3: Das neue Flaggschiff-Modell

Parallel zum API-Update hat Google offiziell Gemini 3 veröffentlicht. Das neue Flaggschiff-Modell ist nun der Standard-Antrieb für die Gemini-App und ersetzt dort das bisherige Gemini 2.5 Flash-Modell.

Gemini 3 ist speziell für logisches Denken und „agentische" Aufgaben optimiert, die mehrere Denkschritte erfordern. Interne Benchmarks zeigen, dass das Modell seine Vorgänger bei Programmieraufgaben deutlich übertrifft. Diese Veröffentlichung folgt auf den früheren Launch von Gemini 3.5 Flash, das für Hochgeschwindigkeits-Coding und agentenbasierte Anwendungen entwickelt wurde.

Viele Unternehmen setzen bereits auf KI-Systeme, kennen aber die damit verbundenen regulatorischen Risiken der neuen EU-Verordnung noch nicht. Dieser kostenlose Report klärt auf, welche KI-Anwendungen künftig als Hochrisiko eingestuft werden und was Verantwortliche jetzt konkret tun müssen. Kostenlosen KI-Compliance-Report jetzt herunterladen

Industrie setzt auf Agenten-Infrastruktur

Die Verlagerung hin zu einer agentenzentrierten Infrastruktur zeigt bereits kommerzielle Anwendungen. In einer heute bekanntgegebenen Zusammenarbeit integrieren Nokia und Google Cloud sechs spezialisierte KI-Agenten in die Nokia Assurance Center Suite. Diese auf Gemini-Modellen basierenden Agenten sollen Netzwerkprobleme 50 bis 80 Prozent schneller lösen als herkömmliche Methoden. Ein vollständiger Launch als Software-as-a-Service ist für September 2026 im Google Cloud Marketplace geplant.

Google treibt zudem die Standardisierung voran, wie diese Agenten mit externen Daten und anderen KI-Systemen interagieren. Bereits am 17. Juni veröffentlichte das Unternehmen die Agentic Resource Discovery (ARD) -Spezifikation. Dieser offene Standard ermöglicht es Unternehmen, die Fähigkeiten und Endpunkte ihrer KI-Agenten zu verifizieren und zu veröffentlichen. ARD wird sowohl von Google als auch von Microsoft unterstützt und bildet zusammen mit dem Agent2Agent (A2A)-Koordinationsprotokoll und dem Model Context Protocol (MCP) ein einheitliches Backend-Protokoll.

Integration in den gesamten Google-Kosmos

Über Entwickler-Tools hinaus bettet Google diese neuen KI-Fähigkeiten direkt in anwenderorientierte Software ein. Derzeit wird in Chrome Canary eine neue „Ask Gemini"-Funktion getestet. Sie erscheint als schwebende Symbolleiste, wenn Nutzer Text im Web markieren, und erlaubt es, ausgewählte Passagen direkt an ein Gemini-Seitenfeld zur Analyse oder Zusammenfassung zu senden.

Diese Integration folgt auf mehrere Ankündigungen während der Google I/O im Mai, bei denen das Unternehmen seine Vision von rund um die Uhr verfügbaren „Informationsagenten" und generativen Benutzeroberflächen vorstellte, die individuelle Layouts für Suchergebnisse erstellen. Um den massiven Rechenbedarf dieser Systeme zu decken, erwartet Google für 2026 Investitionsausgaben zwischen 180 und 190 Milliarden US-Dollar – getrieben vor allem durch den Ausbau neuer Tensor Processing Units.

de | wissenschaft | 69606464 |