Amazon, SageMaker

Amazon SageMaker AI unterstützt jetzt native OpenAI-API

21.05.2026 - 07:21:47 | boerse-global.de

Amazon Web Services macht SageMaker AI mit einer nativen OpenAI-Schnittstelle zum direkten Ersatz für Drittanbieter-KI-Dienste.

Amazon SageMaker AI unterstützt jetzt native OpenAI-API - Foto: über boerse-global.de
Amazon SageMaker AI unterstützt jetzt native OpenAI-API - Foto: über boerse-global.de

AWS macht seine KI-Plattform mit einem Update zum direkten Ersatz für OpenAI-Dienste – ohne Code-Anpassungen.

Amazon Web Services hat eine native OpenAI-kompatible API für seine SageMaker AI-Echtzeit-Inferenz-Endpunkte eingeführt. Entwickler können damit große Sprachmodelle auf eigenen GPU-Instanzen betreiben und gleichzeitig die standardisierten Schnittstellen nutzen, die in der KI-Branche weit verbreitet sind. Das Update, das Ende Mai 2026 veröffentlicht wurde, beseitigt die Hürden, die bisher aufwändige Code-Umschreibungen oder benutzerdefinierte Proxy-Schichten erforderten.

Anzeige

Während AWS die technische Infrastruktur für KI-Modelle revolutioniert, stellt der Gesetzgeber bereits die Weichen für deren Einsatz. Welche neuen Regeln Unternehmen jetzt beim Einsatz von KI-Systemen beachten müssen, zeigt dieser kostenlose Praxis-Leitfaden zum EU AI Act. EU AI Act in 5 Schritten verstehen

Nahtlose Integration durch standardisiertes Chat-Completions-Protokoll

Das Herzstück der Neuerung ist der Pfad /openai/v1 für SageMaker-AI-Endpunkte. Anwendungen, die mit dem OpenAI SDK, LangChain oder dem Vercel AI SDK entwickelt wurden, können nun mit Modellen auf SageMaker interagieren – lediglich die Basis-URL muss angepasst werden. Bisher waren dafür eigene Clients oder aufwändige SigV4-Signatur-Wrapper nötig.

Die neue Schnittstelle unterstützt sowohl Standard- als auch Streaming-Antworten. Bestehende Nutzererfahrungen wie Echtzeit-Tipp-Indikatoren in Chat-Oberflächen bleiben ohne Anpassungen funktionsfähig. Die Funktion ist für alle Echtzeit-Inferenz-Endpunkte standardmäßig aktiviert.

„Die Möglichkeit, Bearer-Token mit SageMaker-Endpunkten zu verwenden, ermöglicht den nativen Betrieb mit Standard-OpenAI-Clients und internen Gateways – ohne den Overhead benutzerdefinierter Signaturlogik“, erklärt Giorgio Piatti, KI/ML-Ingenieur bei Caffeine.AI. Das ist besonders relevant für Organisationen, die „LLM-Gateways“ nutzen, um Anfragen je nach Kosten, Latenz oder Modellleistung an verschiedene Anbieter weiterzuleiten.

Stärkere Unterstützung für agentische Workflows

Ein Hauptgrund für das Update ist der rasante Aufstieg der agentischen KI – mehrstufige Arbeitsabläufe, bei denen autonome Agenten Werkzeuge und logisches Denken nutzen, um komplexe Aufgaben zu lösen. Frameworks wie Strands Agents und LangChain verlassen sich oft auf die OpenAI-API-Spezifikation als gemeinsame Sprache für die Modell-Orchestrierung. Mit der neuen Unterstützung können Entwickler diese agentischen Workflows vollständig auf ihrer eigenen SageMaker-AI-Infrastruktur ausführen.

Das bedeutet: Vertrauliche Daten, die während des agentischen Denkens verarbeitet werden, verlassen nie das AWS-Konto des Kunden. Durch das Hosting von Modellen wie Llama, Mistral oder spezialisierten Feinabstimmungs-Varianten auf dedizierten GPU-Instanzen können Unternehmen die Datenkontrolle und Compliance verschärfen.

Die Integration mit Strands Agents zeigt den Trend zu selbstverwalteten agentischen Plattformen. Teams können von experimentellen Prototypen zur Produktionsinfrastruktur wechseln – mit minimalem Aufwand. Ein entscheidender Vorteil für Branchen wie Finanzen und Gesundheitswesen, wo der Wechsel von Drittanbieter-APIs zur eigenen Infrastruktur oft durch regulatorische Anforderungen getrieben wird.

Anzeige

Der technologische Fortschritt durch AWS und SageMaker AI schafft enorme Marktpotenziale, birgt aber auch neue Sicherheitsrisiken für Unternehmen. In diesem kostenlosen E-Book erfahren Sie, wie Sie Ihre IT-Infrastruktur und KI-Projekte proaktiv vor Cyberangriffen und Datenverlust schützen. Gratis-Ratgeber: IT-Sicherheit im KI-Zeitalter stärken

Sicherheits-Upgrade mit zeitlich begrenzten Bearer-Token

Um Standard-OpenAI-Clients nutzen zu können, ohne AWS' strenge Sicherheitsstandards zu opfern, führt SageMaker AI ein neues Bearer-Token-Authentifizierungssystem ein. Das SageMaker-AI-Python-SDK enthält einen Token-Generator, der kurzlebige Authentifizierungs-Token erstellt – gültig bis zu 12 Stunden. Diese Token werden aus bestehenden AWS-Anmeldedaten abgeleitet, sodass Entwickler keine zusätzlichen permanenten API-Schlüssel verwalten müssen.

Die Implementierung nutzt spezifische IAM-Berechtigungen, darunter sagemaker:CallWithBearerToken und sagemaker:InvokeEndpoint. Administratoren können so granulare Zugriffskontrollen einrichten. Der Einsatz von Bearer-Token ist eine Abkehr von der traditionellen AWS-Anfragesignatur und zielt darauf ab, SageMaker mit Drittanbieter-Tools kompatibel zu machen, die einen standardmäßigen „Authorization: Bearer“-Header erwarten.

Breiterer Kontext der AWS-KI-Infrastruktur-Entwicklung

Die Einführung OpenAI-kompatibler APIs ist der jüngste Meilenstein in der mehrjährigen Transformation der SageMaker-Plattform. Im Dezember 2024 benannte AWS den Dienst in Amazon SageMaker AI um und startete die „nächste Generation“ der Plattform mit dem SageMaker Unified Studio. Diese Umgebung konsolidierte Datenanalyse, maschinelles Lernen und generative KI in einer einzigen kollaborativen Oberfläche.

Im August 2025 begann AWS mit der Bereitstellung von Open-Weight-Modellen wie gpt-oss-120b und gpt-oss-20b über Amazon Bedrock und SageMaker JumpStart. Diese Modelle bieten eine mit führenden proprietären Alternativen vergleichbare Leistung, erlauben aber tiefere Anpassungen.

Auch das Kostenmanagement stand im Fokus: Im Juni 2025 senkte AWS die Preise für GPU-beschleunigte Instanzen der Serien P4 und P5 um bis zu 45 Prozent. Diese Reduzierungen machen das Self-Hosting auf SageMaker für Anwendungen mit hohem Volumen wirtschaftlicher.

Ausblick auf hochskalierte Inferenz

Mit dem Trend zu Billionen-Parameter-Modellen wächst die Nachfrage nach leistungsfähiger Inferenz-Infrastruktur. AWS plant eine tiefere Integration zwischen SageMaker HyperPod und der neuesten Hardware wie den NVIDIA Blackwell-basierten P6e-GB200-UltraServern. Diese Systeme behandeln bis zu 72 GPUs als eine einzige Recheneinheit und minimieren so die Latenz für Spitzenmodelle.

Die native OpenAI-kompatible API stellt sicher: Während die zugrundeliegende Hardware leistungsfähiger wird, bleibt die Softwareschnittstelle zugänglich und standardisiert. Branchenanalysten sehen darin eine strategische Positionierung – SageMaker AI nicht nur als Werkzeug für Datenwissenschaftler, sondern als fundamentale Infrastruktur für eine neue Generation von Entwicklern, die API-first-Ansätze gewohnt sind. Die Möglichkeit, zwischen Modellanbietern zu wechseln oder von serverlosen Diensten auf dedizierte Kapatitäten umzusteigen, ohne die Anwendungslogik neu schreiben zu müssen, dürfte sich als entscheidender Wettbewerbsvorteil für AWS im expandierenden generativen KI-Markt der zweiten Jahreshälfte 2026 erweisen.

So schätzen die Börsenprofis Aktien ein!

<b>So schätzen die Börsenprofis Aktien ein!</b>
Seit 2005 liefert der Börsenbrief trading-notes verlässliche Anlage-Empfehlungen – dreimal pro Woche, direkt ins Postfach. 100% kostenlos. 100% Expertenwissen. Trage einfach deine E-Mail Adresse ein und verpasse ab heute keine Top-Chance mehr. Jetzt abonnieren.
Für. Immer. Kostenlos.
de | wissenschaft | 69388136 |