KI-Training, Technologiekonzerne

KI-Training: Technologiekonzerne zerstören Millionen seltener Bücher

26.06.2026 - 17:37:49 | boerse-global.de

Technologieunternehmen kaufen und zerstören seltene Fachbücher für KI-Training. Branche sucht nach legalen Datenquellen.

KI-Konzerne zerstören seltene Bücher fürs Training
KI-Training - Antike Bibliothek mit vielen Büchern, Lichtstrahl und teilweise zerlegtem Buch auf Schreibtisch mit digitaler Überlagerung. 26.06.2026 - Bild: über boerse-global.de

Europäische Antiquariate schlagen Alarm: Immer häufiger ordern Technologiekonzerne große Mengen seltener und obskurer Fachbücher – nur um sie für das Training ihrer KI-Modelle zu zerstören.

Buchhändler aus den Niederlanden, Deutschland, Spanien und der Schweiz berichten von einer regelrechten Welle an Anfragen aus der KI-Branche. Die Firmen suchen gezielt nach physischen Bänden, die noch nicht digitalisiert wurden. In einem konkreten Fall erhielt der niederländische Buchhändler Pieter de Vries eine Anfrage des in Singapur ansässigen Unternehmens 2077AI – gewünscht wurden 3.000 bestimmte englischsprachige Titel.

Bücher als Rohstoff für die KI

Die Käufer interessieren sich vor allem für Nischenliteratur, die hochwertige sprachliche und fachliche Daten für große Sprachmodelle liefert. Die Antiquare zeigen sich besorgt: Die Praxis entziehe dem Markt seltene physische Exemplare und entziehe sie der kulturellen Nutzung.

Hinter dem Phänomen steckt das sogenannte destruktive Scannen. Dabei werden Bücher gekauft, um sie auseinanderzunehmen und die Seiten durch Hochgeschwindigkeitsscanner zu jagen. Der Rücken wird entfernt, die Einzelblätter werden digitalisiert – der Rest landet im Recycling.

Anzeige

Während die Industrie wertvolle Wissensbestände digitalisiert, fragen sich viele Nutzer, wie sie die neue Technologie eigentlich rechtssicher und effizient im Berufsalltag einsetzen können. Dieser kostenlose Ratgeber bietet einen kompakten Überblick über die wichtigsten Anforderungen und Fristen der aktuellen EU-Regelungen. EU AI Act in 5 Schritten verstehen

Project Panama und die Rechtslage

Branchenkreisen zufolge hat etwa das Unternehmen Anthropic mit seinem Project Panama seit Anfang 2024 systematisch Millionen gedruckter Werke aufgekauft. Als Lieferanten dienten unter anderem die Großhändler World of Books und Better World Books.

Ein US-Gericht hatte die Zerstörung eigenen Firmeneigentums zu Trainingszwecken als Fair Use eingestuft. Dennoch entbrennt eine ethische Debatte: Darf ein privater Konzern kulturelles Erbe vernichten, um seine KI zu verbessern?

Milliarden-Vergleich und neue Klagen

Der Druck auf die KI-Branche wächst. Im September 2025 einigte sich Anthropic in einem Urheberrechtsprozess auf einen Vergleich über rund 1,5 Milliarden Euro – umgerechnet etwa 3.000 Euro pro Buch für knapp 500.000 Werke. Die Firma musste die Originaldateien des geschützten Materials löschen, erhielt aber keine Lizenz für die künftige Nutzung.

Erst diese Woche eskalierte der Rechtsstreit weiter: Am 24. Juni reichte ein Zusammenschluss von fast 400 Zeitungsverlegern Klage gegen Microsoft und OpenAI ein – Vorwurf: systematisches Auslesen urheberrechtlich geschützter Artikel. Einen Tag später legte die New York Times in ihrem eigenen Verfahren nach und präsentierte neue Belege für fast wortgetreue Übernahmen ihrer Inhalte durch KI-Modelle.

Anzeige

Die rechtliche Unsicherheit rund um KI-Systeme betrifft längst nicht mehr nur Großkonzerne, sondern jedes Unternehmen, das moderne Software einsetzt. Erfahren Sie in diesem kostenlosen Umsetzungsleitfaden, welche Risikoklassen und Dokumentationspflichten Sie jetzt beachten müssen, um rechtlich auf der sicheren Seite zu stehen. Kostenlosen Leitfaden zur KI-Verordnung herunterladen

Neue Wege aus der Datenkrise

Die Branche sucht händeringend nach Lösungen. Am 25. Juni benannte sich die Organisation Story in The DATA Foundation um und startete das DATA Network. Unter der Führung von CEO Andrea Muttoni will die Stiftung eine öffentliche Prüfschicht für Datenherkunft und Lizenzierung einführen.

Der Schritt zeigt: Die KI-Industrie steckt in einem Dilemma. Das hochwertige digitale Textmaterial wird knapp. Also greifen die Konzerne zu den verbliebenen physischen Bibliotheken – und zerstören dabei, was sie eigentlich bewahren sollten.

de | wissenschaft | 69634614 |