KI-Training mit Büchern ist erlaubt – wenn man sie kauft

Sie lesen den KI-Newsletter "Natürlich intelligent" vom 26. Juni 2025. Um den Newsletter jeden Donnerstag per Mail zu erhalten, melden Sie sich hier an.

Wenn Sie sich englischsprachige Videos anschauen, haben Sie in letzter Zeit vielleicht vernommen, dass jemand in ein Thema eintauchen will. Der englische Begriff dafür – "delve" – wird nämlich häufiger verwendet. Möglicherweise, weil er oft in ChatGPT-Antworten auftaucht. Das ist das Ergebnis einer Studie des Max-Planck-Instituts für Bildungsforschung. Worte wie "meticulous" (akribisch, sorgfältig), "realm" (Reich, Bereich) oder "intricate" (kompliziert, verworren) werden demnach verbreiteter. Und das nicht nur in abgelesenen ChatGPT-Antworten, sondern auch in freier Rede. Der KI-Slang geht offenbar in die menschliche Sprache über. Wer weiß, vielleicht geben wir bald Antworten auch immer schön strukturiert in Stichpunkten.

Das müssen Sie wissen: Anthropic darf mit Büchern trainieren – wenn sie gekauft sind

Die KI-Branche verblüfft mich immer wieder. Das Unternehmen Anthropic hat offenbar Millionen gebrauchte Bücher gekauft, wohlgemerkt physische Exemplare, um dann die Buchrücken abzutrennen und die Seiten einscannen zu lassen. Stapelweise Altpapier hatte ich bisher eher nicht vor Augen, wenn ich versucht habe, mir vorzustellen, wie Sprachmodelle trainiert werden.

Dieses Detail stammt aus der Urteilsbegründung zu einem Gerichtsverfahren in Kalifornien. Es ging darin um die Frage, ob KI-Unternehmen Bücher zum Training ihrer Sprachmodelle nutzen dürfen, ohne sich vorher die Zustimmung der Autoren einzuholen. Das Gericht hat nun geurteilt: Ja, Anthropic darf das.

Es ist ein wichtiges Urteil für die gesamte KI-Branche, schließlich steht und fällt ihr Erfolg damit, dass sie ihre Sprachmodelle mit urheberrechtlich geschützten Inhalten trainiert. Das hat überhaupt erst ermöglicht, dass ihre Chatbots die eloquenten Antworten generieren können, die ihre (zahlenden) Nutzer bei ihnen suchen. Der Richter folgte Anthropics Argumentation, dass das KI-Start-up die Bücher nicht kopieren würde, sondern mit dem Training etwas Neues erschaffen würde und bezog sich damit auf die sogenannte Fair-Use-Regel.

Ähnlich urteilte in dieser Woche ein anderes US-Gericht in einem Prozess gegen den Facebook-Konzern Meta. Auch hier hatten Autoren gegen die Verwendung ihrer Bücher als Trainingsdaten geklagt. Der Richter wies ihre Klage zwar ab, allerdings vor allem weil sie die falschen Argumente vorgebracht hätten. Er betonte: Sein Urteil solle nicht so verstanden werden, dass Metas KI-Training komplett legal wäre. In Großbritannien wiederum hatte die US-Bildagentur Getty Images gegen den KI-Bildgenerator Stable Diffusion geklagt, ein Tag nach Bekanntwerden des Anthropic-Urteils in dieser Woche aber seine Klage wieder fallen gelassen.

Definitiv illegal ist es, Bücher raubzukopieren. Bevor Anthropic im großen Stil Bücher gekauft hat, soll es laut dem Urteil sieben Millionen Bücher verwendet haben, ohne dafür zu bezahlen, was auf jeden Fall eine Urheberrechtsverletzung ist. Auch Meta wird vorgeworfen, mit Raubkopien trainiert zu haben. Es könnten Strafen in Milliardenhöhe auf die Konzerne zukommen, analysiert mein Kollege Eike Kühl. 

Darüber sollten Sie nachdenken: Macht ChatGPT uns dümmer?

Wer regelmäßig Chatbots nutzt, sei es um sich schnell einen Text entwerfen, einen Artikel übersetzen oder Programmierzeilen generieren zu lassen, kann irgendwann das Gefühl bekommen, dass sich eine klebrige Pollenschicht über die eigenen Hirnsynapsen legt und das Denken verlangsamt. Diese Sorge bestärkt eine kürzlich veröffentlichte Studie des MIT Media Lab. Sie zeigt, dass Teilnehmer, die ChatGPT für das Verfassen von Essays nutzten, geringere Gehirnaktivitäten aufwiesen als solche, die es nicht taten. Stattdessen begannen die ChatGPT-Nutzer nach einigen Monaten sogar, KI-generierte Inhalte nahezu komplett zu kopieren, die Prüflinge wurden also fauler und rutschten in eine Art Passivität ab. Und: Sie merkten sich kaum etwas von dem, was die KI in ihrem Auftrag geschrieben hatte.

Die untersuchte Teilnehmergruppe war mit etwa 50 Probanden relativ klein, zudem wurde die Studie bisher nicht unabhängig geprüft. Dennoch ist sie eine Warnung: In Deutschland dürften etliche Schülerinnen und Schüler, Studentinnen und Studenten heimlich ChatGPT nutzen, um ihre Hausaufgaben zu machen oder ihre Seminararbeiten zu verfassen. Die Studienautorin warnt eindrücklich vor den Folgen solcher Hilfsmittel für die Gehirnentwicklung junger Menschen. Die werden aber solch kostenlose Werkzeuge weiternutzen, wenn man an Prüfungsformaten festhält, die KI schnell für sie lösen kann.

Deshalb muss sich die Art, wie gelehrt und gelernt wird, verändern. Eine KI-Strategie im Bildungsbereich, das forderte in dieser Woche auch der Deutsche Philologenverband. Die Schülerinnen und Schüler sollen "selbst denken lernen und nicht lernen, denken zu lassen", sagte dessen Bundesvorsitzende Susanne Lin-Klitzling.

Das muss nicht bedeuten, komplett auf KI zu verzichten. In der MIT-Studie zeigte sich, dass die Gruppe, die ihre Aufsätze zuerst selbst geschrieben hatte, aber später im Prozess KI zu Hilfe nahm, um den Aufsatz umzuschreiben, auch bei diesem Arbeitsschritt starke Hirnaktivitäten hatte. Man darf daraus wohl schlussfolgern: Erst denken, dann prompten.  

Das können Sie ausprobieren: Die Video-KI von Midjourney

Midjourney hat seinen ersten KI-Videogenerator V1 vorgestellt. Wer Bilder, entweder reale oder künstliche, auf der Plattform hochlädt, kann sich auf deren Basis kurze Videosequenzen erstellen lassen. Beim Generieren eines Bildes kann man direkt angeben, dass daraus auch ein fünfsekündiger Clip entstehen soll. Wie der genau aussehen soll, kann man im Vorfeld grob in einem kurzen Text umreißen. 

Das funktioniert in einem ersten Test gut. Ein generiertes Papierschiffchen schwimmt malerisch in einem Rinnsal. Mammuts stapfen durch den Schnee, ohne dass sich ihre Beine verheddern. Zumindest auf den ersten Blick ist Midjourney konkurrenzfähig zu anderen aktuellen Videogeneratoren wie Veo 3 von Google (das allerdings auch Ton generieren kann und mehrere Einstellungen in einem Clip). 

Das gilt auch für den Preis: Midjourney kann man zwar nicht kostenlos ausprobieren, dafür bekommt man für 10 Euro pro Monat schon einige Videos generiert, das teuerste Paket kostet 60 Dollar. Google will für sein "AI Ultra"-Paket, zu dem auch Veo3 gehört, derzeit immerhin 150 Dollar im Monat, bald sollen es 250 werden.