Im Mai dieses Jahres wurde die Vernehmlassung zur Änderung des Urheberrechtsgesetzes eingeleitet. Im Rahmen der diesjährigen Urheberrechtstagung des Schweizer Forum für Kommunikationsrecht (SF-FS) wurden zwei Themen diskutiert, die aktuell den Fokus der laufenden Vernehmlassung bilden. Medienunternehmen sowie Journalistinnen und Journalisten sollen für die Nutzung ihrer Inhalte durch große Online-Dienste angemessen entlöhnt werden. Obwohl die Schweiz sich noch 2019 bei Revision des Urheberrechtsgesetzes gegen die Einführung eines Leistungsschutzrechts für Medienunternehmen entschieden hatte, um zunächst die Erfahrungen anderer Länder abzuwarten, plant man nun im Rahmen dieser aktuellen Urheberrechtsrevision die Einführung eines Leistungsschutzrechts für Presseverleger. Parallel dazu wird im Rahmen des Vernehmlassungsverfahren geprüft, ob die vorgeschlagene Regelung um einen Vergütungsanspruch für die Verwendung journalistischer Inhalte durch Anwendungen mittels künstlicher Intelligenz erweitert werden sollte. Angesichts der schnellen Fortschritte im Bereich künstlicher Intelligenz ergeben sich diese und weitere fundamentale Fragen zur zukünftigen Gestaltung des Urheberrechts.
En mai de cette année, la procédure de consultation concernant la modification de la loi sur le droit d’auteur a été lancée. Dans le cadre du colloque sur le droit d’auteur organisé cette année par le Forum Suisse pour le Droit de la Communication (SF-FS), deux thèmes, qui constituent actuellement le point central de la consultation en cours, ont été discutés. Les entreprises de médias ainsi que les journalistes doivent être rémunérés de manière appropriée pour l’utilisation de leurs prestations journalistiques par les grands services en ligne. Bien que la Suisse ait décidé, en 2019 encore, lors de la révision de la loi sur le droit d’auteur, de ne pas introduire un droit voisin pour les entreprises de médias afin d’attendre d’abord les expériences d’autres pays, elle prévoit maintenant, au cours de cette révision actuelle du droit d’auteur, d’introduire un droit voisin pour les entreprises de médias. Parallèlement, on examine si la réglementation proposée devrait être étendue à un droit à rémunération pour l’utilisation de prestations journalistiques par des applications au moyen de l’intelligence artificielle. Compte tenu des progrès rapides dans ce domaine, ces questions et d’autres questions fondamentales se posent quant à la conception future du droit d’auteur.
Viviane Ammann,
MLaw, LL. M., wissenschaftliche Assistentin am Lehrstuhl für Informations- und Kommunikationsrecht, Universität Zürich.
Sinai Jenal,
BLaw, wissenschaftlicher Hilfsassistent am Lehrstuhl für Informations- und Kommunikationsrecht, Universität Zürich.
Die Autorin und der Autor danken allen Referierenden und Teilnehmenden des Panels für die konstruktiven Rückmeldungen zum Text.
Einleitend verschaffte Prof. Dr. Alexander Peukert von der Goethe Universität Frankfurt als erster Referent einen Überblick über das Leistungsschutzrecht für Presseverleger und dessen Umsetzung in verschiedenen Ländern. Zu Beginn wurde aufgezeigt, dass die Werbeumsätze bei Zeitungen kontinuierlich abnähmen und bei Online-Diensten zunähmen. Deswegen hätten sich verschiedene Länder darum bemüht, einen Zahlungsstrom von Medienintermediären hin zu den Medienunternehmen zu schaffen. Dabei divergiere indes die Form, wie dieser Zahlungsstrom geschaffen werde. Einerseits sei ein eigentumsmässiger Ansatz – insbesondere in Deutschland – zu erkennen, während andererseits beispielsweise Australien oder Kanada einen systemisch-marktregulierenden Ansatz verfolgten, wobei nicht an Eigentums- oder Urheberrechte angeknüpft werde.
In einer Gegenüberstellung wurde durch Peukert verdeutlicht, inwiefern sich diese Regelungskonzepte unterschieden. So verfolge der eigentumsmässige Ansatz die Ziele der Schaffung eines Marktes für Presseerzeugnisse und des Investitionsschutzes, indem ein neues verwandtes Schutzrecht im Urheberrechtsgesetz selbst geschaffen werde. Dahingegen solle der systemisch-marktregulierende Ansatz in einer spezialgesetzlichen Regelung das bestehende Verhandlungsungleichgewicht austarieren und Qualitätsmedien för|dern. Da der eigentumsmässige Ansatz in Form eines Ausschliesslichkeitsrechts ausgestaltet sei, ermögliche er das Verbieten von Nutzungen, aber gleichzeitig auch das Einräumen einer Gratislizenz, was unter einem systemisch-marktregulierendem Ansatz nicht zulässig sei. Dort sei eine Verhandlungspflicht in guten Treuen vorgesehen, wobei als ultima ratio die zu zahlende Vergütung festgelegt werde. Dies betreffe auch kleinste Teile und Links. In Deutschland seien hingegen Schranken für kurze Auszüge oder Hyperlinks vorgesehen.
Beide Konzepte hätten verschiedene Vor- und Nachteile. Der eigentumsmässige Ansatz sei zwar flexibler als der systemisch-marktregulierende Ansatz und inhaltlich neutraler ausgestaltet, jedoch schaffe er hinsichtlich der Aufgreifschwellen diverse Rechtsunsicherheiten und könne durch die Erteilung von Gratislizenzen letztlich sogar wirkungslos bleiben. Der systemisch-marktregulierende Ansatz verfolge das richtige Ziel und schaffe eine ausnahmslose Vergütungspflicht, ohne dass die Nutzung verboten werden könne. Problematisch aber könne die Entscheidung sein, welche News-Produzenten anspruchsberechtigt seien und wie die Vergütung zu verteilen sei. Eine mittelbare Steuerung des Medienmarktes durch die Erhebung und Verteilung der Vergütung sei zu vermeiden. Ferner bestehe bei diesem Ansatz die Gefahr der Einstellung von News-Diensten. Diese Gefahr dürfe umso grösser sein, je kleiner der betreffende Online-Markt ist.
Letztlich schlug der Referent den Bogen zur Schweiz und versuchte, die hiesig geplante Vergütungspflicht in die vorgestellte Dogmatik einzuordnen. Auf der einen Seite sei die Regelung ins Urheberrecht eingegliedert und sehe die zwingende Realisierung der Ansprüche durch eine Verwertungsgesellschaft vor, auf der anderen Seite bestehe eine zwingende Vergütung für die Nutzung auch nur kleinster Teile einer journalistischen Publikation. Da die Regelung Elemente beider Ansätze aufweise, sei sie als Mischform beider Ansätze zu qualifizieren.
Zum Abschluss wies Peukert noch auf eine Unklarheit in Art. 60a Abs. 1 des Vorentwurfs hin. Problematisch sei namentlich, ob die Kriterien des Aufwandes bzw. des Ertrags zur Festlegung der Vergütung in einem alternativen oder einem kumulativen Verhältnis zueinanderständen.
Als Leiter des Rechtsdienstes Urheberrecht beim IGE war es dann an Dr. Emanuel Meyer, die Schweizer Vernehmlassungsvorlage zu erläutern. Die Regulierungsfolgenabschätzung habe gezeigt, dass sich Medienunternehmen und Online-Dienste in einem zweiseitigen Markt konkurrierten – einerseits beim Wettbewerb um Reichweite und andererseits beim Wettbewerb um Werbeeinnahmen. Es stimme zwar, dass beim Wettbewerb um Reichweite eine symbiotische Beziehung bestehe, von welcher beide Parteien profitierten, jedoch kompensiere dies die Verluste bei den Werbeeinnahmen der Medienunternehmen nicht genügend. Diese Situation könne zu einem Ausfall journalistischer Leistungen führen, was katastrophal wäre. Um den Medienunternehmen bei dieser Herausforderung unter die Arme zu greifen, habe der Bundesrat regulatorisch eingreifen wollen.
Der Vernehmlassungsvorschlag sehe eine Vergütung für die Nutzung von Snippets vor. Damit habe der Bundesrat eine pragmatischere Lösung verfolgen wollen als die EU. Insbesondere solle der Gefahr vorgebeugt werden, dass Medienunternehmen aus Angst, dass ihre Inhalte heruntergenommen würden, Gratislizenzen erteilten. Der Vorschlag ziele folglich auf eine Bezahlung ab. Überdies sollten explizit auch kleinere Medienunternehmen profitieren können, indem die Bestimmung sämtliche Medienunternehmen erfasse.
Anspruchsberechtigt seien «Medienunternehmen», beispielsweise Zeitungen oder Online-Medienunternehmen. Vorausgesetzt werde aber eine Erklärung, sich an anerkannte Standards der journalistischen Arbeit zu halten. Dadurch werde z. B. Wikinews von der Berechtigung ausgeschlossen. Weil dort alle Beiträge durch die Nutzerinnen und Nutzer erstellt würden und eine Verantwortung von Wikinews ausgeschlossen werde, liege keine vergütungsbegründende Leistung vor.
Der Anspruch stehe unter einem Gegenrechtsvorbehalt. Demnach sei eine Vergütung an ausländische Medienunternehmen nur zu zahlen, wenn schweizerische Verleger in deren Sitzstaat ebenfalls von einer vergleichbaren Vergütung profitierten. Die EU sehe ein solches Gegenrecht nicht vor, weswegen Presseverleger aus den EU-Staaten in der Schweiz nicht berechtigt sein dürften.
Es werde am Medienunternehmen angeknüpft und nicht am Urheber. Diese Gestaltung sei gewählt worden, weil die Medienunternehmen am betroffenen Wettbewerb teilnähmen und nicht die Urheber. Letztere hätten aber einen unübertragbaren und unverzichtbaren Beteiligungsanspruch gegenüber den Medienunternehmen. Dieser stehe auch nicht unter dem Gegenrechtsvorbehalt, wodurch auch Auslandskorrespondenten mitumfasst seien.
Vergütungspflichtig seien künftig die Anbieter von Online-Diensten mit News-Übersichten oder Suchmaschinen, welche die journalistischen Inhalte nutzten, indem sie Snippets zugänglich machten. Damit die Nutzung eine Vergütungspflicht begründe, müsse sie gewerbsmässig und gewinnorientiert sein, was beispielsweise bei Wikipedia nicht gegeben sei.
Um die Befürchtung zu mildern, dass die Regelung eine Markteintrittsschranke für Online-Dienste schaffe, werde der Kreis der Verpflichteten auf Unternehmen beschränkt, die als «grosse» Online-Dienste gälten. Unter diese Definition könnten Google, LinkedIn, TikTok, Twitter, Xing und YouTube gefasst werden. Zum Teil werde kritisiert, dass eine solche Schranke den falschen Anreiz schaffe, als Unternehmen nicht mehr wachsen zu wollen. Zur Beurteilung dieser Kritik stelle sich die Frage, ob die Vergütung oder der Wert des Wachstums über diese Schwelle hinaus überwiege.
3. Informationsfreiheit
Abweichend von der EU-Regelung sei in der Schweiz auch das Zugänglichmachen aller Snippets, und damit auch einzelner Wörter oder sehr kurzer Auszüge, vergütungspflichtig. Dadurch verhindere man, dass sich die Online-Dienste einer Vergütung entziehen könnten, indem bloss kürzeste Textabschnitte angezeigt würden. Gleichzeitig sänke damit nämlich deren Informationsgehalt, was in Anbetracht der Informationsfreiheit ein unerwünschter Nebeneffekt wäre. Das Verlinken bleibe weiterhin vergütungsfrei.
Art. 60a Abs. 1 des Vorentwurfs sehe zwei alternative Kriterien vor, um die Vergütung festzulegen. Demnach diene entweder der getätigte Aufwand oder der aus der Nutzung erzielte Ertrag als Massstab. Das Kriterium des getätigten Aufwands zwinge Online-Dienste, die Produktionskosten der Medienunternehmen mitzutragen, und sorge auch bei kleineren Medienunternehmen für Einnahmen, weil deren Kosten im Verhältnis grösser sind als diejenigen grösserer Medienunternehmen. Auch bei der Festsetzung nach dem getätigten Aufwand sei zu berücksichtigen, dass nicht alle Online-Dienste mit gleicher Intensität Snippets nutzen würden und dementsprechend auch diesbezüglich Differenzierungen vorzunehmen seien.
Bei der Verteilung gelte mit dem neuen Art. 49 Abs. 2bis, dass die Verteilung nach dem Aufwand der Medienunternehmen und des Beitrags journalistischer Publikationen zur Erfüllung des Informationsbedürfnisses erfolge. Beim Aufwand seien insbesondere die Löhne zu berücksichtigen, die an die Journalistinnen und Journalisten gezahlt würden.
Ob eine Zugänglichmachung durch einen Online-Dienst nun unter das Urheberrecht oder das Leistungsschutzrecht falle, sei simpel. Es werde an die gewöhnlichen Voraussetzungen angeknüpft. Qualifiziere sich der zugänglich gemachte Teil bereits als geistige Schöpfung mit individuellem Charakter, sei er urheberrechtlich geschützt, und wenn nicht, greife das Leistungsschutzrecht und es sei eine Vergütung zu bezahlen. Indem die Schranke der Berichterstattung im Sinne von Art. 28 URG mit einem neuen Abs. 2 ergänzt und eine Vergütungspflicht für Anbieter grosser Online-Dienste eingeführt werde, werde eine Schutzlücke durch diese grundsätzlich vergütungslose Schranke vermieden.
Während die Prognose der Regulierungsfolgenabschätzung mit Vergütungen zwischen CHF 2 und 46 Mio. rechne, erwarte der Verband Schweizer Medien basierend auf einer kürzlich durchgeführten Studie satte CHF 150 Mio. Abgerundet hat Meyer seinen Vortrag mit dem Hinweis darauf, dass unabhängig davon, welche Prognose eintreffe, die Probleme der Medienunternehmen nicht allein durch die Einführung eines Vergütungsanspruches bewältigt werden könnten.
Um sich mit den vorgetragenen Themen kritisch auseinanderzusetzen und verschiedene Blickwinkel einzubringen, fanden sich die beiden Referenten Alexander Peukert und Emanuel Meyer sowie Stefan Wabel, Geschäftsführer des Verbands Schweizer Medien, und Jeremy Mätzener, Head Legal Schweiz von Google, im Panel unter der Leitung von Florent Thouvenin zusammen.
Wabel nutzte sein Eröffnungsplädoyer zur Aufstellung einiger Gründe, weswegen ein Leistungsschutzrecht der Medien aus seiner Sicht wichtig sei: Erstens, Medien zögen Menschen in das Google-Ökosystem, gingen dabei aber leer aus. Zweitens, dabei handle es sich um ein Marktversagen, welches ausgeglichen werden müsse. Drittens, die Stärkung des Journalismus durch die Einführung eines Leistungsschutzrechts sei für die demokratische Willensbildung unerlässlich.
Dabei führte er insbesondere aus, dass eben genau keine Win-Win-Situation zwischen den Techplattformen und den Medien bestehe, sondern ein deutliches Missverhältnis, weil die in den Snippets angezeigte Information den meisten Internetnutzern als Informationsbasis genüge und daher nicht auf die Inhalte der Medienunternehmen geklickt werde.
Als Vertreter der Gegenseite entgegnete Mätzener gleich anschliessend seine Argumentationspunkte: Medienförderung und Urheberrecht sollten nicht miteinander vermischt werden, da es sich um verschiedene Themengebiete handle, bei Snippets sei kein Marktversagen festzustellen, denn deren Anzeigen führe zu keinem Schaden bei Verlegern, sondern im Gegenteil resultiere daraus ein vorteilhafter Traffic und letztlich habe jedes Medium Kontrolle darüber, ob und inwiefern Snippets angezeigt würden.
Mätzener betonte, dass Google News zu 100 % werbefrei sei und sich nur 3 % aller Suchanfragen tatsächlich auf Nachrichten bezögen. Zudem anerkenne er die Bedeutung der Medien für Gesellschaft und Demokratie, sagte indes, dass es sich beim geplanten Vorhaben um eine Mediensubvention handle, die vor allem zu Bürokratie und Opportunitätskosten führe, wenn man ins Ausland blicke.
Nachdem Wabel festhielt, dass sich staatliche Fördergelder und ein Leistungsschutzrecht nicht ausschlössen, folgte ein Denkanstoss vonseiten Peukert mit der Frage, ob die Regelung denn überhaupt nur deswegen im URG eingeführt wurde, um das Problem einer fehlenden Kompetenz in der Presseregulierung zu umgehen.
Abschliessend fragte Thouvenin bei Mätzener nach, ob die Gefahr bestehe, dass künftig in der Schweiz keine Snippets journalistischer Inhalte mehr auf Google angezeigt würden. Dieser deutete darauf hin, dass aufgrund des grossen Zeitraums bis zum Inkrafttreten der Revision diesbezüglich noch zu viel Ungewissheit bestehe.
Nach der Pause referierte Prof. Dr. Lena Jäger, Computerlinguistin, über die technischen Grundlagen generativer künstlicher Intelligenz (KI). Gleich zu Beginn ihres Vortrages nahm Jäger eine Weichenstellung vor: Ein neuronales Netz denke nicht, träume nicht, sondern es rechne.
Neuronale Netze seien nichts weiter als mathematische Funktionen. Eine einfache mathematische Funktion bekomme einen Input und generiere daraus einen Output. Neuronale Netze unterschieden sich von einfachen Funktionen dadurch, dass die Eingabedaten nicht aus einem Wert, sondern aus mehreren Werten bestünden. Dies könne beispielsweise ein Satz oder ein Bild sein. Zwischen dem Input und Output Layer befänden sich die sogenannten Hidden Layers. Davon könnten in einem neuronalen Netz beliebig viele vorkommen, bei einer hohen Anzahl werde dann von tiefen neuronalen Netzen gesprochen. Bei mehreren Hidden Layers handele es sich die Verknüpfung mehrerer Funktionen, die nacheinander angewendet würden.
Die einzelnen Schichten (Layers) im neuronalen Netz seien durch Kanten miteinander verbunden, diese repräsentieren die Skalare in einer Linearkombination und würden als Gewichte (trainable weights) bezeichnet. Auf das Ergebnis eines Layer werde (meist elementweise) eine Aktivierungsfunktion angewendet. Eine Aktivierungsfunktion zeichne sich durch die Eigenschaft der Nicht-Linearität aus. Ohne die Aktivierungsfunktion würde es zwischen den Gewichten und Eingabewerten zu hintereinander ausgeführten linearen Operationen kommen und im Ergebnis einfach eine einzige lineare Operation ausgeführt werden. Die Anwendung der nicht-linearen Aktivierungsfunktion führe dagegen zur Nicht-Linearität des neuronalen Netzes. Würden viele hintereinander ausgeführt (also ein tiefes neuronales Netz gebaut), könne die Funktion sehr komplex werden und komplizierte Zusammenhänge in den Trainingsdaten abbilden.
Die Architektur eines neuronalen Netzes entspreche einer Funktionenfamilie. Eine Funktionsfamilie sei eine Menge von Funktionen, die sich lediglich durch verschiedene Parameterwerte unterschieden. Diese Parameter würden basierend auf den Trainingsdaten angepasst. Durch das fortlaufende Trainieren solle dasjenige Mitglied der Funktionenfamilie gefunden werden, welches für die Trainingsdaten möglichst genaue Vorhersagen mache. Eine entscheidende Rolle für das Trainieren des neuronalen Netzes spielten die trainierbaren Parameter (auch Gewichte genannt) in der Funktion. Die trainierbaren Gewichte seien konkrete Zahlen, die anfänglich per Zufallsgenerator gewählt würden. Während des Trainings würden sie schrittweise angepasst, sodass sie gute Vorhersagen für die Trainingsdaten machten. Das Training funktioniere so, dass man ein Trainingsbeispiel in das neuronale Netz eingebe und die Vorhersage berechne, diese sei am Anfang des Trainings natürlich meist noch sehr falsch. Die Parameter würden iterativ angepasst, bis sie die Trainingsdaten bestmöglich abbildeten, also bis aus den Eingabedaten die gewünschten Zieldaten herauskämen.
Dabei sei die generative KI von einer Datenbank zu unterscheiden, da man nicht gezielt eine bestimmte Ausgabe abrufen kann. Beispielsweise seien generative Sprachmodelle nicht auf Faktenwissen trainiert, sondern darauf, schrittweise das wahrscheinlichste folgende Wort vorherzusagen (next-word-prediction). Es stelle sich die Frage, was mache generative KI (tiefe neuronale Netze) so leistungsfähig? Als Antwort nannte Jäger die riesige Trainingsdatenmenge und die riesige Anzahl von trainierbaren Parametern. Beispielsweise habe GPT-3 175 Mrd. trainierbare Parameter.
Als Anwendungsbeispiele erläuterte die Referentin generative Sprachmodelle und Bildergenerierungsmodelle. Generative Sprachmodelle könnten beispielsweise Zusammenfassungen von Texten generieren, Fragen beantworten, Übersetzungen anfertigen, beim Schreiben assistieren oder Texte klassifizieren. Generative Sprachmodelle seien tiefe neuronale Netze mit einer sehr hohen Anzahl trainierbarer Parameter zur Verarbeitung von sequenziellen Eingabedaten (z. B. ein Transformer oder rekurrentes neuronales Netz). Als Eingabe könnten ein Wort oder ein Satz erfolgen und das generative Sprachmodell produziere als Ausgabe eine schrittweise Vorhersage der am wahrscheinlichsten folgenden Wörter. Das Modell lerne die Sprache über die statistischen Muster in den Trainingsdaten.
Bei grossen generativen Modellen stelle sich die Frage, wie und warum sich Diffusionsmodelle Trainingsdaten merkten und ob ihre Ergebnisse wirklich neu generiert oder stattdessen das Ergebnis des «Remixens» ihrer Trainingsdaten seien.
Grosse Sprachmodelle speicherten zumindest manche der Trainingsinstanzen verbatim und «erzeugten» diese bei entsprechender Anfrage. Es sei somit möglich, konkrete Trainingsinstanzen aus einem vortrainierten Modell zu rekonstruieren bzw. zu extrahieren. Bei einem entsprechenden Prompt könnten somit einzelne Trainingsbeispiele wortwörtlich wieder extrahiert werden. Als Beispiel nannte Jäger einen Fall, bei dem ein Sprachmodell unter anderem mit Texten, die frei zugänglich im Internet gewesen seien, trainiert wurde. Anschliessend hätten durch entsprechende Anfrage Name, Adresse und Telefonnummer einer bestimmten Person aus den Trainingsdaten extrahiert werden können (dieses und weitere Beispiele: Nicholas Carlini/Jamie Hayes/Milad Nasr/Matthew Jagielski/Vikash Sehwag/Florian Tramèr/Borja Balle/Daphne Ippolito/Eric Wallace, Extracting training data from diffusion models, arXiv preprint arXiv:2301.13188, 2023).
Bildergenerierungsmodelle könnten Bilder basierend auf einer Texteingabe generieren. Auch aus einem vortrainierten Bildergenerierungsmodell (einem sogenannten Diffusionsmodell) könnten bei entsprechender Anfrage konkrete Trainingsinstanzen extrahiert werden. Während des Trainings würden die Bilder verrauscht. Wie bei einem alten analogen Film entstünde Körnung im Bild. Indem dem Bild nach und nach mehr Körnung hinzugefügt werde, werde dessen Inhalt so verfälscht, bis das Bild nur noch aus Bildrauschen bestehe. Anschliessend werde das Modell trainiert, aus dem Rauschen das ursprüngliche Bild wiederherzustellen. Bildergenerierungsmodelle seien also vereinfacht gesagt, Bildentrauschungsmodelle (Denoising Diffusion Probabilistic Models), die selbst aus reinem Rauschen ein semantisch sinnvolles Bild generieren könnten. Um den Entrauschungsprozess zu vereinfachen, werde typischer weise nicht das gesamte Rauschen auf einmal entfernt, sondern das Modell werde iterativ angewandt, um das Rauschen langsam zu entfernen. Der Verrauschungsprozess werde dabei umgekehrt, bis ein neues, klares Bild entstehe.
Zusammenfassend lasse sich feststellen, dass generative KI mathematische Funktionen seien, deren Parameter anhand von riesigen Mengen von Trainingsdaten derart eingestellt würden, dass die KI Daten (Sprache, Bilder, Musik etc.) erzeugen könne, die die statistischen Muster, die in den Trainingsdaten vorhanden seien, reproduziere. Im Prinzip entstehe hierdurch etwas Neues, das in seiner Art den Trainingsdaten gleiche. Allerdings speicherten grosse Modelle zumindest Teile der Trainingsdaten und gäben diese auf eine passende Anfrage als von ihnen erzeugten Daten aus.
Die Vortragsrunde wurde von Dr. Sandra Marmy-Brändli, Rechtsanwältin, geschlossen. Sie beurteilte die von Jäger erläuterten technischen Vorgänge der generativen künstlichen Intelligenz (KI) aus urheberrechtlicher Sicht. Dabei unterschied sie zwischen dem Training der KI (Input-Layer) und den KI-Erzeugnissen (Output-Layer). Den Fokus setzte sie bei der Frage, ob das Trainieren der KI mit grossen Datensets in die Ausschliesslichkeitsrechte der Urheberinnen und Urheber eingreift.
Zum Einstieg in die Problematik erwähnte Marmy-Brändli einen Fall aus den USA, bei dem Getty Images gegen Stability AI klagte, da Stability AI ihr KI-Modell mit 12 Millionen Bilder aus der Getty Images Datenbank trainierte, ohne vorgängig deren Zustimmung einzuholen. Getty Images machte eine Urheberrechtsverletzung aufgrund der Kopien der Bilder ohne Zustimmung oder Entschädigung geltend.
Zweifelsohne stelle sich auch im schweizerischen Urheberrecht die Frage, wie das Trainieren von KI zu beurteilen sei. Das Training von sogenannten «Machine Learning Models» setze sehr grosse Datensets voraus. Beispielsweise bestehe das Datenset Common Crawl, welches für das Training der Applikation GPT-3 von Open AI genutzt wurde, aus Petabytes (10005) an Daten. In diesen Datensets könnten auch urheberrechtlich geschützte Werke enthalten sein. Beim Erstellen des Datensets und im Rahmen des Trainierens des Machine Learning Model komme es zu Kopien der enthaltenen Werke. Fraglich sei, ob dadurch in das Vervielfältigungsrecht nach Art. 10 Abs. 2 lit. a URG eingegriffen werde. Die Referentin erwog bei der Beurteilung als Erstes den Sinn und Zweck des Vervielfältigungsrechts. Telos des Vervielfältigungsrechts sei ein Indikator für die Werkvermittlung, um den Werkgenuss durch Dritte zu ermöglichen. Bei der Verwendung urheberrechtlich geschützter Werke, um KI zu trainieren, werde allerdings kein Werkgenuss durch weitere Personen ermöglicht. KI durchsuche die Werke, um daraus zu lernen und es könnten somit Parallelen zum menschlichen Werkkonsum gezogen werden. Andererseits sollten die Urheberinnen und Urheber durch die Verwendungsrechte eine angemessene Vergütung erzielen können. Tatsächlich geschehe dies auch bereits durch die Vergabe von Lizenzen zur Verwendung von Werken zum Zweck des KI-Trainings. Zudem sei zu berücksichtigen, dass das Vervielfältigungsrecht bereits sehr weit ausgedehnt worden sei, weshalb eine Schranke für vorübergehende Kopien (Art. 24d URG) eingeführt wurde. Dies spreche sehr stark für eine Qualifikation als relevante Vervielfältigungen. Die Referentin gelangte daher zum Schluss, dass sowohl die im Rahmen der Erstellung des Datensets anfallenden Kopien wie auch allfällige temporäre Kopien während des KI-Trainings einen Eingriff in das Vervielfältigungsrecht darstellten.
Nachfolgend prüfte Marmy-Brändli, ob die Schranken für vorübergehende Vervielfältigungen nach Art. 24a URG oder zum Zweck der wissenschaftlichen Forschung gemäss Art. 24d URG auf die Vervielfältigungen im Trainingsprozess der KI anwendbar sind. Auf die Prüfung der Schranke des Eigengebrauchs (Art. 19 URG) verzichtete sie bewusst, da diese bereits im Vorhinein relativ schnell ausgeschlossen werden könne.
Die Schranke für vorübergehende Vervielfältigungen verlange, dass kumulativ die Vervielfältigung flüchtig oder begleitend seien, einen integralen und wesentlichen Teil eines technischen Verfahrens darstellten, ausschliesslich der Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder einer rechtmässigen Nutzung dienten und keine eigenständige wirtschaftliche Bedeutung hätten. Angewandt auf das KI-Training subsumierte die Referentin, dass in Bezug auf das Erstellen der Datensets die erste Voraussetzung nicht gegeben sei, da dabei eine dauerhafte Kopie hergestellt werde. Beim Trainieren der KI hingegen könnten die ersten drei Voraussetzungen unter Umständen gegeben sein, allerdings sei fraglich, ob insbesondere beim Einsatz von sog. Webcrawler, eine rechtmässige Nutzung vorliege. Schwierigkeiten ergäben sich jedoch bei der letzten Voraussetzung, da KI-Anwendungen eine grosse wirtschaftliche Bedeutung zukäme, dies zeige sich daran, dass OpenAI mehr als CHF 100 Mio. in die Entwicklung von GPT-4 investiere und zudem bestehe bereits einen Markt für KI-Trainings-Lizenzen. Auch unter Anbetracht des Drei-Stufen-Tests sei eine solche Auslegung der Schranke nicht vertretbar. Schliesslich spreche auch das Argument, dass die Schranke bereits bei Text- und Data-Mining nicht anwendbar sei, eher dagegen, dass sie bei KI-Sachverhalten einschlägig sei. Ebenfalls verneine auch die Lehre zu Art. 5 (1) Info-RL (EU-RL 2001/29/EG), welchem die Schweizer Schranke nachempfunden sei, die Anwendbarkeit der Schranke. Marmy-Brändli gelangte somit zum Schluss, dass die Schranke für vorübergehende Vervielfältigungen weder auf die Datensets noch auf das Trainieren von KI anwendbar sei.
Anschliessend prüfte sie die Anwendbarkeit der Schranke zum Zweck der wissenschaftlichen Forschung nach Art. 24d URG. Die Vervielfältigungen seien hiernach zulässig, wenn sie kumulativ zum Zweck der wissenschaftlichen Forschung dienten, durch Anwendung eines technischen Verfahrens bedingt seien und ein rechtmässiger Zugang zu ihnen bestehe. Zwar erfasse die Schranke auch die kommerzielle Forschung, allerdings müsse die Forschung den Hauptzweck der Vervielfältigung darstellen. Der Meinung der Referentin nach verfolgten jedoch die meisten KI-Modelle nicht hauptsächlich die wissenschaftliche Forschung. Des Weiteren erscheint unter Umständen unklar, ob ein rechtmässiger Zugang zu den Werken bestehe. Beim sogenannten Crawling und Scraping von im Internet frei zugänglichen Werken stellten sich verschiedene Fragen. Was gelte bei einem vertraglichen Verbot (z. B. in den AGB der Website) oder bei der Umgehung von technischen Schutzmassnahmen? Zur Beantwortung dieser Fragen müsse man sich mit der Frage nach dem zwingenden Charakter der Schranke und dem sogenannten «right to hack» (Art. 39a Abs. 4 URG) auseinandersetzen. Eine weitere erwähnenswerte Limitierung sei, dass die Schranke nicht auf Computerprogramme angewandt werde (Art. 24d Abs. 3 URG).
Als abschliessendes Fazit zur Beurteilung, ob eine Urheberrechtsverletzung vorliege, konstatierte Marmy-Brändli, dass es beim KI-Training prima facie zu einer Urheberrechtsverletzung komme. Das Vervielfältigungsrecht habe einen sehr umfassenden Anwendungsbereich. Eine teleologische Reduktion des Vervielfältigungsrechts in Anbetracht von Art. 24a URG und seines engen Anwendungsbereiches sei äusserst limitiert. Als anwendbare Schranke komme zwar die Schranke zum Zweck der wissenschaftlichen Forschung Art. 24d URG in Frage, allerdings sei der Anwendungsbereich aufgrund Zweckbegrenzung sehr beschränkt. Daher könne die Frage aufgeworfen werden, ob eine neue Schranke eingeführt werden solle. Es sei ein bekanntes Problem, dass die Schrankenkataloge der Droit d’auteur Staaten bei neuen Technologien schnell veraltet seien, im Gegensatz zu Generalklauseln wie insbesondere Fair Use in Copyright Staaten, welche mehr Flexibilität bieten würden. Bei der Erwägung einer neuen Schranke sei zu untersuchen, ob ein Marktversagen und ein Transaktionskostenproblem vorlägen. Unter Umständen könnten auch erweiterte Kollektivlizenzen (Art. 43a URG) Abhilfe schaffen; dies werde teilweise im deutschen Recht vertreten.
Im zweiten Teil ihres Referates sprach Marmy-Brändli die Frage nach dem urheberrechtlichen Schutz von KI-Erzeugnissen und mögliche Urheberrechtsverletzungen durch KI-Erzeugnisse an. Da es bei KI-Erzeugnissen keine menschliche Schöpfung gebe, sei offensichtlich, dass diese keinen urheberrechtlichen Schutz geniessen würden. Die Referentin verwies auf die Begründung des US Copyright Office in seiner Publikation Bericht «Works Containing Material Generated by Artificial Intelligence» (abrufbar unter: ‹www.govinfo.gov/content/pkg/FR-2023-03-16/pdf/2023-05321.pdf›, 21. Juli 2023) hin. Demnach sei danach zu unterscheiden, wer die Kontrolle über individuelle Elemente des Werkes habe, und die kreativen Entscheide der Autorin oder des Autors müssten sich im Werk widerspiegeln. Dabei sei zu beachten, dass die «Prompts» (Textanweisungen an KI durch Benutzer) den Output zwar beeinflussten, sie bestimmten das Ergebnis jedoch nicht. Urheberrechtsschutz sei dann denkbar, wenn die Nutzerin oder der Nutzer nach Erstellung eines KI-Erzeugnisses dieses so weiterbearbeitet, dass daraus ein urheberrechtliches Werk entstehe oder die von KI generierten Inhalte so arrangiere, dass ihr Arrangement individuell sei. Zur Frage, ob durch KI-Erzeugnisse eine Urheberrechtsverletzung vorliegen kann, stellte die Referentin fest, dass sofern die vorbestehenden Werke im KI-Erzeugnis erkennbar blieben und die individuellen Züge nicht verblassten, eine Urheberrechtsverletzung vorliege. Dies sei beispielsweise der Fall, wenn bei ChatGPT der Prompt eingegeben werde: «Gib mir einen spezifischen Songtext wieder» oder «übersetze mir ein spezifisches Gedicht». Vielfach aber werde wohl kein spezifisches Werk mehr erkennbar sein – ein bestimmter Stil sei urheberrechtlich grundsätzlich nicht geschützt – in solchen Fällen könne unter Umständen eine Persönlichkeitsrechtsverletzung oder unlauteres Verhalten vorliegen.
In der von Florent Thouvenin geleiteten Diskussion mit Lena Jäger, Sandra Marmy-Brändli, und Anaïc Cordoba, IGE, wurde unter Einbezug des Publikums über Problematiken und mögliche Lösungsansätze im Spannungsfeld von KI und Urheberrecht debattiert.
Cordoba betonte, dass KI ein globales Phänomen sei, das viele Branchen beeinflusse. Der Bereich sei extrem reaktiv und die Mängel einer generativen KI würden in Konkurrenzlösungen schnell behoben. Durch KI entstünde eine neue Gruppe von Kreativen, die das gegenwärtige System herausfordern. Es seien bereits einige Vorschläge zur Regulierung von KI erarbeitet worden, das Ziel sei jedoch, angesichts der rasanten Entwicklung eine längerfristig nachhaltige Lösung zu finden. Dazu müsse der Gesetzgeber Daten über den durch generative KI verursachten Wandel sammeln. Mit Verweis auf das Positionspapier zum regulatorischen Umgang mit künstlicher Intelligenz von Economiesuisse, betonte Cordoba, es sei zu früh, bereits jetzt konkrete regulatorische Eingriffe vorzunehmen. Eine übereilte Regulierung von KI könne negative Auswirkungen auf Innovation, Wettbewerb und die globale Zusammenarbeit haben.
Marmy-Brändli wies erneut auf die Möglichkeit hin, die Nutzung der urheberrechtlich geschützten Werke über erweiterte Kollektivlizenzen zu ermöglichen. Dafür sprächen die hohen Transaktionskosten, die anfielen, um die Rechteinhaber der grossen Anzahl von Werken ausfindig zu machen. Schwierigkeiten stellten sich allerdings bei der Auszahlung der Vergütung an eine so grosse Zahl potenzieller Rechteinhaber.
Die von Thouvenin gestellte Frage, ob das Entwickeln von KI nicht als Forschung qualifiziert und damit von der Wissenschaftsschranke erfasst und freigestellt werden könnte, blieb offen im Raum stehen. Einigkeit herrschte unter den Teilnehmenden darüber, dass der Gesetzgeber nicht voreilig eingreifen sollte und abgewartet und beobachtet werden müsse, wie die Fragen rund um KI und Urheberrecht in anderen Ländern geregelt werden. Als erster Schritt sollten die technischen Grundlagen aufgearbeitet werden, um genauer zu verstehen, welche Vorgänge urheberrechtlich relevant und im Rahmen des geltenden oder angepassten Rechts durch passende Lösungen zu erfassen sind.