Kneschke contre LAION – Décision historique sur les exceptions TDM pour les données de formation de l’IA – Partie 1

, Kneschke contre LAION – Décision historique sur les exceptions TDM pour les données de formation de l’IA – Partie 1
, Kneschke contre LAION – Décision historique sur les exceptions TDM pour les données de formation de l’IA – Partie 1
Image de MH de Pixabay

Le 27 septembre 2024, le tribunal régional allemand de Hambourg («Tribunal« ) a rendu la première décision sur les reproductions de contenus protégés par le droit d’auteur à partir d’Internet effectuées lors de la création d’un ensemble de données de formation à l’IA – et sur la question de savoir si les exceptions au droit d’auteur pour l’exploration de textes et de données (« GDT« ) accordent une autorisation légale pour une telle utilisation (Tribunal régional de Hambourg, 310 O 227/23). Les faits de l’affaire et les implications pratiques de la décision ont été abordés dans le billet de blog de Jonathan Pukas et Jan Bernd Nordemann. Sur cette base, cet article approfondit les principales conclusions de la Cour en deux parties. Cette première partie identifie l’étape opérationnelle d’un modèle d’IA générative sur lequel la Cour s’est prononcée et revient sur la décision relative aux exceptions pour la recherche scientifique TDM et les reproductions temporaires. La deuxième partie examine la longue remarque incidente de la Cour sur l’exception commerciale TDM.

La Cour a rejeté la demande d’injonction du photographe Robert Kneschke contre l’organisation allemande à but non lucratif LAION pour la reproduction non autorisée de la photographie de Kneschke via un téléchargement à partir du site Web d’une agence de photos dans le cadre de la création d’un ensemble de données open source à des fins de formation à l’IA. La décision fournit un premier aperçu judiciaire précieux, bien au-delà du cas spécifique, sur les exceptions TDM à des fins de recherche commerciale et scientifique en vertu de la directive 2019 sur le droit d’auteur dans le marché unique numérique (DSM) (UE 2019/790).) et, si elle est confirmée, elle pourrait influencer l’interprétation de la loi bien au-delà des frontières allemandes. La décision est également pertinente au-delà de la « simple » loi sur le droit d’auteur, car elle met en lumière l’incertitude parmi les fournisseurs d’IA à usage général («GPAI« ) modèles sur la manière de remplir leurs obligations en vertu de la loi de l’UE sur l’IA (règlement (UE) 2024/1689).) pour mettre en œuvre une politique visant à se conformer aux désinscriptions TDM pour leurs données de formation.

Étapes opérationnelles de l’IA générative (non) couvertes par l’arrêt de la Cour

Pour l’évaluation juridique de l’IA générative, trois niveaux opérationnels peuvent être grossièrement distingués : le niveau d’entrée, la « boîte noire » (machine/deep learning) et le niveau de sortie. LAION crée et fournit des ensembles de données open source qui sont utilisés gratuitement par des tiers comme données de formation pour des modèles d’IA génératifs, par exemple par Stability AI for Stable Diffusion. L’ensemble de données 5B de LAION comprend des descriptions de près de 6 milliards d’images et des liens vers les emplacements des images accessibles au public sur Internet. Les ensembles de données ne contiennent pas les images elles-mêmes (ni leurs reproductions), mais afin de garantir, grâce à un contrôle logiciel, que les descriptions des images correspondent aux images liées, LAION a dû télécharger les images. Et c’est uniquement le téléchargement de la photo de Kneschke dans ce but qui a fait l’objet de la procédure judiciaire. En conséquence, la Cour n’a pas abordé les implications en matière de droit d’auteur de l’étape « boîte noire » d’un réseau neuronal ou du niveau de sortie.

La décision ne concerne que le niveau d’entrée, et seulement dans une mesure limitée. Un processus de formation se compose de plusieurs étapes individuelles et peut différer d’un modèle à l’autre, avec des implications individuelles en matière de droits d’auteur pour chaque étape et chaque processus. La décision de la Cour concerne une étape préparatoire à la formation proprement dite de l’IA et seulement une étape très spécifique, le téléchargement de matériel lors de la constitution d’un ensemble de données de formation. La décision ne concerne donc pas ce que nous considérons comme la formation réelle d’un modèle d’IA, c’est-à-dire l’analyse du matériau par le réseau neuronal pour rechercher des modèles, des relations, des corrélations et des probabilités.

Reproduction autorisée en vertu de l’exception TDM pour la recherche scientifique

La Cour a jugé que la reproduction de LAION en téléchargeant la photo était légalement autorisée en vertu de l’exception TDM pour la recherche scientifique (article 60d de la loi allemande sur le droit d’auteur).« Droit d’auteur« ). À partir de 2021, une telle exception devra être prévue dans tous les États membres de l’UE par la mise en œuvre de l’art. 3 Directive DSM, qui permet de «reproductions et extractions réalisées par des organismes de recherche et des institutions du patrimoine culturel afin de procéder, à des fins de recherche scientifique, à l’exploration de textes et de données d’œuvres ou d’autres objets auxquels ils ont licitement accès.». La Cour a fondé sa décision sur les conclusions générales suivantes :

  • Étapes préparatoires dans le cadre de la « recherche scientifique »: La Cour définit la recherche scientifique comme la « recherche méthodique et systémique de nouvelles connaissances », incluant explicitement non seulement les étapes de travail directement liées à l’acquisition de connaissances, mais aussi aux étapes préparatoires, à condition qu’elles visent l’acquisition (ultérieure) de connaissances. Ainsi, la Cour confirme que la création d’un ensemble de données peut constituer une recherche scientifique ; elle n’est peut-être pas encore associée à l’acquisition de connaissances, mais elle constitue une étape de travail fondamentale dans le but que l’ensemble des données soit utilisé à cette fin à un stade ultérieur.
  • L’utilisation par des tiers de l’ensemble de données est suffisante: L’arrêt précise que pour que la création de l’ensemble de données soit considérée comme une recherche scientifique par LAION, il ne doit pas être utilisé par LAION lui-même pour la formation en IA. Il suffit que l’ensemble des données soit publié gratuitement, le mettant (également) à la disposition des chercheurs en réseaux de neurones artificiels. Même l’utilisation par des entités commerciales pour la formation en IA est acceptable, dans la mesure où leurs recherches commerciales restent une quête de connaissances pertinente.
  • La réussite de la recherche n’est pas requise: La Cour souligne que les recherches ultérieures effectives succès n’est pas nécessaire pour que l’étape de travail soit qualifiée de recherche scientifique.
  • Caractère non commercial de la recherche: Le Tribunal a déclaré que le seul facteur déterminant est que l’activité est non commerciale, ce qui rend l’organisation et le financement de LAION sans pertinence à cet égard. C’est le cas parce que LAION met gratuitement à la disposition du public l’ensemble des données. Il n’est pas apparu à la Cour que la création de l’ensemble de données avait (également) servi au développement des propres offres commerciales de LAION. L’utilisation des ensembles de données par des entités commerciales pour entraîner leurs modèles d’IA commercialisés n’est pas pertinente pour l’évaluation de la nature non commerciale de l’activité de recherche, c’est-à-dire la création de l’ensemble de données par LAION. Il n’est pas non plus pertinent que des membres individuels de LAION exercent des activités rémunérées auprès de telles sociétés, car cela n’attribue pas les activités de ces sociétés à LAION.
  • Aucune coopération pertinente avec des entreprises privées: L’exception TDM pour la recherche scientifique ne s’applique pas lorsque l’organisme chercheur coopère avec une entreprise privée qui exerce un certain degré d’influence sur l’organisme et a un accès préférentiel aux résultats de la recherche. Le plaignant avait soutenu sans succès que tel était le cas, en soulignant par exemple qu’un membre cofondateur de LAION travaille désormais chez Stability AI. Cependant, la Cour n’a pas considéré cela comme une preuve de l’influence décisive de Stability AI sur les recherches de LAION. La Cour a également jugé que l’argument du plaignant concernant le prétendu financement des données LAION collectées par une société privée contre un accès anticipé était sans fondement. LAION elle-même avait déclaré qu’une entreprise avait fourni des ressources informatiques pendant la phase de démarrage, mais la Cour n’a pas évalué cela.

Exception au droit d’auteur pour les reproductions temporaires : non applicable ici

Sans surprise, la Cour a estimé que la reproduction de la photographie réalisée par LAION par téléchargement n’était pas couverte par l’exception pour les actes de reproduction temporaires (article 44a UrhG ; art. 5, paragraphe 1, de la directive InfoSoc. LAION avait fait valoir que l’image n’était pas stockées de manière permanente, mais n’ont été utilisées que brièvement pour l’analyse de la conformité de l’image de description et ont ensuite été immédiatement et automatiquement supprimées de manière irrévocable.

  • Pas de simple reproduction transitoire si la suppression est uniquement due à une programmation spécifique: La Cour a rejeté l’argument selon lequel la reproduction était de nature éphémère en s’appuyant sur la clarification de ce critère par la Cour de Justice de l’Union européenne (CJCE), qui exige notamment que, pour être admissible, le processus technologique doit être automatisé de telle manière que il supprime automatiquement la reproduction sans intervention humaine (affaire C-5/08para. 64). La Cour a estimé que la suppression de l’image téléchargée n’était pas « indépendante de l’utilisateur », mais le résultat d’une programmation délibérée du processus d’analyse par LAION. Par ailleurs, LAION n’a fourni aucune information sur la durée réelle du stockage.
  • Pas de simple reproduction fortuite si le téléchargement est une étape préparatoire à l’analyse: La CJCE définit une reproduction fortuite comme une reproduction qui n’existe pas indépendamment du processus technologique dont elle fait partie et n’a pas de finalité indépendante de ce processus (affaire C-360/13para. 43). La Cour n’a pas considéré le téléchargement de la photographie par LAION comme une reproduction fortuite car il s’agissait d’un processus d’approvisionnement activement contrôlé et non simplement d’une étape accessoire à l’analyse ultérieure.

La deuxième partie de cet article examinera la longue remarque incidente de la Cour sur l’exception commerciale TDM.