Projekt Techrad Trends finden und überblicken für KMU – Teil 3

Ein Gastbeitrag von Marco Müller-ter Jung*

Welche urheber- und datenschutzrechtlichen Rahmenbedingungen sind an intelligentes und automatisiertes Technologiescouting zu stellen und bei der technischen Umsetzung sowie Geschäftsmodellentwicklung zu beachten? Diese Fragen beantwortet der dritte Teil zum Projekt Techrad.

Anbieter zum Thema

Ist die Generierung von Informationen aus verschiedenen Webquellen sowie die anschließende Analyse dieser Daten urheberrechtlich und datenschutzrechtlich zulässig?
Ist die Generierung von Informationen aus verschiedenen Webquellen sowie die anschließende Analyse dieser Daten urheberrechtlich und datenschutzrechtlich zulässig?
(Bild: gemeinfrei / Pixabay )

Das Forschungsprojekt Techrad hat zum Ziel, mit Hilfe eines KI-basierten Technologieradars autonom nach vorgegebenen Suchkriterien Informationen über Technologien zu sammeln und Nutzern bereitzustellen. Im ersten Teil dieser Serie wurde das autonome Technologie-Scouting als methodischer Ansatz vorgestellt. Im zweiten Teil dieser Serie wurden das Natural Language Processing (kurz: NLP) als ein Teilgebiet Künstlicher Intelligenz und deren technische Umsetzung im Technologieradar sowie das Zielbild einer personalisierten Auswertung über aktuell verfügbare Technologien und deren Reifegrad beschrieben. Im letzten Teil dieser Serie werden nun spezifische rechtliche Herausforderungen eines solchen Technologiescouting-Systems dargestellt.

Die zentrale Frage ist, ob und inwieweit die einzelnen Schritte der Generierung von Informationen aus verschiedenen Webquellen sowie die sich anschließende Analyse dieser Daten, um sie als Radarergebnisse in aufbereiteter Form Nutzern zugänglich zu machen, in urheberrechtlicher und datenschutzrechtlicher Hinsicht zulässig sind.

Technischer Ablauf der Informationsgewinnung

Für die Erstellung des Technologieradars werden relevante Daten gesammelt, indem sie mittels Webcrawling aus Texten auf Webseiten wie Patentdatenbanken, wissenschaftlichen Veröffentlichungen auf Portalen und Social-Media-Beiträge autonom recherchiert werden. Die so gesammelten Informationen werden zwischengespeichert und anschließend von KI-Algorithmen, etwa in Bezug auf die Technologieerkennung, den Reifegrad und die Anwendungsbereiche einer Technologie, ausgewertet. Hierfür werden die zu analysierenden Texte vorwiegend im flüchtigen Arbeitsspeicher verarbeitet. Eine dauerhafte Speicherung von Texten ist grundsätzlich für die Bereitstellung von Informationen im Technologieradar nicht erforderlich, wobei für das Training von KI-Algorithmen Texte für eine gewisse Zeit des Trainings vorgehalten werden müssen.

Urheberrechtliche Zulässigkeit

Rechtlich gilt es zunächst zu untersuchen, inwieweit ein Zugriff auf eine Webseite oder Plattform mit den von den Betreibern gestellten Nutzungsbedingungen sowie den Vorgaben in der robots.txt-Datei vereinbar ist. Eine Analyse der Nutzungsbedingungen und robots.txt-Dateien zahlreicher für ein Technologiescouting relevanter Webseiten oder Plattformen zeigt, dass die Betreiber das Webcrawling teilweise untersagen. Solche Untersagungen sind insbesondere im Rahmen des Urheberrechts von Bedeutung. Mit §§ 44a, 44b und 60d UrhG bestehen zwar Schrankenregelungen, die die Vervielfältigung von geschützten Werken zu Zwecken des Text- und Data Minings und des Aufbaus eines Technologieradars erlauben. Dieser grundsätzlichen Erlaubnis kann aber gemäß § 44b UrhG ein Nutzungsvorbehalt des Rechteinhabers entgegenstehen, sofern dieser in einer maschinenlesbaren Form, beispielsweise durch robots.txt-Dateien, erklärt wird. Entsprechende Geschäftsmodelle bedürfen daher stets einer sorgfältigen Analyse der technischen und operativen Prozesse. Der Betreiber, der Text- und Data-Mining-Anwendungen einsetzt, sollte ein Konzept entwickeln, mit dem erklärte Nutzungsvorbehalte der Betreiber der Webquellen erkannt und beachtet werden.

Zudem ist die Löschungspflicht des § 44b Abs. 2 S. 2 UrhG zu beachten: Zulässig hergestellte Vervielfältigungen können nicht ohne sachgerechte Gründe langfristig aufbewahrt werden. Deshalb bedarf das Vorhalten von Texten zu Zwecken des Trainings des KI-Modells einer genauen Prüfung. Im Rahmen von Forschungsprojekten ist allerdings zu beachten, dass Projektvorhaben die weitergehenden Privilegierungen zum Text und Data Mining des § 60d UrhG zugutekommen kann, während die Regelung des § 44b UrhG insbesondere für das Text- und Data Mining bei einem kommerziellen Betrieb von besonderer Bedeutung ist. Zudem bleibt abzuwarten, inwieweit die Nutzung künstlicher Intelligenz und die Verfügbarkeit von Daten als eine wesentliche Voraussetzung für das Trainieren von KI-Systemen durch die europäische und nationale Gesetzgebung auf Grundlage der europäischen Datenstrategie fortentwickelt wird.

Datenschutzrechtliche Zulässigkeit

Auch datenschutzrechtlich ist eine vertiefte rechtliche Bewertung für den Aufbau eines automatisierten, intelligenten Technologiescoutingsystems, das auf umfangreichen Text- und Datenanalysen basiert, unerlässlich. Denn oft werden durch das Webcrawling auch personenbezogene Daten verarbeitet, beispielsweise in Form von Namen der Autoren oder in Texten zitierten Wissenschaftlern. Diese Angaben können etwa für die Reifegradanalyse von Bedeutung sein. Vorbehaltlich einer vertieften Analyse der Datenverarbeitung im Einzelfall des konkreten Geschäftsmodells kommt grundsätzlich eine datenschutzrechtliche Rechtfertigung der diversen Verarbeitungsschritte über die Rechtsgrundlage des sogenannten überwiegenden berechtigten Interesses des Betreibers eines solchen Technologieradars in Betracht, Art. 6 Abs. 1 f) DSGVO. Ein wesentliches Argument dabei ist, dass der Schutz von öffentlich gemachten Informationen, die personenbezogene Daten beinhalten, hinter die wirtschaftlichen Interessen des Technologieradar-Betreibers zurücktreten dürfte. Prämisse hierfür ist selbstverständlich, dass personenbezogene Daten in den Texten nur kurzzeitig für die Informationsgewinnung und Befüllung des Technologieradars vorgehalten und analysiert werden und darüber hinaus keine weiteren Verarbeitungen und Speicherungen personenbezogener Daten zu anderen Zwecken erfolgen. Dabei muss beachtet werden, dass den Betreiber allerdings aus der DSGVO umfassende Informationspflichten treffen, die es zu erfüllen gilt. Hierfür bedarf es der Entwicklung praktikabler Lösungen für das jeweilige Geschäftsmodell, um die Einhaltung des Datenschutzrechts zu gewährleisten.

* Marco Müller-ter Jung ist Anwalt für Fachanwalt für Informationstechnologierecht und arbeitet bei der Deloitte Legal Rechtsanwaltsgesellschaft mbH.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:48313551)