Welche urheber- und datenschutzrechtlichen Rahmenbedingungen sind an intelligentes und automatisiertes Technologiescouting zu stellen und bei der technischen Umsetzung sowie Geschäftsmodellentwicklung zu beachten? Diese Fragen beantwortet der dritte Teil zum Projekt Techrad.
Ist die Generierung von Informationen aus verschiedenen Webquellen sowie die anschließende Analyse dieser Daten urheberrechtlich und datenschutzrechtlich zulässig?
Das Forschungsprojekt Techrad hat zum Ziel, mit Hilfe eines KI-basierten Technologieradars autonom nach vorgegebenen Suchkriterien Informationen über Technologien zu sammeln und Nutzern bereitzustellen. Im ersten Teil dieser Serie wurde das autonome Technologie-Scouting als methodischer Ansatz vorgestellt. Im zweiten Teil dieser Serie wurden das Natural Language Processing (kurz: NLP) als ein Teilgebiet Künstlicher Intelligenz und deren technische Umsetzung im Technologieradar sowie das Zielbild einer personalisierten Auswertung über aktuell verfügbare Technologien und deren Reifegrad beschrieben. Im letzten Teil dieser Serie werden nun spezifische rechtliche Herausforderungen eines solchen Technologiescouting-Systems dargestellt.
Die zentrale Frage ist, ob und inwieweit die einzelnen Schritte der Generierung von Informationen aus verschiedenen Webquellen sowie die sich anschließende Analyse dieser Daten, um sie als Radarergebnisse in aufbereiteter Form Nutzern zugänglich zu machen, in urheberrechtlicher und datenschutzrechtlicher Hinsicht zulässig sind.
Technischer Ablauf der Informationsgewinnung
Für die Erstellung des Technologieradars werden relevante Daten gesammelt, indem sie mittels Webcrawling aus Texten auf Webseiten wie Patentdatenbanken, wissenschaftlichen Veröffentlichungen auf Portalen und Social-Media-Beiträge autonom recherchiert werden. Die so gesammelten Informationen werden zwischengespeichert und anschließend von KI-Algorithmen, etwa in Bezug auf die Technologieerkennung, den Reifegrad und die Anwendungsbereiche einer Technologie, ausgewertet. Hierfür werden die zu analysierenden Texte vorwiegend im flüchtigen Arbeitsspeicher verarbeitet. Eine dauerhafte Speicherung von Texten ist grundsätzlich für die Bereitstellung von Informationen im Technologieradar nicht erforderlich, wobei für das Training von KI-Algorithmen Texte für eine gewisse Zeit des Trainings vorgehalten werden müssen.
Rechtlich gilt es zunächst zu untersuchen, inwieweit ein Zugriff auf eine Webseite oder Plattform mit den von den Betreibern gestellten Nutzungsbedingungen sowie den Vorgaben in der robots.txt-Datei vereinbar ist. Eine Analyse der Nutzungsbedingungen und robots.txt-Dateien zahlreicher für ein Technologiescouting relevanter Webseiten oder Plattformen zeigt, dass die Betreiber das Webcrawling teilweise untersagen. Solche Untersagungen sind insbesondere im Rahmen des Urheberrechts von Bedeutung. Mit §§ 44a, 44b und 60d UrhG bestehen zwar Schrankenregelungen, die die Vervielfältigung von geschützten Werken zu Zwecken des Text- und Data Minings und des Aufbaus eines Technologieradars erlauben. Dieser grundsätzlichen Erlaubnis kann aber gemäß § 44b UrhG ein Nutzungsvorbehalt des Rechteinhabers entgegenstehen, sofern dieser in einer maschinenlesbaren Form, beispielsweise durch robots.txt-Dateien, erklärt wird. Entsprechende Geschäftsmodelle bedürfen daher stets einer sorgfältigen Analyse der technischen und operativen Prozesse. Der Betreiber, der Text- und Data-Mining-Anwendungen einsetzt, sollte ein Konzept entwickeln, mit dem erklärte Nutzungsvorbehalte der Betreiber der Webquellen erkannt und beachtet werden.
Zudem ist die Löschungspflicht des § 44b Abs. 2 S. 2 UrhG zu beachten: Zulässig hergestellte Vervielfältigungen können nicht ohne sachgerechte Gründe langfristig aufbewahrt werden. Deshalb bedarf das Vorhalten von Texten zu Zwecken des Trainings des KI-Modells einer genauen Prüfung. Im Rahmen von Forschungsprojekten ist allerdings zu beachten, dass Projektvorhaben die weitergehenden Privilegierungen zum Text und Data Mining des § 60d UrhG zugutekommen kann, während die Regelung des § 44b UrhG insbesondere für das Text- und Data Mining bei einem kommerziellen Betrieb von besonderer Bedeutung ist. Zudem bleibt abzuwarten, inwieweit die Nutzung künstlicher Intelligenz und die Verfügbarkeit von Daten als eine wesentliche Voraussetzung für das Trainieren von KI-Systemen durch die europäische und nationale Gesetzgebung auf Grundlage der europäischen Datenstrategie fortentwickelt wird.
Auch datenschutzrechtlich ist eine vertiefte rechtliche Bewertung für den Aufbau eines automatisierten, intelligenten Technologiescoutingsystems, das auf umfangreichen Text- und Datenanalysen basiert, unerlässlich. Denn oft werden durch das Webcrawling auch personenbezogene Daten verarbeitet, beispielsweise in Form von Namen der Autoren oder in Texten zitierten Wissenschaftlern. Diese Angaben können etwa für die Reifegradanalyse von Bedeutung sein. Vorbehaltlich einer vertieften Analyse der Datenverarbeitung im Einzelfall des konkreten Geschäftsmodells kommt grundsätzlich eine datenschutzrechtliche Rechtfertigung der diversen Verarbeitungsschritte über die Rechtsgrundlage des sogenannten überwiegenden berechtigten Interesses des Betreibers eines solchen Technologieradars in Betracht, Art. 6 Abs. 1 f) DSGVO. Ein wesentliches Argument dabei ist, dass der Schutz von öffentlich gemachten Informationen, die personenbezogene Daten beinhalten, hinter die wirtschaftlichen Interessen des Technologieradar-Betreibers zurücktreten dürfte. Prämisse hierfür ist selbstverständlich, dass personenbezogene Daten in den Texten nur kurzzeitig für die Informationsgewinnung und Befüllung des Technologieradars vorgehalten und analysiert werden und darüber hinaus keine weiteren Verarbeitungen und Speicherungen personenbezogener Daten zu anderen Zwecken erfolgen. Dabei muss beachtet werden, dass den Betreiber allerdings aus der DSGVO umfassende Informationspflichten treffen, die es zu erfüllen gilt. Hierfür bedarf es der Entwicklung praktikabler Lösungen für das jeweilige Geschäftsmodell, um die Einhaltung des Datenschutzrechts zu gewährleisten.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
* Marco Müller-ter Jung ist Anwalt für Fachanwalt für Informationstechnologierecht und arbeitet bei der Deloitte Legal Rechtsanwaltsgesellschaft mbH.