this post was submitted on 05 Jul 2023
27 points (100.0% liked)

DACH - jetzt auf feddit.org

8713 readers
1 users here now

Diese Community wird zum 01.07 auf read-only gestellt. Durch die anhäufenden IT-Probleme und der fehlende Support wechseln wir als Community auf www.feddit.org/c/dach - Ihr seid herzlich eingeladen auch dort weiter zu diskutieren!

Das Sammelbecken auf feddit für alle Deutschsprechenden aus Deutschland, Österreich, Schweiz, Liechtenstein, Luxemburg und die zwei Belgier. Außerdem natürlich alle anderen deutschprechenden Länderteile der Welt.

Für länderspezifische Themen könnt ihr euch in folgenden Communities austauschen:

Eine ausführliche Sidebar findet ihr hier: Infothread: Regeln, Feedback & sonstige Infos

Auch hier gelten die Serverregeln von https://feddit.de !

Banner: SirSamuelVimes

founded 1 year ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
[–] [email protected] 1 points 1 year ago* (last edited 1 year ago) (1 children)

Tjoa, also Bots schreiben, um deren Bots mit Müll zu füttern. Daraus wird dann eine neue Generation Virus und Antivirus geboren. yay.

Respektiert der KI Crawler dann überhaupt Robots.txt?

[–] [email protected] 3 points 1 year ago

Respektiert der KI Crawler dann überhaupt Robots.txt?

Letzter Absatz im Artikel:

An dem Absatz ist allerdings auch spannend, dass Google keine Ausnahme zu kennen scheint. Während man verhindern kann, dass Google Webseiten und Inhalte indexiert, sieht zumindest die Datenschutzerklärung das nicht für potenzielle KI-Trainingsdaten vor. Datenschutzrechtlich dürfte das schwierig sein – als würde es eine Einwilligung zu Googles Datenschutzerklärung geben, wenn man das Internet nutzt. Urheberrechtlich scheint das Vorgehen keine Schwierigkeiten zu machen. Es sind öffentlich zugängliche Daten, die zwar genutzt werden, aber nicht gespeichert.