Den Angaben Cloudflares zufolge setze Perplexity herkömmliche Crawler für die Trainings ein. Wenn sie auf einer Website auf ein Verbot stiessen, würden sich die Crawler tarnen. Zum Beispiel nutzten sie alternative IP-Adressen, die keinen Rückschluss auf Perplexity mehr zulassen würden. Anschliessend würden die Online-Inhalte trotz Verbot für das KI-Training genutzt. Nach den Kundenhinweisen sei dieses Vorgehen auf tausenden Domains und bei Millionen von Zugriffen beobachtet worden, so Cloudflare.

Auch mittels eigens aufgesetzten Test-Websites konnte die fragwürdige Crawler-Praxis nachvollzogen werden, erklärt der Technologieanbieter. Entsprechende Anfragen am KI-Prompt von Perplexity hätten Beweise geliefert, dass die Technologie mit den vermeintlich blockierten Website-Inhalten trainiert worden sei.

Die neuerlichen Vorwürfe reihen sich ein in eine Serie von Klagen gegen das Startup, wie ' Techrepublic ' schreibt. Bereits vor einem Jahr habe es wiederholt Hinweise darauf gegeben, dass die Perplexity-Crawler sich nicht an die Regeln hielten und Blockaden umgingen. AWS strengte daraufhin eine Prüfung an, ob das Unternehmen die Nutzungsbedingungen des Cloudanbieters missachtete. Nur wenige Monate später mahnte der britische Sender 'BBC' den KI-Anbieter ab, weil er Medienberichte unrechtmässig für das Training genutzt hatte.