
Perplexity、robots.txt無視とデータ窃盗で釈明
-
FromAppleInsider
はい、承知いたしました。以下の要約をご覧ください。
—
AI企業Perplexity、ウェブサイトのブロックを巧妙に回避しデータ収集を継続か
AI検索エンジンPerplexityが、ウェブサイトからのコンテンツ収集を目的としたブロック回避行為を2024年に開始し、その後もその手法を高度化させて継続していることが、新たな報告書によって明らかになりました。同社はこの行為を正当なものとして擁護していると報じられています。
この問題は、Appleが「Apple Intelligence」の学習データ収集のため、数年にわたり「Applebot」を使ってウェブをクロールさせていたことが発覚し、多くのウェブサイト運営者から強い反発を受け、そのボットをブロックする動きが広がった一件と類似しています。この出来事は、AI企業のデータ収集実態に関する興味深い発見をもたらしました。
しかし、Applebotの一件から1年が経った現在も、Perplexityはrobots.txtなどの標準的なウェブプロトコルを無視し、ウェブページからのデータ収集を強行していると指摘されています。サイバーセキュリティ企業Cloudflareの報告書によると、Perplexityはウェブ上の信頼関係を損なう複数の技術を用いて、大規模言語モデル(LLM)の学習用データにアクセスしているとのことです。同社が自社のデータ収集方針を正当化する中で、AI企業の倫理的なデータ利用を巡る議論はさらに深まることが予想されます。
—
2025-08-05

AIによる翻訳/要約をしています。正確な情報はオリジナルサイトにてご確認ください。
このサイトはアフィリエイト広告(Amazonアソシエイト含む)を掲載しています。