多家主流新闻媒体开始屏蔽OpenAI网络爬虫GPTBot
多家主流新闻媒体开始禁止人工智能爬虫 GPTBot 获取其内容。The Verge最先报道《纽约时报》在其网站上屏蔽了该爬虫。《卫报》随后发现,CNN、路透社、芝加哥论坛报、ABC和澳大利亚社区媒体(ACM)等主流新闻网站也禁止了该爬虫。
CNN证实,它最近屏蔽了 GPTBot 的所有产品,但没有评论该品牌是否计划就其内容在人工智能系统中的使用采取进一步行动。路透社发言人表示,他们会定期审查其robots.txt以及网站条款和条件,因为知识产权是他们业务的命脉,他们必须保护自己内容的版权。
GPTBot 可能会扫描网页内容以帮助改进人工智能模型,如最近火爆的聊天机器人。不过,媒体担心自己的内容被AI系统滥用,特别是在训练过程中。
这场对峙源于人工智能系统通常需要大量信息来训练,以便它们能够用类似人类语言的方式回答用户的提问。但开发这些系统的公司通常不会透露其数据集中是否包含有版权保护的内容。因此,媒体担心自己的内容被滥用。
此外,Google最近向澳大利亚政府提出,除非新闻媒体明确选择退出,否则人工智能系统应该可以默认获取这些媒体的内容来训练模型。