太平洋电脑网 08-23
百度百科限制谷歌必应等搜索引擎抓取 保护内容免被AI训练利用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】近日,百度百科已开始屏蔽包括谷歌、必应等在内的多数搜索引擎的抓取权限,此举旨在防止这些搜索引擎和其他爬虫未经授权抓取其内容,用于训练人工智能模型。

根据百度百科的 robots.txt 文件更新显示,目前只有百度搜索、搜狗搜索、中国搜索 ( Chinaso ) 、YYSpider 和宜搜搜索 ( EasouSpider ) 等少数搜索引擎被允许抓取其内容。

谷歌搜索、必应搜索、微软 MSN、UC 浏览器的 Yisouspider 以及其他非白名单爬虫均被明确禁止访问百度百科的数据。尽管 360 搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以 360 搜索和其他搜索引擎也都是被屏蔽的。

尽管百度百科采取了上述措施,但有业内人士指出,这些方法可能只能防止大部分合法的爬虫抓取,无法完全阻止那些通过特殊手段绕过限制的小型爬虫继续获取内容,用于 AI 训练。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

百度百科 搜索引擎 谷歌 必应 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论