3
上一篇
下一篇
4
放大
缩小
默认
□相关链接
Robots协议
2013年02月25日
来源:齐鲁晚报
【PDF版】
新浪微博
QQ空间
腾讯微博
人人网
更多
又称爬虫协议,是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。“规则”中将搜索引擎抓取网站内容的范围做了约定,包括网站是否希望被搜索引擎抓取,哪些内容不允许被抓取,而网络爬虫可以据此自动抓取或者不抓取该网页内容。如果将网站视为酒店里的一个房间,robots.txt就是主人在房间门口悬挂的“请勿打扰”或“欢迎打扫”的提示牌。这个文件告诉来访的搜索引擎哪些房间可以进入和参观,哪些不对搜索引擎开放。
3
上一篇
下一篇
4
放大
缩小
默认
通信地址:中国 山东省 济南市泺源大街6号F15 邮编:250014 E-mail:
wl@qlwb.com.cn
电话 新闻热线:96706 报刊发行:0531-85196329 85196361 报纸广告:0531-82963166 82963188 82963199
副刊青未了:0531-85193561 网站:0531-85193131 传真:0531-86993336 86991208
齐鲁晚报 版权所有(C)
鲁ICP备05004346号