3 上一篇    下一篇 4 放大 缩小 默认
□相关链接
Robots协议
  • 2013年02月25日  来源:齐鲁晚报
  • 【PDF版】
  又称爬虫协议,是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。“规则”中将搜索引擎抓取网站内容的范围做了约定,包括网站是否希望被搜索引擎抓取,哪些内容不允许被抓取,而网络爬虫可以据此自动抓取或者不抓取该网页内容。如果将网站视为酒店里的一个房间,robots.txt就是主人在房间门口悬挂的“请勿打扰”或“欢迎打扫”的提示牌。这个文件告诉来访的搜索引擎哪些房间可以进入和参观,哪些不对搜索引擎开放。

3 上一篇    下一篇 4 放大 缩小 默认
通信地址:中国 山东省 济南市泺源大街6号F15   邮编:250014   E-mail:wl@qlwb.com.cn
电话 新闻热线:96706   报刊发行:0531-85196329 85196361   报纸广告:0531-82963166 82963188 82963199
副刊青未了:0531-85193561   网站:0531-85193131   传真:0531-86993336 86991208
齐鲁晚报 版权所有(C)   鲁ICP备05004346号